Stable Diffusion 人物

来自MSN17 天

品玩1月6日讯，据 AI Base 报道，字节跳动近日开源了一项名为 LatentSync 的创新技术，该技术是一种基于音频条件的潜在扩散模型的端到端唇同步框架。这项技术无需任何中间运动表示，即可实现视频中人物唇部动作与音频的精准同步。与以往基于像素空间扩散或两阶段生成的唇同步方法不同，LatentSync 直接利用了 Stable Diffusion 的强大功能，能更有效地建模复杂的视听关联。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

今日热点