美团开源虚拟人视频生成模型 LongCat-Video-Avatar:号称“不说话”时都像人
最新 12 月 18 日消息,据“龙猫 LongCat”公众号今晚的推文,美团 LongCat 团队正式发布并开源 SOTA 级虚拟人视频生成模型 ——LongCat-Video-Avatar。
该模型基于 LongCat-Video 基座打造,延续“一个模型支持多任务”的核心设计,原生支持 Audio-Text-to-Video、Audio-Text-Image-to-Video 及视频续写等核心功能,同时在底层架构上全面升级,实现动作拟真度、长视频稳定性与身份一致性三大维度的突破。

据官方介绍,该模型具备如下技术亮点。
“告别僵硬,迎接鲜活”:不仅能指挥嘴型,还能同步指挥眼神、表情和肢体动作,实现丰富饱满的情感表达。
连“不说话”的时候,都很像人:美团通过 Disentangled Unconditional Guidance(解耦无条件引导)训练方法,让模型明白了“静音”不等于“死机”。在说话的间歇,虚拟人也会如同人类一般自然地眨眼、调整坐姿、放松肩膀。
据介绍,LongCat-Video-Avatar 因此成为首个同时支持文字、图片、视频三种生成模式的“全能选手”,虚拟人从此有了“真正的生命力”。
在 HDTF、CelebV-HQ 、EMTD 和 EvalTalker 等权威公开数据集上的定量评测表明,LongCat-Video-Avatar 在多项核心指标上达到 SOTA 领先水平。

最新附项目地址:
GitHub: https://github.com/meituan-longcat/LongCat-Video
Hugging Face: https://huggingface.co/meituan-longcat/LongCat-Video-Avatar
Project: https://meigen-ai.github.io/LongCat-Video-Avatar/
《美团开源虚拟人视频生成模型 LongCat-Video-Avatar:号称“不说话”时都像人》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
为给孩子减负!教育部:普通高中严格控制考试次数、小学一二年级不进行纸笔考试
快科技12月18日消息,近日,教育部印发《关于进一步加强中小学日常考试管理的通知》,要求减少日常考试测试频次,提升日常考试质量,强化考试安全风险防范,减轻学生过重学业负担,促进学生全面... -
30岁中国健美冠军为何突然猝死 流感后坚持训练:医生紧急提醒
快科技12月18日消息,近日30岁的健美冠军王昆突然离世被挤上热搜,这也引来网友的热议。一名自称为王昆生前多年好友的回应:“王昆是在14日下午走的,死亡原因为心源性猝死。”据... -
吃不饱穿不暖能活更久!真不骗你
此前,中国工程院院士张运在接受采访时提到,吃八成饱、有饥饿感会启动长寿基因;穿不暖、稍微有些寒冷感,也会启动长寿基因。表面上看,这两句话似乎有些反常识——我们常用&ldquo... -
我国首个!川藏高原腹地特高压工程建成投运 输电距离近1900公里
快科技12月18日消息,央视新闻报道,我国首条深入川藏高原腹地的特高压工程——国家电网金上—湖北±800千伏特高压直流输电工程,近日正式投运。该工程总投资334亿元,起... -
储量惊人!我国发现亚洲最大的海底巨型金矿:累计探明金资源储量3900余吨
快科技12月18日消息,据山东省烟台市海洋发展和渔业局官方发布消息,莱州市发现了亚洲最大的海底金矿。官方信息中提到,莱州市三山岛北部海域新发现国内唯一、亚洲最大的海底巨型金矿,莱州市...

















