2026-01-14 16:08:09

美团开源LongCat-Video-Avatar：首个多模态虚拟人视频生成模型

摘要

12月18日，美团LongCat团队宣布正式推出并开源其最新的虚拟人视频生成模型LongCat-Video-Avatar。该模型基于LongCat-Video基座构建，延续

12月18日，美团LongCat团队宣布正式推出并开源其最新的虚拟人视频生成模型LongCat-Video-Avatar。该模型基于LongCat-Video基座构建，延续了“单模型多任务”的设计理念，原生支持从音频、文本到视频的生成，兼容图文输入驱动视频生成，并具备视频续写能力。在架构层面，新模型实现了全面优化，在动作自然度、长时生成稳定性以及人物身份一致性方面取得显著突破。

该模型在表现力上展现出高度拟人化特征，不仅实现口型与语音的精准同步，还能协同控制眼神、面部表情及肢体动作，呈现细腻的情感表达。即使在无语音输入的静默阶段，模型亦能模拟人类自然行为，如眨眼、微调坐姿或放松肩部动作，避免出现呆滞状态。这一效果得益于团队采用的Disentangled Unconditional Guidance（解耦无条件引导）训练策略，使模型理解静音不等于动作终止，从而提升整体生动性。

LongCat-Video-Avatar由此成为首个同时支持纯文本、图像和视频三种输入模式的综合性虚拟人生成模型，进一步推动虚拟形象向真实化、生命感方向发展。在HDTF、CelebV-HQ、EMTD和EvalTalker等多个公开权威数据集上的测试结果显示，该模型在多项关键指标上达到当前最优水平。

项目已开放源代码及相关资源，可通过指定平台获取。

时事资讯

2026-01-05 01:21:01

曝三星正研发新一代 Odyssey OLED G6 显示器：27 英寸 2K 面板，有望明年上市

2026-01-02 08:16:31

5000元显卡推荐

2025-12-28 07:32:10

实探毫末智行北京总部！已人去楼空，有员工抱着显示器离开

2026-01-09 11:56:06

璩静离职百度热搜，新公司已注册

2026-01-07 06:10:00

豆包更新语音对话功能：能讲粤语、四川话等4种方言

2026-01-04 10:37:20

大疆入局 3D打印行业“硝烟”再起

查看更多

科技趋势

时事资讯

单12V-2×6实现为RTX 5090供电750W！甚至都没敢跑分

单12V-2×6实现为RTX 5090供电750W！甚至都没敢跑分

我国新一代太空感知星座发布 156颗卫星组建太空星眼监测空间碎片

我国新一代太空感知星座发布 156颗卫星组建太空星眼监测空间碎片

NVIDIA GPU＋显存不再捆绑强卖！显卡价格生死难料

NVIDIA GPU＋显存不再捆绑强卖！显卡价格生死难料

为什么上班以后越来越胖 5个 “隐形元凶”是关键！

为什么上班以后越来越胖 5个 “隐形元凶”是关键！

飞行速度5-7马赫！四川一民企造出高超音速导弹仅70万元：官方回应基本型已量产

飞行速度5-7马赫！四川一民企造出高超音速导弹仅70万元：官方回应基本型已量产

年产20发！航宇火箭总装智造基地正式投产

年产20发！航宇火箭总装智造基地正式投产

空投利刃砸中必死！央视曝光改装无人机狩猎案

空投利刃砸中必死！央视曝光改装无人机狩猎案

日常维修不求人友福汽修工具套装46件套16.9元大促

日常维修不求人友福汽修工具套装46件套16.9元大促

4699元起华为Mate 80系列开售晨曦金版本成爆款已售罄缺货

4699元起华为Mate 80系列开售晨曦金版本成爆款已售罄缺货

豆包更新语音对话功能：能讲粤语、四川话等4种方言

豆包更新语音对话功能：能讲粤语、四川话等4种方言

查看更多

曝三星正研发新一代 Odyssey OLED G6 显示器：27 英寸 2K 面板，有望明年上市

曝三星正研发新一代 Odyssey OLED G6 显示器：27 英寸 2K 面板，有望明年上市

5000元显卡推荐

5000元显卡推荐

实探毫末智行北京总部！已人去楼空，有员工抱着显示器离开

实探毫末智行北京总部！已人去楼空，有员工抱着显示器离开

璩静离职百度热搜，新公司已注册

璩静离职百度热搜，新公司已注册

豆包更新语音对话功能：能讲粤语、四川话等4种方言

豆包更新语音对话功能：能讲粤语、四川话等4种方言

大疆入局 3D打印行业“硝烟”再起

大疆入局 3D打印行业“硝烟”再起

英伟达：我们为谷歌在 AI 方面的成功而高兴，但现阶段我们的芯片领先一代

英伟达：我们为谷歌在 AI 方面的成功而高兴，但现阶段我们的芯片领先一代

消息称谷歌重启 AI 眼镜：富士康代工、三星设计，最快明年四季度发布

消息称谷歌重启 AI 眼镜：富士康代工、三星设计，最快明年四季度发布

索尼光喻发布LYTIA 901并全面升级命名体系

索尼光喻发布LYTIA 901并全面升级命名体系

话费小额充值消失背后：效率与用户选择权的博弈

话费小额充值消失背后：效率与用户选择权的博弈

查看更多