腾讯开源的HunyuanVideo-Avatar上传一张图+一段音频,虚拟角色“活”过来
创始人
2025-06-04 11:20:58
0

今天早上,GitHub上突然冒出一个让AI圈炸锅的项目——腾讯开源的HunyuanVideo-Avatar

这是一个开源的视频生成工具,上传一张图+一段音频,就能让图中的人物、动物甚至虚拟角色“活”过来,开口说话、唱歌、演相声!

连爱因斯坦和奥黛丽·赫本都能被AI“复活”同台说相声,这类工具其实之前就有,那腾讯这次开源的HunyuanVideo-Avatar有什么魅力呢,一起来看看?

一、你的照片会“演戏”

HunyuanVideo-Avatar的核心逻辑就像个“数字人导演”,它能从一张静态图中读懂场景,再根据音频的情感让角色动起来。而这一切的秘密武器,藏在三个模块里:

1、告别AI生成的“网红脸”!

传统模型容易生成“千人一面”的角色,而腾讯用这个模块直接把你的照片“刻”进模型里。能精准保留原图细节,连衣服褶皱和背景光影都保持一致。

2、让AI听懂你的“情绪密码”!

普通语音驱动只能对口型,但这个能从音频里提取情感特征,再结合参考图生成细腻表情。

3、多人飙戏不串场!

看Demo,视频中两个角色的唇形、表情、手势完全独立,连互动时的眼神交流都自然得像真人演员。

二、创意可以成真

HunyuanVideo-Avatar可以在这些场景应用:

电商直播:上传商品图+促销文案,AI主播24小时在线带货,还能根据“限时秒杀”的台词做出夸张表情,做有血有肉的主播,刺激用户下单。

音乐平台:QQ音乐用这个模型让王力宏的AI分身实时“唱”新歌,酷狗的长音频绘本里虚拟人用童声讲故事,全民K歌甚至能让你上传自拍生成专属MV。

影视创作:导演只需画一张场景草图+旁白脚本,就能生成分镜动画。

三、什么配置能跑?

目前官方测试显示,至少要RTX 3090,才可流畅生成720p视频,而A100显卡能输出电影级画质。

相关内容

热门资讯

物理学陷入停滞——进步主义神话... 当今的物理学家需要抛弃那个极具吸引力的神话——他们正在揭示我们宇宙的隐藏现实。 浏览物理学科普书籍...
从“数字化”到“数智化”(观象... 从“数字化”到“数智化”,一字之变,体现出我国牢牢把握人工智能机遇,体系化推进人工智能产业创新和赋能...
10万次Claude真实对话洞... IT之家 11 月 26 日消息,Anthropic 昨日(11 月 25 日)发布研究报告,通过分...
AI技术应用越广泛,越要明确边... 发展科技的初心和落点都是服务于人,服务于国家和社会。让安全和便捷成为AI技术应用的一体两面,成为技术...
【多彩新论】警惕碎片化传播的负... 注意力不集中,看书听讲说话容易走神,刷手机却停不下来……数字时代的碎片化传播,已成为我们获取资讯的主...
原创 1... 神舟二十二飞船成功发射,代号“天宫应急1号”,并且也圆满完成了中国空间站任务对接,整个任务全面成功了...
工信部:启动为期两年的卫星物联... C114讯 11月26日消息(颜翊)昨日,工业和信息化部正式印发《关于组织开展卫星物联网业务商用试验...
华为Mate80全系降价背后 华为需要通过更亲民的定价,来从iPhone手上抢更多的市场份额。 文|游勇 编|石兆 作为华为旗下最...
亚洲第一!我国自主研制,海试成... ◎ 科技日报记者 都芃 25日,记者从中交天津航道局有限公司获悉,当天下午,新一代超大型耙吸挖泥船“...
一加总裁:第五代骁龙8由一加高... 【CNMO科技消息】11月26日,一加中国区总裁李杰在社交平台透露,已受邀出席当天下午举行的高通“第...