腾讯开源的HunyuanVideo-Avatar上传一张图+一段音频,虚拟角色“活”过来
创始人
2025-06-04 11:20:58
0

今天早上,GitHub上突然冒出一个让AI圈炸锅的项目——腾讯开源的HunyuanVideo-Avatar

这是一个开源的视频生成工具,上传一张图+一段音频,就能让图中的人物、动物甚至虚拟角色“活”过来,开口说话、唱歌、演相声!

连爱因斯坦和奥黛丽·赫本都能被AI“复活”同台说相声,这类工具其实之前就有,那腾讯这次开源的HunyuanVideo-Avatar有什么魅力呢,一起来看看?

一、你的照片会“演戏”

HunyuanVideo-Avatar的核心逻辑就像个“数字人导演”,它能从一张静态图中读懂场景,再根据音频的情感让角色动起来。而这一切的秘密武器,藏在三个模块里:

1、告别AI生成的“网红脸”!

传统模型容易生成“千人一面”的角色,而腾讯用这个模块直接把你的照片“刻”进模型里。能精准保留原图细节,连衣服褶皱和背景光影都保持一致。

2、让AI听懂你的“情绪密码”!

普通语音驱动只能对口型,但这个能从音频里提取情感特征,再结合参考图生成细腻表情。

3、多人飙戏不串场!

看Demo,视频中两个角色的唇形、表情、手势完全独立,连互动时的眼神交流都自然得像真人演员。

二、创意可以成真

HunyuanVideo-Avatar可以在这些场景应用:

电商直播:上传商品图+促销文案,AI主播24小时在线带货,还能根据“限时秒杀”的台词做出夸张表情,做有血有肉的主播,刺激用户下单。

音乐平台:QQ音乐用这个模型让王力宏的AI分身实时“唱”新歌,酷狗的长音频绘本里虚拟人用童声讲故事,全民K歌甚至能让你上传自拍生成专属MV。

影视创作:导演只需画一张场景草图+旁白脚本,就能生成分镜动画。

三、什么配置能跑?

目前官方测试显示,至少要RTX 3090,才可流畅生成720p视频,而A100显卡能输出电影级画质。

相关内容

热门资讯

【深度】从井下“单点”到井上“... 《晋中日报》2025年6月5日刊发,原标题 : 从井下“单点”到井上“智联” ——我市全面推进煤矿智...
货拉拉举办算法研讨会,正式成立... 5月29日,货拉拉在北京召开了主题为“算法向善,护航权益”的互联网货运行业算法研讨会,与各级指导单位...
圆筒等静压模具,圆管圆环冷等静... 圆筒等静压模具作为粉末冶金领域的核心工装,其结构设计与制造精度直接影响成型件的尺寸稳定性和力学性能。...
2025年面向工业互联网的算力... 工业互联网发展已十年,形成以网络、平台和安全为核心的技术体系,进入技术应用部署沉淀期。算力网络作为网...
晚报 | 6月6日主题前瞻 明日主题前瞻 1、商业航天 |据上证报,Globalstar公司扩大其第二代“直连设备”(D2D)卫...
华为申请通信方法、装置及系统专... 金融界2025年6月4日消息,国家知识产权局信息显示,华为技术有限公司申请一项名为“通信方法、装置及...
明日主题前瞻全球外骨骼机器人市... 【今日导读】 全球外骨骼机器人市场正进入高速增长期 国家能源局组织开展新型电力系统建设第一...
​清扫车自己上班了!杭州这一路... 潮新闻客户端 记者 梁亮 通讯员 桑亚美 “城市清扫也用上无人驾驶车了?” 这几天,在杭州市上城区海...
企业用电“明细账”助力降本增效 新华社天津6月5日电(记者毛振华、宋瑞)记者日前从总部位于天津的国家电网有限公司客户服务中心获悉,经...
国家网络安全通报中心通报一批恶... 央视网消息:中国国家网络与信息安全信息通报中心通过支撑单位发现一批境外恶意网址和恶意IP,境外黑客组...