京东开源图像模型JoyAI-Image-Edit
创始人
2026-04-08 14:45:32
0

大象新闻·大象财富记者 李莉 张迪驰

据“京东黑板报”消息,近日,京东探索研究院正式开源自研的 JoyAI-Image-Edit 图像模型。大象新闻·大象财富记者注意到,这是业内首个把 “空间智能” 刻进骨子里的开源模型,让 AI能真正 “看懂” 空间、“编辑” 空间,从原来的平面修图,升级成了三维空间重塑,而且模型的推理代码全部开放,开发者能直接拿来做应用。

彻底解决传统模型空间逻辑混乱难题

据介绍,JoyAI-Image-Edit深度贴合真实世界空间规律,从空间位置关系、多视角一致性、相机感知到场景推理等维度全面建模,实现了相机坐标视角变换、物体空间位移旋转、几何结构精准控制等多项空间编辑技术突破,将空间认知能力深度融入文本与图像生成流程,搭建了完整的空间理解数据与任务体系。

该模型打破了AI“理解图像” 和 “生成图像” 的壁垒,让AI不仅能生成逼真的图像外观,更能精准理解图像背后的空间结构,在编辑过程中稳定保持主体形象与场景结构完整,多视角空间布局高度一致。不管是移动物体、换视角,还是调整物体间的关系,都能保持场景的几何规律,遮挡、光影也都自然合理,不会再出现变形、错乱的情况,彻底解决传统模型空间逻辑混乱的行业难题。

经实验验证,在物体移动精度、空间一致性等空间编辑核心指标上,JoyAI-Image-Edit达到世界一流水准。

三大空间编辑范式突破,融合15类通用编辑能力

JoyAI-Image-Edit 的核心跃升,在于其攻克了此前开源模型难以逾越的空间理解难题,具备三大辨识度极高的空间编辑能力:视角变换——用户可通过自然语言指定相机的偏航角、俯仰角及缩放程度,模型在保持场景几何一致性的前提下生成新视角图像;空间漫游——支持连续的视角移动,生成在空间中逻辑连贯的多视角图像序列,类似于在三维场景中"走动";物体空间关系操控——在保持场景整体结构稳定的前提下,对特定物体进行位移、缩放等空间变换,同时确保遮挡与光影关系自然合理。

在实现空间级突破的同时,JoyAI-Image-Edit 全面兼容15类通用编辑能力,深度覆盖内容创作的高频需求。无论是物体的替换、删除、添加,还是整体风格迁移、细节精修等操作,模型均实现了高性能覆盖。结合顶尖的空间编辑技术,模型在长文本精准渲染、多视角一致性生成等行业高难度任务中表现卓越,真正做到了全场景、无死角的高效创作。

凭借领先的空间理解与编辑能力,JoyAI-Image-Edit模型突破场景限制,可广泛应用于电商内容生产、创意设计制作、智能图像处理、3D模型重建、具身智能视觉感知等多元领域,大幅提升AI图像技术在复杂空间场景中的适配性与实用性。

尤其是在具身智能领域,空间理解能力是机器人“理解世界”的核心基础,而该模型的推出,也为相关技术研发提供了关键的底层能力。

相关内容

热门资讯

美AI搜索引擎公司转投AI代理... 财联社4月9日讯(编辑 赵昊)美国人工智能初创公司Perplexity在从搜索转向代理的过程中实现了...
内蒙古:到2028年,人工智能... 观点网讯:4月8日,内蒙古自治区人民政府印发《内蒙古自治区“人工智能+”行动实施方案(2026—20...
中国联通推出eSIM手机绑定号... IT之家 4 月 9 日消息,随着 eSIM 技术的普及,越来越多用户选择搭载 eSIM 功能的手机...
“毒液”走进现实?自贡企业“破... 聚光灯骤然亮起,光柱切开黑暗,精准落在展台中央:一团浓稠的黑色液体正蜷缩在那里。然后,它动了,缓慢铺...
科技早报 | 阿里新设集团技术... 阿里新设集团技术委员会,升级通义大模型事业部 4月8日,阿里巴巴集团CEO吴泳铭发布内部信,宣布A...
原创 狂... 作者:高恒(中国科技新闻学会科幻传播与未来产业专委会会员专家) 马云和雷军,第一次站在了同一张投资清...
天翼云申请路由路径确定方法专利... 国家知识产权局信息显示,天翼云科技有限公司申请一项名为“一种路由路径确定方法、装置、电子设备和存储介...
原创 原... 本来以为手机行业会一直进步,没想到这几年的手机行业,反而出现了很多退步,例如之前外观设计百花齐放,各...
95后小伙要把进入太空的成本“... 卢驭龙正在清点备件。 深圳先锋号发射前。 受访者供图 搞航天的卢驭龙,自带流量。在某社交媒体,...
英特尔加入马斯克芯片项目 来源:北京日报客户端 当地时间7日,英特尔在社交媒体上发布消息称,将加入马斯克此前宣布的大型芯片制造...