DeepSeek成GDC开幕式关键词,2025年或是智能体元年
创始人
2025-02-23 05:00:35
0

界面新闻记者 | 李如嘉

界面新闻编辑 | 文姝琪

2月21日-23日,2025GDC全球开发者先锋大会在上海徐汇举办。大会以“模塑全球 无限可能”为主题,围绕金融、医疗、教育智能制造等各类场景公司,AI开发工具、多模态大模型、企业级服务以及开源生态等多个领域的技术提供商汇聚一堂,探讨大模型产业化和技术前沿的最新方向。

界面新闻从大会获悉,2024年,上海市人工智能产业规模突破4000亿元,同比增长超过7%,累计完成60款生成式AI大模型备案。根据《关于人工智能“模塑申城”的实施方案》,到2025年底,上海要构筑起一个涵盖算力、语料、模型、应用等层面的世界级人工智能产业生态。

22日大会开幕式上,全球科学智能开发者社区、模速空间载体升级计划、上海市“模塑申城”开源创新生态建设行动宣布正式启动。

开幕式的嘉宾演讲及圆桌讨论中,近期横空出世的DeepSeek成了关键词,其为整个大模型行业带来的启发以及大模型行业的未来趋势同样成为了讨论的核心。

2024年,OpenAI将强化学习搜索的技术引进,推出了推理模型o1。香港科技大学校董会主席、美国国家工程院外籍院士沈向洋认为,在原来使用大数据、大算力进行预训练路径遭遇瓶颈的情况下,OpenAI给行业提供了新思路。

沈向洋表示,此前以OpenAI的GPT系列模型为代表,大模型都是在做预训练拓展,主要原理是预测下一个token,训练的是快思考的能力。而新的推理模型则是采用后训练、推理拓展的训练方式,使用强化学习算法优化,模型会先打草稿,反复试错找到正确路径后,总结过程和答案,训练的是模型慢思考的能力。

2025年1月,DeepSeek发布开源的推理模型R1,在强大的推理能力之外,还有高性价比的特性,其复现的训练成本仅为o1的4%,Grok-3的0.2%,推理成本仅为Grok-3的18%,o1-mini的3.7%。

“DeepSeek在有限算力下的普惠智能,是开源开放的胜利。”上海科学智能研究院院长、复旦大学浩清特聘教授漆远说,开源将有效加速新技术的渗透率。

根据杰文斯悖论,这样的高效低耗将加速新技术采用速度和广度,虽然每个token的推理成本降低,但是普及后有更多人使用,总量反而会上升。此外,开源开放加强了技术可信度。ChatGPT使用了2个月做到用户数破亿,DeepSeek则仅花了7天就打破这一纪录,不用大费周章引流、做营销,就成为人类历史上用户积累最快的App,某种意义上也做到了商业上的成功。

沈向洋提到,中国在开源软件开发中的作用正在持续扩大,参与国际开源社区的程度显著提升已经开始开源的受益者变为了贡献者他认为中国公司很快会推出其他推理模型。

受到DeepSeek的带动,阶跃星辰在2月18日开源了视频生成模型Step-Video-T2V,以及语音交互大模型Step-Audio。

阶跃星辰创始人、CEO姜大昕表示,开源以来,公司的产品收到了非常多的关注和好评,全球创作者使用阶跃星辰的模型创作了海量视频同时,越来越多的伙伴加入了阶跃星辰的开源生态,包括技术社区、创作社区、云厂商、芯片厂商等3月,阶跃星辰还将继续开源图生视频产品。

基础模型快速发展之外,行业对模型应用也在不断探索。2024年下半年,Agent(智能体)的概念越来越热,但行业里对如何定义Agent还没有一个标准答案。

很多人认为2025年会是Agent元年。”姜大昕说。他认为,Agent最重要的特性是可以自主帮人类完成复杂任务,自主包含自动和主动两部分。从分类上来说,Agent可以分为垂类应用和智能终端应用

他提到,Agent会在这个时间点上爆发是因为有两个关键条件被满足,一是多模态能力,二是强大的推理能力。这两者可以帮助智能体更好地感知、理解用户所处的物理世界,从而更好地理解和完成任务。

现在机器的思考能力仍然有限,只能进行几十秒到几分钟的思考。随着模型能力的强大,机器能完成的思考时间也会越来越长,可以解决的问题范围越来越广,行业离AGI通用人工智能)的目标也就越来越近姜大昕说。

开幕式之外,大会搭建了多个场景专区,并将举办多场讲坛。商汤科技、MiniMax、阶跃星辰等企业都参与主办了不同主题的分论坛。

在22日下午举办的大模型生产力分论坛上,商汤科技和合作伙伴共同探讨大模型技术在开发领域的影响,并在论坛上发布代码小浣熊2.0版本,以及面向开发者的一站式开源Agent应用开发框架LazyLLM。代码小浣熊2.0可以在一个任务单点做修改的同时,跨文件进行多个任务修改,并且可以执行更多的具体开发流程操作,提供更加全面的编程辅助能力。LazyLLM则以数据为核心,支持在应用开发过程中持续迭代数据,从而不断提升数据效果。

AI行业的发展离不开生态的合作和共建,众多生态伙伴帮我们一起在AI生产力工具上更好服务终端客户和企业用户。”商汤小浣熊负责人贾安亚表示。

相关内容

热门资讯

新春致辞 | 一文速览五大基础... 基础电信企业新春致辞 中国电信 中国电信集团有限公司 董事长、党组书记 柯瑞文: 春回岁聿,福启...
中国南极考察又有新发现!中层鱼... 来源:滚动播报 (来源:千龙网) 中国第42次南极考察又有新消息。目前,“雪龙”号在阿蒙森海的大洋作...
南京一企业研发省内领先性价比“... 城市消防水源“难找、不好用、难监测”,高层消防水压“看不见、测不准、报不出”,一直是城市消防安全管理...
路由器到底怎么摆,网速才更快?... 你家里的路由器是怎么摆放的呢? 有的人把路由器藏起来,有的人会直接放客厅,但很多人可能不知道,路由器...
江苏宏大特种钢机械厂申请带式微... 国家知识产权局信息显示,江苏宏大特种钢机械厂有限公司申请一项名为“带式微波烘干机”的专利,公开号CN...
“亦庄箭”发射“亦庄星” ,捷... 2月12日14时37分,在广东阳江近海海域,北京经济技术开发区(简称“北京经开区”,又称“北京亦庄”...
EnGenius推出BE360... IT之家 2 月 14 日消息,EnGenius 恩硕科技美国加州当地时间本月 12 日宣布推出面向...
洛轴:3万多种产品这样下线(新... 本报记者 王云杉 张文豪 河南洛阳,航空精密轴承国家重点实验室,洛轴集团技术中心副主任刘明辉俯身审视...
春节档大模型众生相:密集发布,... 一年前的春节前夜,DeepSeek-R1横空出世,引发全球人工智能行业的强烈反应。中国大模型的能力边...
AI智能体也有「蜘蛛感应」,防... 新智元报道 编辑:LRST 【新智元导读】不再依赖像「安检站」一样每步必停的外部插件,首创「内源感...