阿里开源千问3向量模型,性能超越谷歌、OpenAI
创始人
2025-06-06 13:01:10
0

6月6日,阿里开源通义千问3全新的向量模型系列 Qwen3-Embedding(简称千问3向量模型)。该模型以千问3为底座,专门为文本表征、检索和排序等核心任务进行优化训练,性能较上一版本可提升40% ,在 MTEB 等权威专项榜单中超越了谷歌、OpenAI 、微软等公司的顶尖模型,揽获同类模型的 SOTA 最佳性能表现。

Qwen3-Embedding 系列模型

据了解,向量模型像是 AI 的“翻译器”,它可以将文本、图片等人类可认知的非结构化信息,映射(embedding)到机器更易理解的向量空间,再基于这些向量实现高效的信息分类、检索或排序。也正因此,向量模型对于提升 AI 的语义理解、信息检索、多模态融合等核心能力至关重要。基于千问3模型,通义团队通过对比训练、SFT 、模型融合等方法,打造出全新的千问3向量模型,包含文本嵌入模型 Qwen3-Embedding 以及文本排序模型 Qwen3-Reranker 。

千问3向量模型系列训练过程图

相较于上一个版本,千问3向量模型在文本检索、聚类、分类等核心任务上提升最高40% 以上的性能。在评估向量模型通用能力的 MTEB 多语言排行榜上,Qwen3-Embedding-8B 超越谷歌的 Gemini Embedding 、Open AI 的 text-embedding-3-large 及微软的 multilingual-e5-large-instruct 等顶尖模型,拿下同类模型的最佳性能 SOTA 。同时,得益于千问3的多语言能力,千问3向量模型系列率先支持超100种语言,并涵盖多种编程语言,可实现强大的多语言、跨语言及代码检索能力。

千问3向量模型在 MTEB 等基准测试中获SOTA最佳性能表现

据悉,为方便开发者,此次有9款千问3向量模型开源,涵盖0.6B 、4B 、8B 等不同尺寸及 GGUF 版本。开发者可从中找到最符合需求的模型,自由组合模块,还可自定义向量或指令,实现特定任务、语言和场景的深度优化。比如,开发者可在智能搜索、推荐系统中采用 Qwen3-Embedding 作文本向量化,或者在 RAG 实践中用 Qwen3-Reranker 提升最终结果的相关性和准确性,甚至与视觉理解模型结合,探索前沿的跨模态语义理解。

目前,千问3 Embedding 和 Reranker 模型均已在魔搭社区、 Hugging Face 和 GitHub 等平台上开源,开发者也可直接通过阿里云百炼使用 API 服务。

据了解,千问3大模型自4月29日开源以来,已揽获 Artificial Analysis 、LiveBench 、LiveCodeBench 、SuperClue 多个国内外权威榜单的全球开源冠军。

【来源:网易科技】

相关内容

热门资讯

聚合创新力量,赋能科创高地——... 2025年,上海市总部企业发展促进会张江分会(以下简称“张江分会”)在上海市总部企业发展促进会的指导...
2026视频号去水印免费 AP... 2026视频号去水印免费工具推荐榜:微信小程序秒用超实用,干货满满! 前言:2026年去水印需求爆...
心脏能成为“充电宝”?救命神器... “以后再也不用怕 起搏器没电要开刀了!” 最近 中国科学院大学联合清华、北大、 阜外医院等顶尖团队的...
太空旅行要来了,上一次天难不难... 如果给你一张去太空的船票,你会选择去太空旅行吗? 近日,北京穿越者载人航天科技有限公司(以下简称“穿...
俞敏洪:随着人工智能的升级,中... 来源:新浪科技 新浪科技讯 1月24日上午消息,在2026崇礼论坛上,新东方创始人俞敏洪表示,“互联...
“雪龙”号在阿蒙森海开展大洋考... 北京时间1月24日,“雪龙”号大洋队队员丁伟康(左)和宋熙存在舯部甲板开展本次考察阿蒙森海区域首次温...
实现用意念驾驭轮椅 科技广货怎... 肢体障碍运动员使用脑机AI轮椅在赛场穿梭 文/羊城晚报记者 黎秋玲 图/受访者供图 广货...
交互数字CE申请用于帧内预测的... 国家知识产权局信息显示,交互数字CE专利控股有限公司申请一项名为“用于帧内预测的外推”的专利,公开号...
蚂蚁收购好大夫在线一周年:注册... 来源:新浪科技 新浪科技讯 1月24日上午消息,在2026大湾区医疗健康创新大会上,好大夫在线发布“...
重隼智能科技取得快速复位击发装... 国家知识产权局信息显示,重隼智能科技(浙江)有限公司取得一项名为“一种快速复位击发装置”的专利,授权...