阿里开源千问3向量模型,性能超越谷歌、OpenAI
创始人
2025-06-06 13:01:10
0

6月6日,阿里开源通义千问3全新的向量模型系列 Qwen3-Embedding(简称千问3向量模型)。该模型以千问3为底座,专门为文本表征、检索和排序等核心任务进行优化训练,性能较上一版本可提升40% ,在 MTEB 等权威专项榜单中超越了谷歌、OpenAI 、微软等公司的顶尖模型,揽获同类模型的 SOTA 最佳性能表现。

Qwen3-Embedding 系列模型

据了解,向量模型像是 AI 的“翻译器”,它可以将文本、图片等人类可认知的非结构化信息,映射(embedding)到机器更易理解的向量空间,再基于这些向量实现高效的信息分类、检索或排序。也正因此,向量模型对于提升 AI 的语义理解、信息检索、多模态融合等核心能力至关重要。基于千问3模型,通义团队通过对比训练、SFT 、模型融合等方法,打造出全新的千问3向量模型,包含文本嵌入模型 Qwen3-Embedding 以及文本排序模型 Qwen3-Reranker 。

千问3向量模型系列训练过程图

相较于上一个版本,千问3向量模型在文本检索、聚类、分类等核心任务上提升最高40% 以上的性能。在评估向量模型通用能力的 MTEB 多语言排行榜上,Qwen3-Embedding-8B 超越谷歌的 Gemini Embedding 、Open AI 的 text-embedding-3-large 及微软的 multilingual-e5-large-instruct 等顶尖模型,拿下同类模型的最佳性能 SOTA 。同时,得益于千问3的多语言能力,千问3向量模型系列率先支持超100种语言,并涵盖多种编程语言,可实现强大的多语言、跨语言及代码检索能力。

千问3向量模型在 MTEB 等基准测试中获SOTA最佳性能表现

据悉,为方便开发者,此次有9款千问3向量模型开源,涵盖0.6B 、4B 、8B 等不同尺寸及 GGUF 版本。开发者可从中找到最符合需求的模型,自由组合模块,还可自定义向量或指令,实现特定任务、语言和场景的深度优化。比如,开发者可在智能搜索、推荐系统中采用 Qwen3-Embedding 作文本向量化,或者在 RAG 实践中用 Qwen3-Reranker 提升最终结果的相关性和准确性,甚至与视觉理解模型结合,探索前沿的跨模态语义理解。

目前,千问3 Embedding 和 Reranker 模型均已在魔搭社区、 Hugging Face 和 GitHub 等平台上开源,开发者也可直接通过阿里云百炼使用 API 服务。

据了解,千问3大模型自4月29日开源以来,已揽获 Artificial Analysis 、LiveBench 、LiveCodeBench 、SuperClue 多个国内外权威榜单的全球开源冠军。

【来源:网易科技】

相关内容

热门资讯

天气与气候科学的AI革命:真革... 当下,AI几乎无处不在——无论是你打字时被数字"助手"不断打断,还是想买一台不需要联网的冰箱却发现难...
靠谱大容量TF卡推荐:三星T7... 靠谱三星T7存储卡,助你畅享Switch游戏自由 任天堂Switch2游戏机虽然已经上市有段时间了...
飞测思凯浦申请缺陷检测方法专利... 国家知识产权局信息显示,飞测思凯浦(上海)半导体科技有限公司申请一项名为“一种缺陷检测方法、模型训练...
AIVA概念车OriginCo... 新浪科技讯 6月9日晚间消息,在赛豆科技AIVA品牌发布会上,赛豆科技正式官宣AIVA携手火山引擎,...
大厂争抢,这么快,文科生的春天... 今年以来,关于AI加速重构文科生就业市场的声音一直在舆论中间弥漫。 不久前,“AI大厂月薪3万疯抢文...
鸡西市举办2026年科技活动周... 近日,鸡西市2026年科技活动周暨科技成果转化月启动仪式在武警鸡西支队隆重举行。本次活动由鸡西市退役...
2026年6月汕头濠江区手机卡... 一、核心结论 结合2026年6月上旬汕头濠江区全域实地测速、场景信号实测、资费性价比综合对比,广东移...
微信要掀千问的桌 作者 | 叶二 编辑 | 魏晓 千问最大的对手来了。 6 月 8 日,微信正式面向开发者开放 AI ...
全国首枚!哈尔滨5名高中生自研... “5、4、3、2、1…… 发射!” 6月9日13时45分,青海冷湖,一枚由黑龙江省实验中学5名高二学...
中国家电网发起“反虚假测评”自... DoNews消息 近日,国家网信办、市场监管总局联合印发《网络测评活动规范》(以下简称《规范》),对...