阿里开源千问3向量模型,性能超越谷歌、OpenAI
创始人
2025-06-06 13:01:10
0

6月6日,阿里开源通义千问3全新的向量模型系列 Qwen3-Embedding(简称千问3向量模型)。该模型以千问3为底座,专门为文本表征、检索和排序等核心任务进行优化训练,性能较上一版本可提升40% ,在 MTEB 等权威专项榜单中超越了谷歌、OpenAI 、微软等公司的顶尖模型,揽获同类模型的 SOTA 最佳性能表现。

Qwen3-Embedding 系列模型

据了解,向量模型像是 AI 的“翻译器”,它可以将文本、图片等人类可认知的非结构化信息,映射(embedding)到机器更易理解的向量空间,再基于这些向量实现高效的信息分类、检索或排序。也正因此,向量模型对于提升 AI 的语义理解、信息检索、多模态融合等核心能力至关重要。基于千问3模型,通义团队通过对比训练、SFT 、模型融合等方法,打造出全新的千问3向量模型,包含文本嵌入模型 Qwen3-Embedding 以及文本排序模型 Qwen3-Reranker 。

千问3向量模型系列训练过程图

相较于上一个版本,千问3向量模型在文本检索、聚类、分类等核心任务上提升最高40% 以上的性能。在评估向量模型通用能力的 MTEB 多语言排行榜上,Qwen3-Embedding-8B 超越谷歌的 Gemini Embedding 、Open AI 的 text-embedding-3-large 及微软的 multilingual-e5-large-instruct 等顶尖模型,拿下同类模型的最佳性能 SOTA 。同时,得益于千问3的多语言能力,千问3向量模型系列率先支持超100种语言,并涵盖多种编程语言,可实现强大的多语言、跨语言及代码检索能力。

千问3向量模型在 MTEB 等基准测试中获SOTA最佳性能表现

据悉,为方便开发者,此次有9款千问3向量模型开源,涵盖0.6B 、4B 、8B 等不同尺寸及 GGUF 版本。开发者可从中找到最符合需求的模型,自由组合模块,还可自定义向量或指令,实现特定任务、语言和场景的深度优化。比如,开发者可在智能搜索、推荐系统中采用 Qwen3-Embedding 作文本向量化,或者在 RAG 实践中用 Qwen3-Reranker 提升最终结果的相关性和准确性,甚至与视觉理解模型结合,探索前沿的跨模态语义理解。

目前,千问3 Embedding 和 Reranker 模型均已在魔搭社区、 Hugging Face 和 GitHub 等平台上开源,开发者也可直接通过阿里云百炼使用 API 服务。

据了解,千问3大模型自4月29日开源以来,已揽获 Artificial Analysis 、LiveBench 、LiveCodeBench 、SuperClue 多个国内外权威榜单的全球开源冠军。

【来源:网易科技】

相关内容

热门资讯

牵住科技创新这个“牛鼻子” 牵住科技创新这个“牛鼻子”——新发展理念引领高质量发展一线观察之一 创新被置于新发展理念之首。科技创...
Sora天才辍学生归来!Ope... 新智元报道 编辑:定慧 元宇 【新智元导读】当年靠Sora惊艳世界的天才辍学生回来了,这次他要直奔...
“鼠”道难,难于上青天! 来源:市场资讯 (来源:看看新闻Knews) 今晚,中国空间站即将迎来四位特殊“航天员”——经过98...
畅通实验室到生产线的“高速路” 作为科技成果转化的关键环节,中试就像从实验室到生产线的“高速路”,主要解决工艺优化、设备适配、成本控...
陈忠伟:给退役电池“第二次生命... 在中国科学院大连化学物理研究所(以下简称“大连化物所”)能源催化转化全国重点实验室的实验区内,该所研...
原创 2... 雷达财经出品 文|丁禹 编|孟帅 以廉价航空闻名的春秋航空,正打破航空业乘务员招聘的年龄桎梏,向"空...
育碧新加坡升级音频工作室,携手... 育碧新加坡(Ubisoft Singapore),作为东南亚领先的AAA级游戏开发工作室,近日完成了...
小天互连即时通讯软件:以内外网... 在数字化办公普及的当下,企业面临着一个共性难题:若将即时通讯系统私有化部署在内网,虽能保障核心信息安...
全球最大、全球首台!中国海上风... 转自:央视财经 日前,我国自主研制的26兆瓦级海上风电机组在山东东营成功并网发电,全球首台16兆瓦漂...
民营银行竞渡:欲乘AI方舟先算... 来源:中国证券报 “行业对科技浪潮的态度已从‘是否拥抱’的选择题转变为‘如何拥抱’的必答题。AI的...