性能提升40% 阿里開源千問3向量模型

來源: 新華網2025-06-07 10:48:20
   6月6日,阿里開源通義千問3全新的向量模型系列Qwen3-Embedding(簡稱千問3向量模型)。該模型以千問3為底座,專門為文本表征、檢索和排序等核心任務進行優化訓練,性能較上一版本可提升40%,在MTEB等權威專項榜單中超越了谷歌、OpenAI、微軟等公司的頂尖模型。

Qwen3-Embedding 系列模型

  向量模型像是AI的“翻譯器”,它可以將文本、圖片等人類可認知的非結構化信息,映射到機器更易理解的向量空間,再基于這些向量實現高效的信息分類、檢索或排序。也正因此,向量模型對于提升AI的語義理解、信息檢索、多模態融合等核心能力至關重要。基于千問3模型,通義團隊通過對比訓練、SFT、模型融合等方法,打造出全新的千問3向量模型,包含文本嵌入模型 Qwen3-Embedding以及文本排序模型Qwen3-Reranker。

千問3向量模型系列訓練過程圖

  相較于上一個版本,千問3向量模型在文本檢索、聚類、分類等核心任務上提升最高40%以上的性能。同時,得益于千問3的多語言能力,千問3向量模型系列率先支持超100種語言,并涵蓋多種編程語言,可實現強大的多語言、跨語言及代碼檢索能力。

  為方便開發者,此次有9款千問3向量模型開源,涵蓋0.6B、4B、8B等不同尺寸及GGUF版本。開發者可從中找到最符合需求的模型,自由組合模塊,還可自定義向量或指令,實現特定任務、語言和場景的深度優化。比如,開發者可在智能搜索、推薦系統中采用Qwen3-Embedding作文本向量化,或者在RAG實踐中用Qwen3-Reranker提升最終結果的相關性和準確性,甚至與視覺理解模型結合,探索前沿的跨模態語義理解。

  目前,千問3 Embedding和Reranker模型均已在魔搭社區、Hugging Face和GitHub等平臺上開源,開發者也可直接通過阿里云百煉使用API服務。

關鍵詞:
責任編輯:hnnew003
我要評論查看所有評論
昵稱:

 遵守中華人民共和國有關法律、法規,遵守《互聯網新聞信息服務管理規定》。

 尊重網上道德,承擔一切因您的行為而直接或間接引起的法律責任。

 您在寧夏財經網發表的言論,我們有權在網站內轉載或引用。

相關新聞

最近更新

版權與免責聲明:

1 本網注明“來源:×××”(非寧夏財經網)的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,本網不承擔此類稿件侵權行為的連帶責任。

2 在本網的新聞頁面或BBS上進行跟帖或發表言論者,文責自負。

3 相關信息并未經過本網站證實,不對您構成任何投資建議,據此操作,風險自擔。

4 如涉及作品內容、版權等其它問題,請在30日內同本網聯系。

寧夏財經網廣告服務中心

廣告熱線: