模型簡介
Qwen3 是 Qwen 係列最新一代的大語言模型,提供了一係列密集(Dense)和混合專家(MOE)模型。基於廣泛的訓練,Qwen3 在推理、指令跟隨、Agent 能力和多語言支持方麵取得了突破性的進展,具有以下關鍵特性:
獨特支持在思考模式(用於複雜邏輯推理、數學和編碼)和 非思考模式(用於高效通用對話)之間無縫切換,確保在各種場景下的最佳性能。
顯著增強的推理能力,在數學、代碼生成和常識邏輯推理方麵超越了之前的 QwQ (在思考模式下)和 Qwen2.5 指令模型(在非思考模式下)。
卓越的人類偏好對齊,在創意寫作、角色扮演、多輪對話和指令跟隨方麵表現出色,提供更自然、更吸引人和更具沉浸感的對話體驗。
擅長 Agent 能力,可以在思考和非思考模式下精確集成外部工具,在複雜的基於代理的任務中在開源模型中表現領先。
支持 100 多種語言和方言,具有強大的多語言理解、推理、指令跟隨和生成能力。
PAI Model Gallery 簡介
Model Gallery 是阿裏雲星空人工智能平台 PAI 的產品組件,它集成了國內外 AI 開源社區中優質的預訓練模型,涵蓋了 LLM、AIGC、CV、NLP 等各個領域。通過 PAI 對這些模型的適配,用戶可以以零代碼方式實現從訓練到部署再到推理的全過程,簡化了模型的開發流程,為開發者和企業用戶帶來了更快、更高效、更便捷的 AI 開發和應用體驗。
PAI Model Gallery 訪問地址:http://pai.console.aliyun.com/#/quick-start/models
阿裏雲 PAI Model Gallery 已同步接入Qwen3本次開源的所有模型,提供企業級部署方案。
? 零代碼一鍵部署
? 自動適配雲資源
? 部署後開箱即用API
? 全流程運維托管
? 企業級安全 數據不出域

一鍵部署 Qwen3 方案
?? 立即體驗 ??
下麵以 Qwen3-8B 模型部署為例(推理成本較低,可用於快速驗證)。
在 Model Gallery 模型廣場找到 Qwen3-8B 係列模型,或通過鏈接直達該模型:http://pai.console.aliyun.com/?regionId=cn-beijing#/quick-start/models/Qwen3-8B/intro

在模型詳情頁右上角點擊「部署」,已支持SGLang、vLLM高性能部署框架。在選擇計算資源後,即可一鍵完成模型的雲上部署。

部署成功後,在服務頁麵可以點擊“查看調用信息”獲取調用的 Endpoint 和 Token,想了解服務調用方式可以點擊預訓練模型鏈接,返回模型介紹頁查看調用方式說明。

使用推理服務。您可以在 PAI-EAS 推理服務平台上在線調試已部署好的 Qwen3 模型服務,從圖中可以看出模型回複具備較好的思維鏈能力。

下表提供了部署所需的最低配置,以及使用不同機型部署時在不同推理框架上支持的最大 Token 數。

更多模型支持
除 Qwen3 全係列模型外,PAI-Model Gallery 持續提供開源社區熱門模型快速部署、訓練、評測實踐。
推理性能提升,相同時延約束下,吞吐能提升492%;相同吞吐情況下, 首token時延直降86%,token間時延直降69%。
PAI Model Gallery 支持雲上一鍵部署 DeepSeek-V3、DeepSeek-R1 係列模型
雲上一鍵部署通義千問 QwQ-32B 模型,阿裏雲 PAI 最佳實踐
聯係星空
歡迎各位小夥伴持續關注使用 PAI-Model Gallery,平台會不斷上線 SOTA 模型,如果您有任何模型需求,也可以聯係星空。您可通過釘釘掃描下方二維碼(或搜索釘釘群號79680024618),加入PAI-Model Gallery用戶交流群。
星空人工智能美女福利导航網 倡導尊重與保護知識產權。如發現本站文章存在版權等問題,煩請30天內提供版權疑問、身份證明、版權證明、聯係方式等發郵件至1851688011@qq.com美女直播全婐APP免费下载將及時溝通與處理。!:首頁 > 供應鏈 » PAI Model Gallery 支持雲上一鍵部署 Qwen3 全尺寸模型