中文字幕人妻少妇久久,婷婷91麻豆精品国产人妻在

智東西（公眾號：zhidxcom）
作者 | 李水青
編輯 | 心緣

智東西10月15日報道，今日，阿里通義千問團隊推出其最強視覺語言模型系列Qwen3-VL的4B與8B版本，兩個尺寸均提供Instruct與Thinking版本，在幾十項權(quán)威基準(zhǔn)測評中超越Gemini 2.5 Flash Lite、GPT-5 Nano等同級別頂尖模型。

僅4B！阿里千問最強視覺模型新開源，網(wǎng)友：我的16GB Mac有救了

▲阿里千問團隊公告截圖（圖源：X平臺）

這兩個新版本模型實現(xiàn)了以下關(guān)鍵目標(biāo):

1、資源門檻更低：尺寸縮減顯著降低VRAM的占用。現(xiàn)在，開發(fā)者可以在更廣泛的硬件設(shè)備上部署和運行模型。

2、核心能力不減配：在縮減尺寸的同時，其完整保留了Qwen3-VL的全部核心功能。

3、基準(zhǔn)性能優(yōu)秀：在STEM、VQA、OCR、視頻理解及Agent任務(wù)等多個權(quán)威基準(zhǔn)上，其表現(xiàn)不僅超越了Gemini 2.5 Flash Lite和GPT-5 Nano，在許多場景下甚至能與阿里半年前的旗艦?zāi)Ｐ?span style="color: #0f59a4;">Qwen2.5-VL-72B相媲美。

如下圖所示，在多模態(tài)性能方面，Qwen3-VL-8B Instruct在MIABench、OCRBench、SUNRGBD、ERQA、VideoMMMU、ScreenSpot等30項權(quán)威基準(zhǔn)測評中取得SOTA（行業(yè)最佳）成績，超越了Gemini 2.5 Flash Lite、GPT-5 Nano以及Qwen2.5-VL-72B等頂尖模型。

僅4B！阿里千問最強視覺模型新開源，網(wǎng)友：我的16GB Mac有救了

▲Qwen3-VL-8B Instruct與Qwen3-VL-4B Instruct基準(zhǔn)測評情況（圖源：Qwen）

Qwen3-VL-4B Instruct也展現(xiàn)出優(yōu)秀的多模態(tài)性能，以更少的參數(shù)量，在STEM、VQA、OCR、視頻理解及Agent任務(wù)等測評中，能與Gemini 2.5 Flash Lite、GPT-5 Nano對打。

在純文本表現(xiàn)上，如下圖所示，Qwen3-VL-8B Instruct和Qwen3-VL-4B Instruct也相比Qwen3-4B Instruct-2507和Qwen3-8B Non-Thinking有整體提高。

僅4B！阿里千問最強視覺模型新開源，網(wǎng)友：我的16GB Mac有救了

▲Qwen3-VL-8B Instruct與Qwen3-VL-4B Instruct基準(zhǔn)測評情況（圖源：Qwen）

在多模態(tài)性能方面，Qwen3-VL-8B Thinking取得了MathVision、MMStar、HallusionBench、MM-MT-Bench、CountBench等23項權(quán)威基準(zhǔn)測評的SOTA，超越Gemini 2.5 Flash Lite、GPT-5 Nano高版本以及其他同等級頂尖開源模型。Qwen3-VL-4B Thinking同樣表現(xiàn)出“以小敵大”的成績。

僅4B！阿里千問最強視覺模型新開源，網(wǎng)友：我的16GB Mac有救了

▲Qwen3-VL-8B Thinking與Qwen3-VL-4B Thinking基準(zhǔn)測評情況（圖源：Qwen）

在純文本表現(xiàn)上，Qwen3-VL-8B Thinking和Qwen3-VL-4B Thinking相比于Qwen3-4BThinking-2507和Qwen3-8B Thinking有整體提高。

僅4B！阿里千問最強視覺模型新開源，網(wǎng)友：我的16GB Mac有救了

▲Qwen3-VL-8B Thinking與Qwen3-VL-4B Thinking基準(zhǔn)測評情況（圖源：Qwen）

該模型一經(jīng)發(fā)布，就在外網(wǎng)引起了不少開發(fā)者關(guān)注。不少人對此表示一直在等這個，有人稱：“終于，我在16GB的Mac上可以用了?！币灿胁簧偃碎_始催更Qwen3-Max及其他更多版本模型了。

僅4B！阿里千問最強視覺模型新開源，網(wǎng)友：我的16GB Mac有救了

▲外網(wǎng)用戶對新版本Qwen3-VL的評論（圖源：X平臺）

自9月24日阿里開源Qwen3-VL系列以來，作為Qwen系列中最強的視覺語言模型，該模型在全球AI開源社區(qū)中快速收獲認(rèn)可。（《阿里又一大模型開源，手機電腦樣樣玩的溜，多項測試秒GPT-5》）

在9月底的Chatbot Arena子榜單Vision Arena中，Qwen3-VL位居第二，是視覺理解領(lǐng)域中的全球開源冠軍；同時，Qwen3-VL還斬獲純文本賽道（Text Arena）的開源第一（全球第8），成為首個攬獲純文本和視覺兩大領(lǐng)域同時開源第一的大模型。? 僅4B！阿里千問最強視覺模型新開源，網(wǎng)友：我的16GB Mac有救了

▲在Vision Arena中Qwen3-VL位居第二（圖源：Qwen）

并且，Qwen3-VL還在全球知名的大模型API三方聚合平臺OpenRouter圖像處理榜單上以48%的市場份額躍升至全球第一。

僅4B！阿里千問最強視覺模型新開源，網(wǎng)友：我的16GB Mac有救了

▲Qwen3-VL在OpenRouter圖像處理榜單上表現(xiàn)（圖源：OpenRouter）

近期，阿里還推出Qwen3-VL Cookbook（使用指南），涵蓋圖像思維、計算機使用Agent、多模態(tài)變成、3D定位、空間推理、視頻理解等多種多模態(tài)用例，助用戶高效上手和深度應(yīng)用。

模型地址：
https://modelscope.cn/collections/Qwen3-VL-5c7a94c8cb144b
體驗地址：
chat.qwen.ai (在模型列表選擇Qwen3-VL系列模型)
Cookbook地址：
https://github.com/QwenLM/Qwen3-VL/tree/main/cookbooks

來源：X平臺、Hugging Face、通義千問Qwen公眾號

亚洲精品一区二区三区老狼,在线国产中文字幕视频网,国产毛片特级Av片,欧美日韩亚洲精品成人,美女视频一直看一直爽,亚洲人妻av一区二区在线观看,天天碰天天日天天摸,亚洲一级黄色片在线观看,麻豆av入口在线观看

相關(guān)推薦