不過光看千問團(tuán)隊(duì)的宣傳好像也感覺不出來到底有多厲害,不如咱們直接來給它上上強(qiáng)度。

熱點(diǎn)科技這里準(zhǔn)備了幾道公務(wù)員行測(cè)的圖形推理模擬題,來看看QVQ-Max到底能不能給出正確答案。

首先我們?cè)赒WEN CHAT平臺(tái)選擇這一模型,將從網(wǎng)上收集到的題目圖片上傳,直接詢問答案。不過需要注意的是,或許是由于該模型今天才上線,在上傳題目圖片時(shí)總是提示網(wǎng)絡(luò)錯(cuò)誤,稍后再試。大家可能需要耐心點(diǎn)多試幾次。

第一題如圖,QVQ-Max響應(yīng)很快,但是想的好像有點(diǎn)多,思考了足足3500個(gè)漢字才給出答案D選項(xiàng),但是回答錯(cuò)誤,正確答案是B。

72e59bee-903c-40b6-8a98-85ac9a91132f_image.pngSnipaste_2025-03-28_14-05-52.png

Snipaste_2025-03-28_14-02-29.png

一題好像并不能證明實(shí)力,咱們又上傳了新的一題,看看QVQ-Max能不能一雪前恥。不過這一題對(duì)于QVQ-Max來說好像有點(diǎn)困難,竟然思考了多達(dá)6000個(gè)漢字才給出答案,仍然是D選項(xiàng),仍然是錯(cuò)誤的,正確答案是B。

24e4918c-08b0-4c64-86e2-e72c6593fc95_image.png

Snipaste_2025-03-28_14-06-07.png

Snipaste_2025-03-28_14-02-14.png

最后一次,再來一題。好在這次結(jié)果還算好,QVQ-Max給出了正確的答案B選項(xiàng),但是思考時(shí)間實(shí)在太長,依然足足有6000個(gè)漢字,等待時(shí)間接近十分鐘,如果QVQ-Max去考試,恐怕沒做完題目就要收卷了。

Snipaste_2025-03-28_13-18-33.png

Snipaste_2025-03-28_14-06-51.png

看起來行測(cè)的圖形推理題目對(duì)于QVQ-Max來說有點(diǎn)超綱,本想試著上傳一段視頻,測(cè)測(cè)QVQ-Max的視頻能力,但是顯示一直上傳失敗,只得作罷。有興趣的朋友可以自行去測(cè)試一下QVQ-Max的其他能力噢。

根據(jù)Qwen團(tuán)隊(duì)的解釋,QVQ-Max目前只是第一版,還有很多提升空間。希望Qwen團(tuán)隊(duì)加把勁,讓QVQ-Max早日拿捏行測(cè)圖形推理。


點(diǎn)個(gè)贊531
分享到:

發(fā)表評(píng)論注冊(cè)|