無料でここまでできる!アリババ「Qwen」の新モデルがDeepSeekを圧倒、画像・動画も簡単生成!
アリババが発表した新型AI「Qwen 2.5 Max」が、業界の注目を集めている。従来の技術を超える性能と汎用性を誇り、GPT-4やDeepSeekのV3をしのぐと評価される同モデルの登場は、国内外の生成AI市場の競争激化をもたらしている。
DeepSeek超えをアピール
生成AI界に突如として登場したDeepSeek(ディープシーク)は、「スプートニクショック」級の衝撃に例えられているが、事態はこれにとどまらなかった。中国の電子商取引大手アリババ・グループが「Qwen(キューウェン)」の新型モデル「Qwen 2.5-Max」を発表し、注目を集めているからだ。アリババは、最新モデルがOpenAIの「GPT-4o」やDeepSeekのV3、メタの「Llama-3.1-405B」などの最先端技術と比較し、ほぼ全面的に優れているとアピールする。
Qwen 2.5-Maxは、MMLU(言語理解能力)、LiveCodeBench(プログラミング能力)、LiveBench(汎用的な能力)、GPQA-Diamond(質問応答能力)などの主要なベンチマークテストで高いスコアを記録し、特にMMLUとLiveCodeBenchでは新たな業界標準を設定したという。
Chatbot Arena(AIチャットボットの性能を比較するためのベンチマーク)の盲測ランキングでは、Qwen 2.5-Maxの獲得スコアが1,332点に達し、非推論クラスの中国モデルとして最高位を記録したとされる。Qwen 2.5-Maxの登場は、アリババグループが生成AI市場での競争力をさらに高めていることを証明する出来事となった。
Qwenが公開する資料から
中国版、国際版で展開
アリババが提供する生成AIサービスは「通義千問(トンイー・チエンウェン)」のブランドが知られてきた。これはアリババクラウド(Alibaba Cloud)の中国版サイトやアプリケーションで提供されているもので、一方の「Qwen」は国際市場向けに最適化されたバージョンだ。
「Q」は「Question(質問)」や「Query(問い合わせ)」を意味し、「wen」は中国語で「問う」や「尋ねる」を意味する。両者は同じ大規模言語モデルに基づいており、機能や性能に大きな違いはないが、「通義千問」が中国語圏特有の言語的特性や文化的背景に対応した応答を行うのに対し、「Qwen」はグローバルユーザー向けの多言語対応や地域固有の情報提供を特徴にしているとされる。
生成AIをめぐる都市間競争
この新型AIの発表は、国内外の競合に対するアリババの競争姿勢を示すかたちとなった。アリババの株価は一時6%上昇したと報じられており、AI資産の再評価が進む可能性が指摘されている。
なお、これまで中国国内の生成AIは、北京では百度(バイドゥ)が、深圳ではテンセントがそれぞれLLMを構築し、注目を集めてきた。しかし、Qwen(通義千問)を開発したアリババクラウドや、DeepSeekはそれぞれ杭州に拠点を置く。中国の人工知能の発展度で杭州の存在感が一段と大きくなってきた。
無料でWeb検索・画像・動画生成
Qwenは、アリババが開発した強力なAIツールだけに、コーディング支援や日常的な作業効率の向上が望める。中国国外ならGoogleアカウントによるログインが可能で、Web検索、画像生成、動画生成などの機能を会話メニューに設置されているボタンから手軽に利用できる。
圧巻なのはChatGPTと異なり、利用可能なモデル一覧に複数のAIモデルを組み合わせた選択肢が提示されることだ。それぞれのモデルの強みを活かした高度な情報処理が可能になる。たとえば、「Qwen2.5- + Qwen2.5-VL-72B-Instruct」を選択するなら、言語処理と視覚情報解析を組み合わせた環境になり、画像の説明や内容の要約を生成するのに役立つとされる。(編集:耕雲)
Qwenのトップ画面の構成は、基本的にChatGPTと大きな違いはない。しかし、チャット画面にすでに画像・動画作成ボタンが配置されており、この点において利便性の高さが感じられる。
しかも、利用は無料だ。ちなみにOpenAIのSoraを利用すれば、最大5秒の動画作成に1か月20米ドルの費用がかかり(最大50本生成可能)、一定のハードルがあるのが現状だ。
もちろん、無料だからと言って、「安かろう悪かろう」では意味がない。真に評価されるべきは、やはりその「品質」にほかならない。そこで、実際にQwenの画像・動画作成機能を試し、作品の出来栄えについて簡単なレビューをさせていただこう。
*
まず、違和感を覚えるかもしれないが、雪化粧をした桜島(鹿児島県)、または薩摩富士こと「開聞岳」を背景に、駅のプラットフォームに立つ鉄道員の姿を描くように指示を出した。高倉健主演の映画『鉄道員(ぽっぽや)』の名シーン(舞台はもちろん九州ではなく北海道だが)を意識してみたわけだが、左側に表示されたのがDALLE-E、右側がQwenによる作品だ。
|
|
DALLE‐Eで作成 | Qwenで作成 |
どちらも、日本らしい高めのプラットフォームを描くのに苦労したようで、納得できる仕上がりとは程遠い。とくに、Qwenで作成した画像は鉄道員のコートの丈がやや短く見える点も気になるところだ。もちろん、これをさらに修正し、手を加えれば、より理想的なものが仕上がる可能性もある。ただし、「初校ゲラ」として見たときのレベル感は、現時点ではこのようになる。
画像作成中にエラーが表示されることもある
次に、Qwenの動画作成機能を使って、富士山と茶畑を背景に新幹線の列車が走るシーンをイラスト風に作成してみた。(月20ドルの費用投入が必要なSoraとの比較は断念した。)5秒ほどの画像を作成するのに、ざっと10分ほどかかっただろうか。作業プロセスが「99%」と表示されたまま画面が固まったものの、リロードをかけると無事に作品が現れた。
さらに、春を感じさせる松本城の風景を試作してみたが、どうにも城の形状がコンパクトに収まり過ぎており、荘厳さに欠ける印象を受ける。城巡りが好きな人々からすると、これでは少し物足りないのではないだろうか。ツッコミどころ満載な結果となった。(編集:耕雲)
参考
阿里巴巴人工智能模型 Qwen 2.5 Max 战胜 Deepseek
DeepSeek后,阿里又出重磅
中国模型崛起!阿里Qwen2.5-Max数学及编程能力全球第一

