中国のアリババ、新しいQwen 3 AIモデルでMetaを上回る
まとめ:
- 中国のテクノロジー大手アリババはオープンソースのQwen 3 AIモデルファミリーを立ち上げた。コレクションには 8 つの新しいモデルが含まれています。
- 主要モデルである Qwen3-235B-A22B MoE は、235 億個のパラメータでトレーニングされ、22 億個のパラメータがアクティブ化されました。
- アクティブ化されたパラメータが 3 億個しかない小型モデル Qwen30-3B-A3B MoE は、GPT-4o を大幅に上回ります。
中国のテクノロジー大手アリババは、Qwen 3 シリーズで 3 つの新しいオープンソース人工知能 (AI) モデルをリリースしました。新しい Qwen 3 モデルには、Qwen235-22B-A3B と Qwen30-3B-A3B の 235 つの MoE (Mixture of Experts) モデルが含まれます。 Qwen22-235B-A22B は、合計 XNUMX 億個のパラメータと XNUMX 億個のアクティブ化パラメータを備えた最大かつ最先端のモデルです。

Qwen3-30B-A3B は、合計 30 億のパラメータと 3 億のアクティブ化パラメータを持つ小型の MoE モデルです。さらに、Qwen 3 シリーズには、Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B、Qwen3-0.6B の 3 つの高密度モデルがあります。これらの新しい Alibaba Qwen XNUMX AI モデルは、人工知能分野における同社の地位をさらに強化します。
Qwen3のご紹介!
最新の大規模言語モデルである Qwen3 をリリースし、オープンウェイト化しました。これには、2B から 6B の範囲の 0.6 つの MoE モデルと 235 つの高密度モデルが含まれています。当社の主力モデルである Qwen3-235B-A22B は、コーディング、数学、一般のベンチマーク評価において競争力のある結果を達成しています。 pic.twitter.com/JWZkJeHWhC
— クウェン (@Alibaba_Qwen) 2025 年 4 月 28 日
すべての Qwen 3 モデルはハイブリッド思考モードをサポートしており、推論 AI モデルと従来の大規模言語モデル (LLM) の両方として機能します。 「思考モード」ではモデルは段階的に推論することができ、「非思考モード」ではモデルは迅速な応答を提供します。この機能により、さまざまなアプリケーションでモデルを使用する柔軟性が向上します。
加えて、 دع Qwen 3モデルは、世界中の119以上の言語と方言をサポートしています。これは、最も汎用性の高い多言語モデルの一つです。さらに、AlibabaはQwen 3モデルのモデルコンテキストプロトコル(MCP)のサポートを改善し、エージェント機能のさらなる拡張を可能にしました。この改善により、モデルはコンテキストをより深く理解し、よりスマートな意思決定を行うことができます。
パフォーマンスの面では、より大きなQwen3-235B-A22Bモデルは、 ディープシークR1 Grok 3ベータ版と ジェミニ 2.5 プロ および OpenAI o1。興味深いのは、アクティブパラメータがわずか 3 億個しかない小型の Qwen30-3B-A3B モデルが、DeepSeek V3 や OpenAI の GPT-4o モデルよりも優れていることです。これは、高いリソース効率と、より小さなモデル サイズで優れたパフォーマンスを実現できる能力を示しています。
Alibaba によれば、Qwen 3 モデルはプログラミング、数学、科学、および一般的なスキルで優れたパフォーマンスを発揮します。全体として、Qwen 3 は中国製の高度で高性能な AI モデルのファミリーを表しています。現在、DeepSeek R2の登場により、中国は西側のAI研究室と競争する上で有利な立場に立っています。この展開は、人工知能分野における中国の急速な進歩を反映している。
コメントは締め切りました。