マヌスAIは中国のDeepSeekの次なる一手ではない:誇大宣伝の裏側を深く掘り下げる

わずか2週間でXNUMX万人以上のユーザーがアクセス待ちリストに登録しました。 汎用AIエージェント 中国のManus AIは、中国の「第2のDeepSeekの瞬間」として宣伝されている。これは、エージェントがクローズド ベータ版であり、招待を通じてのみアクセスできる場合です。

多くの人がManus AIを「ハック」と呼び、特に中国が引き続き提供しているOpenAIのディープリサーチエージェントへの適切な反応だと非難するなど、熱狂が巻き起こっている。 低コストでのAIイノベーション。しかし、Manus をめぐる誇大宣伝は誇張されており、その一因には AI インフルエンサーがソーシャル メディア プラットフォーム上で大げさな主張をしていることが挙げられます。 Manus AI は有望なスタートではあるものの、画期的なものではないと私は考える理由は次のとおりです。

なぜ Manus AI は画期的なものではないのでしょうか?

DeepSeek は、OpenAI の強化学習 (RL) アプローチをうまく模倣し、O シリーズ推論モデルに匹敵するパフォーマンスを実現しているため、画期的な技術であると考えられています。さらに、DeepSeek チームは、OpenAI のトレーニング コストと比較して限られた予算でこの偉業を達成しました。その後、DeepSeekは オープンソースのGRPOトレーニング方法これは、他の研究室が高度な推論モデルをトレーニングするのに役立っています。

これらはすべて新しいイノベーションであり、中国のDeepSeekチームは米国のGPU規制にもかかわらずこれを達成しました。一方、Manus の汎用 AI プログラムは、Anthropic の Claude 3.5 Sonnet モデルといくつかの改良された Qwen モデルを組み込んでおり、オープンソースの Browser Use プロジェクトに基づいています。

マヌスAIエージェントのホームページ

統合とツールの改善は利点ですが、真のブレークスルーは、エージェントのタスクに最適化された高度なモデルを開拓することにあります。 Anthropic の Claude 3.5 Sonnet は、エージェントタスクとプログラミングに最適な AI モデルの 3.7 つです。実際、Manus のチームは新しい統合モデルである Claude XNUMX Sonnet を社内でテストしており、「有望」だと考えています。

本質的に、有能な AI モデルを構築することが依然として最大の課題であり、近い将来もその状況は続くでしょう。しかし、Manus AI チームは、複数のツールと環境を連携させてタスクを完了したことで称賛に値します。前述のように、これはエージェントベースの未来に向けた有望なスタートです。

マヌスAIがつまずく

私たちは Manus AI にアクセスできませんが、一部の X ユーザーは早期アクセスを行っており、その体験を共有しています。生物医学科学者の Derya Onmutmaz 氏は、Manus と OpenAI の Deep Research エージェントを並行して実行した後、X でその結果を共有しました。

Deep Research は 15 分でタスクを完了できたが、Manus は 50 分かかってタスクを完了できなかった。また、マヌス氏はディープ・リサーチなどの情報源を引用していないとも述べた。

同様に、X ユーザーの teortaxesTex は Manus エージェントを試し、プロキシ タスクを実行するよりも大規模言語モデル (LLM) として情報を再現する方が優れていると述べました。もう一人のXユーザーであるTheXeophonも、Manusエージェントを使用した後の調査結果を共有しました。このエージェントは、ビデオゲームコンソール市場を検索した後、Nintendo Switchについてまったく言及していませんでした。

実際、Manus AI エージェントが 50 のタスクを自動的に実行する様子を示す話題のビデオは偽物であることが判明しました。マヌス島の主任科学者であるイチャオ・ピーク・ジ氏は次のように述べています。 「このビデオは間違いなくマヌスではない」 笑っている絵文字付き。このビデオは人工知能の能力と応用について幅広い議論を巻き起こし、専門家らはオンラインで流通する情報の信憑性を検証することの重要性を強調するに至った。

初期のつまずきにもかかわらず、Manus はまだクローズド ベータ版であり、放棄するのは時期尚早であることを忘れてはなりません。ただし、新しい AI 製品を試す際には、慎重かつ慎重に行うことも同様に重要です。マヌスは画期的な成果ではないかもしれないが、正しい方向への野心的なスタートだ。

AI モデルがエージェントタスクで改善し続けるにつれて、それに基づいて構築される新しい製品も同様に改善されます。 Manus AI チームは、エージェントが一般公開される前に大幅に改善されることをすでに発表しています。今のところ、期待に応えられるかどうかはまだ分からないが、注目すべき展開であることは間違いない。

コメントは締め切りました。