マヌスAIは中国のDeepSeekの次なる一手ではない：誇大宣伝の裏側を深く掘り下げる

わずか2週間でXNUMX万人以上のユーザーがアクセス待ちリストに登録しました。汎用AIエージェント中国のManus AIは、中国の「第2のDeepSeekの瞬間」として宣伝されている。これは、エージェントがクローズドベータ版であり、招待を通じてのみアクセスできる場合です。

多くの人がManus AIを「ハック」と呼び、特に中国が引き続き提供しているOpenAIのディープリサーチエージェントへの適切な反応だと非難するなど、熱狂が巻き起こっている。 低コストでのAIイノベーション。しかし、Manus をめぐる誇大宣伝は誇張されており、その一因には AI インフルエンサーがソーシャルメディアプラットフォーム上で大げさな主張をしていることが挙げられます。 Manus AI は有望なスタートではあるものの、画期的なものではないと私は考える理由は次のとおりです。

なぜ Manus AI は画期的なものではないのでしょうか?

DeepSeek は、OpenAI の強化学習 (RL) アプローチをうまく模倣し、O シリーズ推論モデルに匹敵するパフォーマンスを実現しているため、画期的な技術であると考えられています。さらに、DeepSeek チームは、OpenAI のトレーニングコストと比較して限られた予算でこの偉業を達成しました。その後、DeepSeekは オープンソースのGRPOトレーニング方法これは、他の研究室が高度な推論モデルをトレーニングするのに役立っています。

これらはすべて新しいイノベーションであり、中国のDeepSeekチームは米国のGPU規制にもかかわらずこれを達成しました。一方、Manus の汎用 AI プログラムは、Anthropic の Claude 3.5 Sonnet モデルといくつかの改良された Qwen モデルを組み込んでおり、オープンソースの Browser Use プロジェクトに基づいています。

統合とツールの改善は利点ですが、真のブレークスルーは、エージェントのタスクに最適化された高度なモデルを開拓することにあります。 Anthropic の Claude 3.5 Sonnet は、エージェントタスクとプログラミングに最適な AI モデルの 3.7 つです。実際、Manus のチームは新しい統合モデルである Claude XNUMX Sonnet を社内でテストしており、「有望」だと考えています。

本質的に、有能な AI モデルを構築することが依然として最大の課題であり、近い将来もその状況は続くでしょう。しかし、Manus AI チームは、複数のツールと環境を連携させてタスクを完了したことで称賛に値します。前述のように、これはエージェントベースの未来に向けた有望なスタートです。

マヌスAIがつまずく

私たちは Manus AI にアクセスできませんが、一部の X ユーザーは早期アクセスを行っており、その体験を共有しています。生物医学科学者の Derya Onmutmaz 氏は、Manus と OpenAI の Deep Research エージェントを並行して実行した後、X でその結果を共有しました。

Deep Research は 15 分でタスクを完了できたが、Manus は 50 分かかってタスクを完了できなかった。また、マヌス氏はディープ・リサーチなどの情報源を引用していないとも述べた。

Deep Researchは15分以内に終了しました。残念ながら、Manus AI は 50 分後にステップ 18/20 で失敗しました。 😑 パフォーマンスはかなり良好でした。Manus の出力を見ていましたが、優れているように見えました。ただし、同じプロンプトを XNUMX 回目に実行すると時間がかかりすぎるため、少しイライラします。 https://t.co/bGtmOI65CP

— デリヤ・ウヌトマズ医学博士 (@DeryaTR_) 2025 年 3 月 8 日

同様に、X ユーザーの teortaxesTex は Manus エージェントを試し、プロキシタスクを実行するよりも大規模言語モデル (LLM) として情報を再現する方が優れていると述べました。もう一人のXユーザーであるTheXeophonも、Manusエージェントを使用した後の調査結果を共有しました。このエージェントは、ビデオゲームコンソール市場を検索した後、Nintendo Switchについてまったく言及していませんでした。

ネット上に無数のレポートがある世界最大級の企業の一つであっても、Manus は Nintendo Switch を完全に見逃しており、間違いを見つけるのは容易です。
数字がどこから得られたかは確かだが、レポートにも参照先がない。 https://t.co/kdLDoab1by pic.twitter.com/wxmTRr3TBW

— ゼオフォン（@TheXeophon） 2025 年 3 月 9 日

実際、Manus AI エージェントが 50 のタスクを自動的に実行する様子を示す話題のビデオは偽物であることが判明しました。マヌス島の主任科学者であるイチャオ・ピーク・ジ氏は次のように述べています。 「このビデオは間違いなくマヌスではない」 笑っている絵文字付き。このビデオは人工知能の能力と応用について幅広い議論を巻き起こし、専門家らはオンラインで流通する情報の信憑性を検証することの重要性を強調するに至った。

Manus AIの共同創設者が登場！マヌス島にご興味をお持ちいただきありがとうございます @heyBarsee、しかしこのビデオは間違いなくマヌスではありません🤣。私たちの公式アカウントはマナスAI Manus は、スマートフォン用の VNC ではなく、OpenAI Operator/DeepResearch のような Web ベースの AI エージェントです。

— イチャオ・ピーク・ジ (@peakji) 2025 年 3 月 8 日

初期のつまずきにもかかわらず、Manus はまだクローズドベータ版であり、放棄するのは時期尚早であることを忘れてはなりません。ただし、新しい AI 製品を試す際には、慎重かつ慎重に行うことも同様に重要です。マヌスは画期的な成果ではないかもしれないが、正しい方向への野心的なスタートだ。

AI モデルがエージェントタスクで改善し続けるにつれて、それに基づいて構築される新しい製品も同様に改善されます。 Manus AI チームは、エージェントが一般公開される前に大幅に改善されることをすでに発表しています。今のところ、期待に応えられるかどうかはまだ分からないが、注目すべき展開であることは間違いない。

ディープシークマヌスAI