1週間、毎日1つのチャットボットを使ってみた:他の誰よりも優れたスマートアシスタントはこれだ

この実験は、あらゆる AI アシスタントの真の価値を証明しました。

私は多くの記事を書いています 人工知能アシスタント機能を比較し、最新のアップデートを分析し、テストしました。 テキストプロンプト 最善のものを決定する。

しかし、どれが本当に自分にとって効果的で生産性を高めるのかを判断するには、別のものに切り替える誘惑に負けずに、それぞれを排他的に使用する必要がありました。主要なチャットボットのロゴが入った携帯電話これまでの記事をご覧になっている方は、私が「テキストプロンプトクリーニング」という手法をどれほど気に入っているかご存知でしょう。これは、あるチャットボットを使ってその応答を別のチャットボットに入力することで、結果を改善する手法です。しかし今回は違います。この実験では、テキストプロンプトクリーニングは禁止されていたのです。

私は 4 週間にわたって、ChatGPT (GPT-4o)、Claude 2.5 Sonnet、Gemini XNUMX Pro、Perplexity、DeepSeek を日常のアシスタントとして交互に使用しながら、大規模な実験を実施しました。

唯一の条件は、昼間に切り替えずに、各チャットボットを24時間独占的に使用することだった。不正行為をしないよう、使用が許可されていないチャットボットからはログアウトした。

食器洗い機が頻繁に壊れる理由を突き止めることから、幼児の癇癪を防ぐためのヒント、食事の計画、ワークフローの支援まで、私は混沌とした生活に追いつくためにあらゆるヘルパーを試してきました。

週の終わりには、彼らのうち生き残れるのはたった一人だけだと感じました。

4日目: ChatGPT-XNUMXo

ChatGPTロゴ付き電話

提供する AI言語モデルを活用してコードのデバッグからデータの異常検出まで、 音声と視覚は、ハンズフリーのアシスタント機能として常に活用しています。息子のサッカーの試合が全く別の公園に変更になった際、運転中にアシスタントを使うと、10分後の目的地がすぐに分かりました。チャットボットは動揺することなく、駐車して道順を調べている間も落ち着いて待つように促してくれました。この機能は特に外出先でちょっとした情報を調べる際に役立ち、ChatGPTは迅速かつ正確な対応が求められる状況において欠かせないツールとなっています。

ChatGPTをある日に使ったもう一つの方法は、おしゃべり好きなママ15人とのグループチャットで、テキストメッセージを要約することでした。急いで内容をまとめる必要があったので、スクリーンショットを撮ってアプリにアップロードしました。ChatGPTのおかげで、何も見逃すことなく会話の要点を把握することができました。この機能は、特に会話が複雑になりがちな大人数のグループで、時間と労力を節約してくれます。

ChatGPTの人間的な要素、特に人生の最もクレイジーな瞬間において、このチャットボットが真価を発揮するのはまさにこの部分です。このチャットボットは、音声、ビデオ、そして記憶に関するタスクにおいて、他のチャットボットよりも高速で優れていると感じました。その日の食事の計画に関しては私の好みを記憶し、義父の誕生日のアイデア出しも驚くほど創造的にサポートしてくれました。この適応力と記憶力の高さこそが、ChatGPTを貴重なパーソナルアシスタントへと昇華させ、ユーザーのニーズを理解し、パーソナライズされたソリューションを提供できる存在へと押し上げているのです。

強み:

メモリとカスタム指示により、個人的な感覚が生まれました。

アイデアや創造性を交換するのに最適です。

画像の強力な解釈

完璧な感情的サポート

弱点:

時々彼は、まだ喜ばせることに熱心すぎるし、私が望むほど批判的ではない。

マルチメディア機能はブラウザではなくアプリで最も効果的に動作します。

4日目: クロードのソネットXNUMX曲

ノートパソコンを使っているクロード

ChatGPTから クロード 挑戦でした。新しい音声機能はありますが、ChatGPTほど優れているわけではないので、テキストでの会話にこだわることにしました。

クロードは、深く、時に過剰な思考力でも知られています。このロボットは非常に論理的な回答と美しい文章を提供しますが、少し冗長なところがあります。

ChatGPTでは友達と話しているような感覚でしたが、Claudeを使うと哲学の専門家と話しているような感覚になることがあります。ボットなのであまり個人的な印象がなく、ランダムな質問には対応できません。

例えば、友人と夕食をとるために、初めて行くレストランで待ち合わせをしたのですが、クロードは道順をなかなか教えてくれませんでした。公園のすぐそばだと伝えると、店員は公園管理人に電話するように勧めてきました。これは理想的とは言えません。

文芸エージェントからとても長いメールが届いたのですが、読む時間がなくてどうしても返信しなければならなかったので、アシスタントの方には大変助けられました。メールの要約をもとに、私が送れるメールの書き方を手伝ってくれました。

もう一つの予想外の勝利?クロードは感情のニュアンスを巧みに表現する才能に恵まれています。プロフェッショナルではないけれど、少し感情的な重みのある、繊細で個人的なメッセージを作るのに苦労していた時、クロードは本当に素晴らしい仕事をしてくれました。

クロードの返信は文法的に正確だっただけでなく、共感的でバランスが取れており、思慮深いものでした。明確で親切なメッセージを書く必要がある場合、クロードは驚くほどそのトーンを見つけるのが得意です。

強み:

慎重に考え、長期的に構築する素晴らしい能力。

穏やかで澄んだ音色。

分析と要約に優れています。

弱点:

道順などの即時の質問にはあまり役に立ちません。

オーディオ機能は良くありません。

3日目: ジェミニライブを体験

電話でのGoogle Gemini Live

考慮する 双子座 日々の仕事に欠かせないツールですが、ChatGPTとClaudeを使っていた頃は、本当になくなっちゃいました。このインテリジェントボットは、スピード、視覚認識、そしてGoogleエコシステムとのシームレスな接続性を備えており、週を通してタスクを整理するのにとても役立っています。

すぐに情報を検索するときも、Gmailやドキュメントからデータを抽出するときも、Geminiは常に私の第一候補です。しかし、クリエイティブな作業に関しては、期待に応えられないかもしれません。

それはそうだった ジェミニライブ 夕食用に買った鶏肉の賞味期限が2日過ぎていたことに気づいた時、とても親切にしてくれました。「食べても大丈夫?」と尋ねたところ、彼は「ダメ」と答え、冷蔵庫とパントリーにあるものを見て、いろいろと提案してくれました。結局、家族のためにクリスピーチキンラップを作ってあげたのですが、みんな大喜びでした。

別の場面では、子供たちがなかなか寝てくれなかった時に、Geminiが寝かしつけを助けてくれました。小さなお子さんを持つ親なら、寝かしつけがどれほど大変かご存知でしょう。親はとにかく寝たいのに、子供​​たちは寝ない言い訳ばかり探してしまうのです。

Gemini Live を起動して助けを求めました。「子供たちを寝かしつけるのを手伝って!」とお願いするだけで、本当に役立つヒントがいくつか表示されました。中には、(叫びたい気持ちもありましたが)壁を跳ね回る子供たちを落ち着かせるためにささやく方法などもありました。

強み:

Google Workspaceとの優れた統合

情報の整理と情報源の検索が得意

優れた数学とグラフ作成スキル

弱点:

創造性は期待外れでした。

時々、彼は協調性を幻覚したり、ニュアンスを無視したりします。

4日目: 困惑するAI

電話での困惑

困惑 超高速なリサーチアシスタントとして機能します。正確な引用、簡単な要約、そしてリアルタイムのウェブ検索結果を提供します。しかし、真の会話パートナーではなく、チャットボットを装った検索エンジンです。言い換えれば、洗練されたAI搭載のリサーチツールです。

このモデルをテストする予定だった日に、記事の執筆中に使用しました。あるAIモデルのリリース日を確認する必要がありました。Perplexityは即座に日付を抽出し、クリックして確認できる3つのソースも表示してくれました。他のAIモデルで時々発生するような不正確さや「不具合」は一切ありませんでした。

実際、Perplexity が誤った情報を提供しているのを見たことはありません。皆さんはこのような状況に遭遇したことがありますか?コメント欄で教えてください。この件についてもっと詳しく知りたいと思っています。

同じ日、ニュージャージーに本格的な夏が到来したので、オフィス用に小型でパワフルな扇風機を探していて、価格を比較したかったのです。Perplexity は、仕様と信頼できるサイトからの最近のレビューを30秒もかからずに表示してくれました。まるでGoogleタブをXNUMXつも開けずに済んだかのようでした。

Perplexity を使ってニュースを掘り下げたり、Perplexity Day のために取っておいたニュースレターを読み返したりもしました。これは不正行為とみなされるでしょうか?最新の記事から情報を引き出し、重要な更新情報を要約し、必要に応じて Plus を探索するためのリンクも提供してくれました。ノイズを減らし、明瞭性を高めています。

強み:

迅速で事実に基づいた、情報源に裏付けられた回答に最適です。

最新ニュースや製品調査の最新情報を入手するのに最適です。

高速かつ効率的。

弱点:

音色、個性、または記憶が欠けている。

ブレーンストーミングや大規模なクリエイティブ プロジェクトには適していません。

5日目: ディープシーク

コンピューターデータの前に表示されたスマートフォン上のDeepSeekのロゴ

ディープシーク 今週のダークホースです。普段はクリエイティブな用途で使っているので、このチャットボットがAIアシスタントのレベルにまで達したことには本当に感銘を受けました。知名度も利用度もそれほど高くありませんが、ChatGPTやGeminiといった有名企業に匹敵する実力を見せつけています。

DeepSeek は、推論、プログラミング、ビジョンベースのタスクに関しては驚くべき機能を備えています。

実は、最初のテストは視覚的なものでした。娘の遠足の持ち物リスト(しわくちゃでコーヒーの染みが少し付いている)の写真をアップロードし、DeepSeekに店舗ごとの買い物リストを作成させました。DeepSeekは手書きの文字を正しく読み取っただけでなく、Amazon、Target、Walmartで購入できる商品も提案してくれました。驚いたことに、おおよその価格も表示してくれました。

その後、DeepSeekに頼んで、猫がなぜ咳やくしゃみを頻繁にするのかを調べてみました。DeepSeekは、考えられる原因を詳細かつ分かりやすく説明してくれただけでなく、近所の獣医さんを探すのにも役立ちました(獣医さんは1人しかいませんが、とても助かりました)。

ChatGPTほどおしゃべりではないものの、間違いなく「フレンドリー」であることに気付きました。DeepSeekは、深刻な問題解決や複雑な技術的タスクを迅速に完了させる必要がある場合に威力を発揮します。

強み:

優れた視覚分析と画像ベースの推論

強力な論理的思考力と技術的な説明力

プログラミング、数学、構造化された計画に最適です。

弱点:

会話における個性や温かさが限られている

感情的な口調やオープンなブレインストーミングには適していません。

結論:私が残したい選択肢

日々の不安定な状況により、「得てして得する」体験はワイルドな冒険へと変わりました。しかし、1週間にわたる構造化されたAI支援テストの結果、ChatGPTは他を圧倒し、Gemini Liveが僅差で2位となりました。

ChatGPTは完璧ではありませんが、このチャットボットの記憶機能は私にとって大きな利点です。私のことをより深く理解してくれるので、同じことを繰り返す必要がありません。記憶機能とカスタム指示機能を有効にすると、ChatGPTだけが私に適応してくれていると感じました。逆ではありませんでした。

このチャットボットは、創造性、有用性、そして使いやすさの完璧なバランスを実現しています。まるで本物のアシスタントになったような気分になります。私のスタイルを理解し、ニーズを予測し、仕事や思考をより良くサポートしてくれます。

しかし、これらをハイブリッドに使うのが最適だと気づきました。Claudeは詳細な調査に、Perplexityは簡単な調査に常に使います。Geminiは私のワークフローに不可欠なので、なくてはならない存在です。

結論:選択する必要がないのは嬉しいです。

コメントは締め切りました。