Google の Gemini がもうすぐあなたの仕事をこなせるようになるかもしれません。
報道によると、Google は生成 AI アシスタントの大幅なアップグレードに取り組んでいるとのことです。 双子座これにより、単なる会話型アシスタントから、真のビジネスエージェントに近いものへと進化する可能性があります。[著者名]によるGoogleアプリコードの最近の実験的分析 9to5Google開発者たちは、内部的に「スクリーンオートメーション」と呼ばれる機能を示すコードスニペットを発見しました。これは、Geminiが近い将来、ユーザーが画面を手動でタップすることなく、注文や航空券の予約といった特定のAndroidアプリ内でユーザーに代わって直接操作できるようになることを示唆しています。

Geminiは既にメールの作成や研究計画の作成といった会話型のタスクを処理していますが、今回のアップデートでは、ボタンをタップしたり画面を操作したりといったアプリインターフェースとのやり取りを文字通り可能にし、ユーザーが通常自分で行うタスクを実行できるようにすることを目指しているようです。ベータ版の初期段階から得られた情報によると、これらの機能は当初、対応アプリの一部に限定され、ユーザーによる監視が重視されるようです。Googleは「Geminiは間違いを犯す可能性がある」と警告しており、Geminiが行った操作についてはユーザーが責任を負うことになります。

このアップグレードによって AI はアシスタントからエージェントへとどのように変化するのでしょうか?
スクリーン自動化の背後にある概念は、日常のデジタルワークフローにおいてAIの自律性を高めるための重要な一歩です。Geminiは、単に何ができるかを提案するのではなく、近いうちにそれらの選択肢をアプリ内に直接実装する可能性があります。Googleのベータ版の初期コードスニペットには、AIとの会話にログイン情報や支払い情報を入力しないようユーザーにアドバイスしたり、スクリーンショットが機能改善のために確認される可能性があることを警告したりするなど、プライバシーに関する注意事項も示されています。Googleはすでに、WorkspaceとWeb上のGemini Agentプラットフォームを通じて、AIが複雑なワークフローを処理し、サービス間の調整を行うエージェント機能をいくつか提供していますが、スクリーン自動化は、これらの機能をスマートフォンや日常的なアプリの使用に直接もたらす可能性があります。
![]()
これらの機能が広く導入されれば、人々がモバイルデバイスを操作する方法が、タップやスワイプといった単純な操作から、AIツールに代理操作を許可するといった変化を遂げる可能性があります。これは日々の業務を効率化する可能性がありますが、予約や金融取引といった機密性の高いタスクを自動化する場合、制御、セキュリティ、そして監視に関する疑問も生じます。
報道によると、Googleはこれらのアップグレードをオプションかつ監視対象と位置付けており、ユーザーはいつでもGeminiを無効化または上書きできます。ただし、画面自動化機能はまだ開発中であり、安定版リリースには至っていません。
コメントは締め切りました。