プロダクト ニュース

インテリジェント OS: AI エージェントを Android アプリでより便利に

3 分で読了
Matthew McCullough
プロダクト マネジメント担当バイス プレジデント、Android デベロッパー

デバイス上の AI に対するユーザーの期待は、アプリの操作方法を根本的に変えています。アプリを開いてタスクをステップごとに実行するのではなく、AI に重労働を任せるようになっています。この新しいインタラクション モデルでは、ユーザーにアプリを開いてもらうことではなく、タスクを正常に完了して、より多くのことをより迅速に達成できるようにすることが成功の鍵となります。

このエージェント主導の未来に向けてアプリを進化させるために、アプリとエージェント主導のアプリやパーソナライズされたアシスタント(Google Gemini など)とのギャップを埋める初期段階のデベロッパー向け機能をご紹介します。この取り組みはまだ初期のベータ版段階ですが、アプリ エコシステムにおけるこのパラダイム シフトを探る第一歩として、プライバシーとセキュリティを中核に据えてこれらの機能を設計しています。

AppFunctions でアプリを強化する

Android の __AppFunctions により、アプリはデータと機能を AI エージェントとアシスタントに直接公開できます。 AppFunctions Jetpack ライブラリと プラットフォーム APIを使用すると、デベロッパーは、エージェント主導のアプリが自然言語で検出して実行できる自己記述型関数を作成できます。バックエンド機能が MCP クラウド サーバーを介して宣言されるのと同様に、AppFunctions は Android アプリ向けのオンデバイス ソリューションを提供します。WebMCP と同様に、これらの関数はサーバーではなくデバイス上でローカルに実行されます。

Galaxy S26 シリーズでの Samsung ギャラリーと Gemini の統合 は、AppFunctions の動作を示しています。写真アルバムを手動でスクロールする代わりに、「Samsung ギャラリーから猫の写真を見せて」と Gemini に相談するだけで済みます。Gemini はユーザーのクエリを受け取り、適切な関数をインテリジェントに識別してトリガーし、Samsung ギャラリーから返された写真を Gemini アプリに直接表示するため、ユーザーはアプリを離れる必要がありません。このエクスペリエンスはマルチモーダルであり、音声またはテキストで行うことができます。ユーザーは、返された写真をフォローアップ会話で使用することもできます(テキスト メッセージで友人に送信するなど)。

photos.gif

この統合は現在、Galaxy S26 シリーズで利用可能であり、まもなく OneUI 8.5 以降を搭載した Samsung デバイスにも拡大される予定です。AppFunctions を使用すると、Gemini はすでに、複数のメーカーのデバイスで、カレンダーメモタスクなどのアプリ カテゴリ全体でタスクを自動化できます。カレンダーの予定の調整、メモの整理、ToDo リマインダーの設定など、ユーザーは日常のタスクを 1 か所で効率化できます。

インテリジェントな UI 自動化でエージェント主導のアプリを実現する

AppFunctions は、アプリが AI エージェントやアシスタントと通信するための構造化されたフレームワークとより詳細な制御を提供しますが、すべてのインタラクションに専用の統合がまだ用意されているわけではありません。また、AI エージェントとアシスタント向けの UI 自動化フレームワークも開発しています。これにより、ユーザーがインストールしたアプリで一般的なタスクをインテリジェントに実行できます。ユーザーに対する透明性と制御は組み込まれています。プラットフォームが重労働を行うため、デベロッパーはコードを記述せずにエージェント主導のリーチを実現できます。現在、大規模なエンジニアリング作業を行わずにリーチを拡大できる、手間のかからない方法です。 
 

このフレームワークを改良するにあたり、フィードバックを収集するため、Galaxy S26 シリーズと一部の Google Pixel 10 デバイスで早期プレビューを開始します。ユーザーは、電源ボタンを長押しするだけで、複数ステップのタスクを Gemini に委任できます。Gemini アプリのベータ版機能としてリリースされ、米国と韓国の食品配達、食料品、ライドシェア カテゴリの厳選されたアプリをサポートします。ユーザーが、好みが異なる家族のために複雑なピザの注文を行う必要がある場合、同僚と複数回のライドシェアを調整する場合、最後に購入した食料品を再注文する場合など、Gemini はデベロッパーの作業を必要とせずに、アプリからすでに利用可能なコンテキストを使用してタスクを完了できます。

photos2.gif

UI 自動化を通じてバックグラウンドでタスクが実行されている間、ユーザーは制御できます。自動化アクションの場合、ユーザーは通知または「ライブビュー」でタスクの進捗状況をモニタリングできます。また、いつでも手動制御に切り替えて操作を引き継ぐことができます。Gemini は、購入などの機密性の高いタスクを完了する前にユーザーにアラートを送信するように設計されています。

今後の展望

Android 17 では、これらの機能を拡張して、より多くのユーザー、デベロッパー、デバイス メーカーに提供することを目指しています。

現在、少数のアプリ デベロッパーと連携してエクスペリエンスを構築しており、エコシステムの進化に合わせて高品質のユーザー エクスペリエンスに重点を置いています。AppFunctions と UI 自動化を使用してアプリのエージェント主導の統合を有効にする方法については、今年後半に詳細をお知らせする予定です。最新情報にご期待ください。

執筆者:

続きを読む