Wiadomości o usługach

Inteligentny system operacyjny: zwiększanie przydatności agentów AI w aplikacjach na Androida

Czas czytania: 3 minuty
Matthew McCullough
Vice President, Product Management, Android Developer

Oczekiwania użytkowników dotyczące AI na urządzeniach zasadniczo zmieniają sposób, w jaki korzystają oni z aplikacji. Zamiast otwierać aplikacje i wykonywać zadania krok po kroku, proszą AI o wykonanie za nich najtrudniejszych czynności. W tym nowym modelu interakcji sukces nie polega już na zachęcaniu użytkowników do otwierania aplikacji, ale na skutecznym wykonywaniu zadań i pomaganiu im w szybszym realizowaniu celów. 

Aby pomóc Ci w rozwijaniu aplikacji pod kątem przyszłości opartej na agentach, wprowadzamy funkcje dla deweloperów na wczesnym etapie, które wypełniają lukę między Twoimi aplikacjami a aplikacjami opartymi na agentach i spersonalizowanymi asystentami, takimi jak Google Gemini. Jesteśmy na wczesnym etapie testów beta, ale projektujemy te funkcje z myślą o prywatności i bezpieczeństwie. To nasz pierwszy krok w badaniu tej zmiany paradygmatu w ekosystemie aplikacji.

Wzbogacanie aplikacji za pomocą funkcji AppFunctions

Android AppFunctions umożliwia aplikacjom udostępnianie danych i funkcji bezpośrednio agentom i asystentom AI. Za pomocą  biblioteki AppFunctions Jetpackinterfejsów API platformy deweloperzy mogą tworzyć funkcje z własnym opisem, które aplikacje oparte na agentach mogą wykrywać i wykonywać za pomocą języka naturalnego. Podobnie jak w przypadku deklarowania funkcji backendu za pomocą serwerów w chmurze MCP, AppFunctions zapewnia rozwiązanie na urządzeniu dla aplikacji na Androida. Podobnie jak WebMCP wykonuje te funkcje lokalnie na urządzeniu, a nie na serwerze.

Integracja Galerii Samsung z Gemini na urządzeniach z serii Galaxy S26 pokazuje działanie funkcji aplikacji. Zamiast ręcznie przewijać albumy ze zdjęciami, możesz teraz po prostu poprosić Gemini o „Pokazanie zdjęć mojego kota z Samsung Gallery”. Gemini przyjmuje zapytanie użytkownika, inteligentnie identyfikuje i uruchamia odpowiednią funkcję oraz wyświetla zwrócone zdjęcia z Samsung Gallery bezpośrednio w aplikacji Gemini, dzięki czemu użytkownicy nie muszą jej opuszczać. Ta funkcja jest multimodalna i można z niej korzystać za pomocą głosu lub tekstu. Użytkownicy mogą nawet wykorzystywać zwrócone zdjęcia w dalszych rozmowach, np. wysyłać je znajomym w SMS-ach.

photos.gif

Ta integracja jest obecnie dostępna na urządzeniach z serii Galaxy S26, a wkrótce zostanie udostępniona na urządzeniach Samsung z systemem OneUI 8.5 lub nowszym. Dzięki AppFunctions Gemini może już automatyzować zadania w różnych kategoriach aplikacji, takich jak Kalendarz, NotatkiZadania, na urządzeniach różnych producentów. Niezależnie od tego, czy chodzi o koordynowanie wydarzeń w kalendarzu, porządkowanie notatek czy ustawianie przypomnień o zadaniach do wykonania, użytkownicy mogą usprawnić codzienne czynności w jednym miejscu.

Włączanie aplikacji opartych na agentach za pomocą inteligentnej automatyzacji interfejsu

AppFunctions zapewnia aplikacjom uporządkowane ramy i większą kontrolę nad komunikacją z agentami AI i asystentami, ale wiemy, że nie każda interakcja ma jeszcze dedykowaną integrację. Opracowujemy też platformę automatyzacji interfejsu dla agentów i asystentów AI, która będzie inteligentnie wykonywać ogólne zadania w zainstalowanych aplikacjach użytkowników, zapewniając im przejrzystość zasad przetwarzania danych użytkownika i kontrolę. To ta platforma wykonuje większość pracy, dzięki czemu deweloperzy mogą uzyskać zasięg agenta bez pisania kodu. To łatwy sposób na zwiększenie zasięgu bez konieczności przeprowadzania skomplikowanych prac technicznych. 
 

Aby uzyskać opinie podczas ulepszania tej platformy, zaczynamy od wczesnej wersji testowej na urządzeniach z serii Galaxy S26 i wybranych urządzeniach Pixel 10. Użytkownicy będą mogli przekazywać Gemini wieloetapowe zadania, po prostu przytrzymując przycisk zasilania. Ta funkcja będzie dostępna w wersji beta w aplikacji Gemini. Na początek będzie obsługiwać wybrane aplikacje w kategoriach dostawy jedzenia, zakupów spożywczych i przewozów w Stanach Zjednoczonych i Korei. Niezależnie od tego, czy użytkownicy chcą złożyć skomplikowane zamówienie pizzy dla członków rodziny o specyficznych gustach, skoordynować przejazd z wieloma przystankami z współpracownikami czy ponownie zamówić ostatnie zakupy spożywcze, Gemini może pomóc w wykonaniu tych zadań, korzystając z kontekstu dostępnego już w Twoich aplikacjach. Nie wymaga to żadnych działań ze strony dewelopera.

photos2.gif

Użytkownicy mają kontrolę nad zadaniem wykonywanym w tle za pomocą automatyzacji interfejsu. W przypadku każdej czynności automatyzacji użytkownicy mogą śledzić postępy zadania za pomocą powiadomień lub „widoku na żywo” i w dowolnym momencie przełączyć się na sterowanie ręczne, aby przejąć kontrolę. Gemini jest też zaprojektowany tak, aby ostrzegać użytkowników przed wykonaniem zadań wymagających zachowania ostrożności, takich jak dokonywanie zakupu. 

Co dalej

W Androidzie 17 chcemy rozszerzyć te możliwości, aby dotrzeć do jeszcze większej liczby użytkowników, programistów i producentów urządzeń.

Obecnie tworzymy rozwiązania z niewielką grupą deweloperów aplikacji, koncentrując się na zapewnieniu użytkownikom wysokiej jakości wrażeń w miarę rozwoju ekosystemu. Więcej szczegółów na temat tego, jak możesz używać funkcji aplikacji i automatyzacji interfejsu, aby włączyć integracje oparte na agentach w swojej aplikacji, podamy w dalszej części tego roku. Bądź na bieżąco z aktualnościami.

Autor:

Czytaj dalej