Nowości o produktach
Prompt API w ML Kit: odblokowywanie niestandardowych funkcji Gemini Nano na urządzeniu
2 minuty czytania
AI ułatwia tworzenie spersonalizowanych aplikacji, które przekształcają treści w odpowiedni format dla użytkowników. Wcześniej umożliwiliśmy deweloperom integrację z Gemini Nano za pomocą interfejsów ML Kit GenAI API dostosowanych do konkretnych przypadków użycia, takich jak podsumowywanie i opisywanie obrazów.
Dziś osiągamy ważny kamień milowy w rozwoju generatywnej AI na urządzeniu z Androidem. Ogłaszamy wersję alfa interfejsu ML Kit GenAI Prompt API. Ten interfejs API umożliwia wysyłanie do Gemini Nano zapytań w języku naturalnym i zapytań multimodalnych, co odpowiada na zapotrzebowanie na większą kontrolę i elastyczność podczas tworzenia modeli generatywnych.
Partnerzy tacy jak Kakao już korzystają z Prompt API, tworząc unikalne funkcje, które mają realny wpływ na użytkowników. Już dziś możesz eksperymentować z zaawansowanymi funkcjami Prompt API, używając minimalnej ilości kodu.
Przejdź od wbudowanej do niestandardowej generatywnej AI na urządzeniu
Prompt API wykracza poza wbudowane funkcje i obsługuje niestandardowe przypadki użycia generatywnej AI w aplikacjach, co pozwala tworzyć unikalne funkcje z wykorzystaniem złożonych przekształceń danych. Prompt API używa Gemini Nano na urządzeniu do lokalnego przetwarzania danych, co umożliwia działanie offline i zwiększa prywatność użytkowników.
Główne przypadki użycia Prompt API:
Prompt API umożliwia tworzenie wysoce spersonalizowanych przypadków użycia generatywnej AI. Oto kilka zalecanych przykładów:
- Rozpoznawanie obrazów: analizowanie zdjęć pod kątem klasyfikacji (np. tworzenie wersji roboczej posta w mediach społecznościowych lub identyfikowanie tagów takich jak „zwierzęta”, „jedzenie” czy „podróże”).
- Inteligentne skanowanie dokumentów: używanie tradycyjnego modelu ML do wyodrębniania tekstu z paragonu, a następnie kategoryzowanie poszczególnych pozycji za pomocą Prompt API.
- Przekształcanie danych na potrzeby interfejsu: analizowanie długich treści w celu utworzenia krótkiego, angażującego tytułu powiadomienia.
- Promptowanie treści: sugerowanie tematów nowych wpisów w dzienniku na podstawie preferencji użytkownika dotyczących motywów.
- Analiza treści: klasyfikowanie opinii klientów jako pozytywnych, neutralnych lub negatywnych.
- Ekstrakcja informacji: wyodrębnianie ważnych informacji o nadchodzącym wydarzeniu z wątku e-maili.
Implementacja
Prompt API umożliwia tworzenie niestandardowych promptów i ustawianie opcjonalnych parametrów generowania za pomocą kilku linii kodu:
Generation.getClient().generateContent(
generateContentRequest(
ImagePart(bitmapImage),
TextPart("Categorize this image as one of the following: car, motorcycle, bike, scooter, other. Return only the category as the response."),
) {
// Optional parameters
temperature = 0.2f
topK = 10
candidateCount = 1
maxOutputTokens = 10
},
)Więcej szczegółowych przykładów implementacji Prompt API znajdziesz w oficjalnej dokumentacji i przykładzie na GitHub.
Gemini Nano, wydajność i prototypowanie
Prompt API obecnie działa najlepiej na urządzeniach z serii Pixel 10, które korzystają z najnowszej wersji Gemini Nano (nano-v3). Ta wersja Gemini Nano jest oparta na tej samej architekturze co Gemma 3n – model, który po raz pierwszy udostępniliśmy społeczności modeli otwartych podczas konferencji I/O.
Wspólna podstawa Gemma 3n i nano-v3 ułatwia deweloperom prototypowanie funkcji. Jeśli nie masz urządzenia Pixel 10, możesz już dziś zacząć eksperymentować z promptami, prototypując lokalnie za pomocą Gemma 3n.
Pełną listę urządzeń obsługujących interfejsy GenAI API znajdziesz w naszej dokumentacji dotyczącej obsługi urządzeń.
Więcej informacji
Zacznij implementować Prompt API w swoich aplikacjach na Androida już dziś, korzystając z naszej oficjalnej dokumentacji i przykładu na GitHub.
Czytaj dalej
-
r.r.
Nowości o produktach
W Google dokładamy wszelkich starań, aby najwydajniejsze modele AI były dostępne bezpośrednio na urządzeniach z Androidem. Z przyjemnością ogłaszamy dziś udostępnienie naszego najnowszego, najnowocześniejszego modelu otwartego: Gemma 4.
Caren Chang, David Chou • 3 minuty czytania
-
Nowości o produktach
Aby ułatwić Ci wdrażanie przypadków użycia Prompt API w ML Kit, z przyjemnością ogłaszamy automatyczną optymalizację promptów (APO) na potrzeby modeli na urządzeniu w Vertex AI. Automatyczna optymalizacja promptów to narzędzie, które pomaga automatycznie znajdować optymalne prompty na potrzeby Twoich przypadków użycia.
Chetan Tekur, Chao Zhao, Paul Zhou, Caren Chang • 3 minuty czytania
-
Nowości o produktach
W Google Play dokładamy wszelkich starań, aby zapewnić użytkownikom jak najlepsze wrażenia, a deweloperom – narzędzia i elastyczność, które pozwolą im odnieść sukces.
Paul Feng • 3 minuty czytania
Bądź na bieżąco
Otrzymuj co tydzień najnowsze informacje o tworzeniu aplikacji na Androida na swoją skrzynkę odbiorczą.