Otomatik İstem Optimizasyonu, ML Kit'in Üretken Yapay Zeka İstem API'sinde Kalite Artışı Sağlıyor

Okuma süresi 3 dakika

28 Ocak 2026

4 Yazarlar

Chetan Tekur, Chao Zhao, Paul Zhou, Caren Chang

Otomatik istem optimizasyonu (APO)

ML Kit Prompt API kullanım alanlarınızı üretime taşımanıza daha fazla yardımcı olmak için Vertex AI'daki cihaz üzerinde modelleri hedefleyen Otomatik İstem Optimizasyonu (APO) özelliğini duyurmaktan heyecan duyuyoruz. Otomatik İstem Optimizasyonu, kullanım alanlarınız için en uygun istemi otomatik olarak bulmanıza yardımcı olan bir araçtır.

Cihaz üzerinde yapay zeka dönemi artık bir vaat değil, üretimde kullanılan bir gerçeklik. Gemini Nano v3'ün kullanıma sunulmasıyla birlikte, benzersiz dil anlama ve çok formatlı özellikler doğrudan kullanıcıların avuçlarına geliyor. Gemini Nano model ailesi sayesinde Android ekosistemindeki desteklenen cihazların büyük bir kısmını kapsıyoruz. Ancak yeni nesil akıllı uygulamalar geliştiren geliştiriciler için güçlü bir modele erişim, yalnızca ilk adımdır. Asıl zorluk özelleştirmede yatıyor: Bir temel modeli, mobil donanımın kısıtlamalarını ihlal etmeden belirli kullanım alanınız için uzman düzeyinde performansa nasıl uyarlarsınız?

Sunucu tarafı dünyasında, daha büyük LLM'ler genellikle oldukça yeteneklidir ve daha az alan uyarlaması gerektirir. Gerekli olsa bile LoRA (Low-Rank Adaptation) ince ayarı gibi daha gelişmiş seçenekler uygulanabilir. Ancak Android AICore'un benzersiz mimarisi, paylaşılan ve bellek açısından verimli bir sistem modeline öncelik verir. Bu nedenle, her bir uygulama için özel LoRA bağdaştırıcıları dağıtmak bu paylaşılan sistem hizmetlerinde zorluklar yaratır.

Ancak aynı derecede etkili olabilecek alternatif bir yol vardır. Geliştiriciler, Vertex AI'da Otomatik İstem Optimizasyonu (APO)'ndan yararlanarak ince ayara yakın bir kalite elde edebilir ve tüm bunları yerel Android yürütme ortamında sorunsuz bir şekilde çalışarak yapabilir. APO, üstün sistem talimatına odaklanarak geliştiricilerin model davranışını geleneksel ince ayar çözümlerine kıyasla daha sağlam ve ölçeklenebilir bir şekilde özelleştirmesini sağlar.

Not: Gemini Nano V3, çok beğenilen Gemma 3N modelinin kalite için optimize edilmiş bir sürümüdür. Açık kaynaklı Gemma 3N modelinde yapılan tüm istem optimizasyonları Gemini Nano V3'e de uygulanır. ML Kit GenAI API'leri, desteklenen cihazlarda Android geliştiriciler için kaliteyi en üst düzeye çıkarmak amacıyla nano-v3 modelinden yararlanır.

APO, istemi statik bir metin olarak değil, optimize edilebilen programlanabilir bir yüzey olarak ele alır. İstem önerisinde bulunmak, varyasyonları değerlendirmek ve belirli göreviniz için en uygun olanı bulmak amacıyla sunucu tarafı modellerinden (ör. Gemini Pro ve Flash) yararlanır. Bu süreçte performansı en üst düzeye çıkarmak için üç özel teknik mekanizma kullanılır:

Otomatik Hata Analizi: APO, ilk istemdeki belirli zayıflıkları otomatik olarak belirlemek için eğitim verilerindeki hata kalıplarını analiz eder.
Anlamsal Talimat Damıtma: Bir görevin "gerçek amacını" damıtmak için büyük eğitim örneklerini analiz ederek gerçek veri dağıtımını daha doğru yansıtan talimatlar oluşturur.
Paralel Aday Testi: APO, her seferinde tek bir fikri test etmek yerine kalite için küresel maksimumu belirlemek üzere çok sayıda istem adayını paralel olarak oluşturur ve test eder.

APO, kaliteye neden ince ayar yapabilir?

İnce ayarın her zaman istemden daha iyi kalite sağladığı yaygın bir yanılgıdır. Gemini Nano v3 gibi modern temel modellerde istem mühendisliği tek başına etkili olabilir:

Genel yetenekleri koruma: İnce ayar ( PEFT/LoRA), modelin ağırlıklarını belirli bir veri dağılımı üzerinde aşırı indekslemeye zorlar. Bu durum genellikle "felaket derecesinde unutmaya" yol açar. Bu durumda model, belirli söz diziminizde daha iyi hale gelir ancak genel mantık ve güvenlik konusunda kötüleşir. APO, temel modelin özelliklerini koruyarak ağırlıklara dokunmaz.
Talimat Takibi ve Strateji Keşfi: Gemini Nano v3, karmaşık sistem talimatlarını takip etmek için titizlikle eğitilmiştir. APO, modelin gizli özelliklerini ortaya çıkaran tam talimat yapısını bularak bu durumdan yararlanır ve genellikle insan mühendislerin bulmasının zor olabileceği stratejileri keşfeder.

Bu yaklaşımı doğrulamak için APO'yu çeşitli üretim iş yüklerinde değerlendirdik. Doğrulama sürecimizde, çeşitli kullanım alanlarında tutarlı bir şekilde % 5-8 doğruluk artışı elde edildi.APO, cihaz üzerinde dağıtılan birden fazla özellikte önemli kalite artışları sağladı.

Use Case	Görev Türü	Görev Açıklaması (Task Description)	Metrik	APO İyileştirme
Konu sınıflandırması	Metin sınıflandırma	Bir haber makalesini finans, spor vb. gibi konulara göre sınıflandırma	Doğruluk	+%5
Amaç sınıflandırması	Metin sınıflandırma	Müşteri hizmetleri sorgularını amaçlara göre sınıflandırma	Doğruluk	+%8,0
Web sayfası çevirisi	Metin çevirisi	Web sayfasını İngilizceden yerel bir dile çevirme	BLEU	+%8,57

Sorunsuz, Uçtan Uca Geliştirici İş Akışı

İnce ayarın her zaman istemden daha iyi kalite sağladığı yaygın bir yanılgıdır. Gemini Nano v3 gibi modern temel modellerde istem mühendisliği tek başına etkili olabilir:

Genel yetenekleri koruma: İnce ayar ( PEFT/LoRA), modelin ağırlıklarını belirli bir veri dağılımı üzerinde aşırı indekslemeye zorlar. Bu durum genellikle "felaket derecesinde unutmaya" yol açar. Bu durumda model, belirli söz diziminizde daha iyi hale gelir ancak genel mantık ve güvenlik konusunda kötüleşir. APO, temel modelin özelliklerini koruyarak ağırlıklara dokunmaz.
Talimat Takibi ve Strateji Keşfi: Gemini Nano v3, karmaşık sistem talimatlarını takip etmek için titizlikle eğitilmiştir. APO, modelin gizli özelliklerini ortaya çıkaran tam talimat yapısını bularak bu durumdan yararlanır ve genellikle insan mühendislerin bulmasının zor olabileceği stratejileri keşfeder.

Sonuç

Otomatik İstem Optimizasyonu (APO)'nun kullanıma sunulması, cihaz üzerinde üretken yapay zeka için bir dönüm noktasıdır. Temel modeller ile uzman düzeyinde performans arasındaki boşluğu kapatarak geliştiricilere daha sağlam mobil uygulamalar oluşturma araçları sunuyoruz. Zero-Shot Optimization'ı kullanmaya yeni başlıyor veya Data-Driven iyileştirme ile üretime geçiş yapıyorsanız cihaz üzerinde yüksek kaliteli yapay zekaya ulaşma yolu artık daha net. ML Kit'in Prompt API'si ve Vertex AI'ın Otomatik İstem Optimizasyonu ile cihaz üzerinde kullanım alanlarınızı bugün üretime taşıyın.

İlgili bağlantılar:

Yazan:

Chetan Tekur

Ürün Yöneticisi

read_more Profili göster
Chao Zhao

Yazılım Mühendisi

read_more Profili göster
Paul Zhou

Senior Staff Software Engineer

read_more Profili göster
Caren Chang

Geliştirici İlişkileri Mühendisi

read_more Profili göster

Okumaya devam et

02 Nis 2026

02 Nis 2026

Ürün Haberleri

AICore Geliştirici Önizlemesi'nde Gemma 4'ü duyuruyoruz

arrow_forward

Google olarak, en yetenekli yapay zeka modellerini doğrudan cebinizdeki Android cihazlara getirmeye kararlıyız. Bugün, en yeni ve gelişmiş açık modelimiz Gemma 4'ün kullanıma sunulduğunu duyurmaktan heyecan duyuyoruz.
Caren Chang, David Chou • Okuma süresi 3 dakika
3 Yazarlar

30 Eki 2025

30 Eki 2025

Ürün Haberleri

ML Kit'in Prompt API'si: Cihaz üzerinde özel Gemini Nano deneyimlerinin kilidini açın

arrow_forward

Yapay zeka, içeriği kullanıcılar için doğru biçime dönüştüren kişiselleştirilmiş uygulama deneyimleri oluşturmayı kolaylaştırıyor. Daha önce geliştiricilerin, özetleme ve resim açıklaması gibi belirli kullanım alanlarına yönelik ML Kit GenAI API'leri aracılığıyla Gemini Nano ile entegrasyon yapmasına olanak tanımıştık.
Caren Chang, Chengji Yan, Penny Li • Okuma süresi 2 dakika
16 Tem 2026

16 Tem 2026

Ürün Haberleri

Android Studio Quail 2 kararlı sürüme geçti: Android Studio Yapay Zeka Aracı ile çoklu görev

arrow_forward

Android Studio Quail 2 artık kararlı ve üretimde kullanıma hazır. Bu sürümle birlikte, eşzamanlı yapay zeka destekli iş akışları, yerel olarak entegre edilmiş bellek sızıntısı profili oluşturma ve bağlama duyarlı kilitlenme düzeltme gibi özelliklerle IDE'nizde önemli bir değişiklik yapılıyor.
Amman Asfaw • Okuma süresi 3 dakika
- #Android Studio'da Gemini
- # Quail 2
- #Android Studio
- +1 ↩