Berita Produk

Cara Pengoptimalan Perintah Otomatis Meningkatkan Kualitas untuk Prompt API GenAI ML Kit

Waktu baca: 3 menit

28 Januari 2026

4 Penulis

Chetan Tekur, Chao Zhao, Paul Zhou, Caren Chang

Pengoptimalan Perintah Otomatis (APO)

Untuk membantu Anda menerapkan kasus penggunaan Prompt API ML Kit ke produksi, kami dengan senang hati mengumumkan Pengoptimalan Perintah Otomatis (APO) yang menargetkan model Di Perangkat di Vertex AI. Pengoptimalan Perintah Otomatis adalah alat yang membantu Anda menemukan perintah optimal untuk kasus penggunaan Anda secara otomatis.

Era AI Di Perangkat bukan lagi janji—tetapi sudah menjadi kenyataan produksi. Dengan rilis Gemini Nano v3, kami menghadirkan kemampuan multimodal dan pemahaman bahasa yang belum pernah ada sebelumnya langsung ke tangan pengguna. Melalui model Gemini Nano, kami memiliki cakupan luas perangkat yang didukung di seluruh Ekosistem Android. Namun, bagi developer yang membangun aplikasi cerdas generasi berikutnya, akses ke model yang canggih hanyalah langkah pertama. Tantangan sebenarnya terletak pada penyesuaian: Bagaimana Anda menyesuaikan model dasar ke performa tingkat ahli untuk kasus penggunaan spesifik Anda tanpa melanggar batasan hardware seluler?

Di dunia sisi server, LLM yang lebih besar cenderung sangat mumpuni dan memerlukan lebih sedikit adaptasi domain. Bahkan jika diperlukan, opsi yang lebih canggih seperti penyesuaian LoRA (Low-Rank Adaptation) dapat menjadi opsi yang layak. Namun, arsitektur unik Android AICore memprioritaskan model sistem bersama yang hemat memori. Artinya, men-deploy adapter LoRA kustom untuk setiap aplikasi individual akan menimbulkan tantangan pada layanan sistem bersama ini.

Namun, ada jalur alternatif yang dapat memberikan dampak yang sama. Dengan memanfaatkan Pengoptimalan Perintah Otomatis (APO) di Vertex AI, developer dapat mencapai kualitas yang mendekati penyesuaian, sekaligus bekerja dengan lancar dalam lingkungan eksekusi Android native. Dengan berfokus pada petunjuk sistem yang unggul, APO memungkinkan developer menyesuaikan perilaku model dengan ketahanan dan skalabilitas yang lebih besar daripada solusi penyesuaian tradisional.

Catatan: Gemini Nano V3 adalah versi yang dioptimalkan kualitasnya dari model Gemma 3N yang sangat terkenal. Pengoptimalan perintah yang dilakukan pada model Gemma 3N open source juga akan berlaku untuk Gemini Nano V3. Di perangkat yang didukung, API GenAI ML Kit memanfaatkan model nano-v3 untuk memaksimalkan kualitas bagi Developer Android

APO memperlakukan perintah bukan sebagai teks statis, tetapi sebagai platform yang dapat diprogram dan dioptimalkan. APO memanfaatkan model sisi server (seperti Gemini Pro dan Flash) untuk menyarankan perintah, mengevaluasi variasi, dan menemukan perintah yang optimal untuk tugas spesifik Anda. Proses ini menggunakan tiga mekanisme teknis khusus untuk memaksimalkan performa:

Analisis Error Otomatis: APO menganalisis pola error dari data pelatihan untuk mengidentifikasi kelemahan tertentu dalam perintah awal secara Otomatis.
Distilasi Petunjuk Semantik: APO menganalisis contoh pelatihan yang sangat besar untuk menyaring "tujuan sebenarnya" dari suatu tugas, sehingga membuat petunjuk yang lebih akurat mencerminkan distribusi data yang sebenarnya.
Pengujian Kandidat Paralel: Daripada menguji satu ide dalam satu waktu, APO membuat dan menguji banyak kandidat perintah secara paralel untuk mengidentifikasi maksimum global untuk kualitas.

Alasan APO Dapat Mendekati Kualitas Penyesuaian

Ada kesalahpahaman umum bahwa penyesuaian selalu menghasilkan kualitas yang lebih baik daripada perintah. Untuk model dasar modern seperti Gemini Nano v3, rekayasa perintah dapat memberikan dampak dengan sendirinya:

Mempertahankan kemampuan Umum: Penyesuaian ( PEFT/LoRA) memaksa bobot model untuk mengindeks berlebihan pada distribusi data tertentu. Hal ini sering kali menyebabkan "lupa yang parah", yaitu kondisi saat model menjadi lebih baik dalam sintaksis spesifik Anda, tetapi lebih buruk dalam logika dan keamanan umum. APO tidak mengubah bobot, sehingga mempertahankan kemampuan model dasar.
Mengikuti Petunjuk &Penemuan Strategi: Gemini Nano v3 telah dilatih secara ketat untuk mengikuti petunjuk sistem yang kompleks. APO memanfaatkan hal ini dengan menemukan struktur petunjuk yang tepat yang membuka kemampuan laten model, sehingga sering kali menemukan strategi yang mungkin sulit ditemukan oleh engineer manusia.

Untuk memvalidasi pendekatan ini, kami mengevaluasi APO di berbagai beban kerja produksi. Validasi kami menunjukkan peningkatan akurasi 5-8% yang konsisten di berbagai kasus penggunaan.Di beberapa fitur di perangkat yang di-deploy, APO memberikan peningkatan kualitas yang signifikan.

Kasus Penggunaan	Jenis Tugas	Deskripsi Tugas	Metrik	Peningkatan APO
Klasifikasi topik	Klasifikasi teks	Mengklasifikasikan artikel berita ke dalam topik seperti keuangan, olahraga, dll.	Akurasi	+5%
Klasifikasi intent	Klasifikasi teks	Mengklasifikasikan kueri layanan pelanggan ke dalam intent	Akurasi	+8,0%
Terjemahan halaman web	Penerjemahan teks	Menerjemahkan halaman web dari bahasa Inggris ke bahasa lokal	BLEU	+8,57%

Alur Kerja Developer End-to-End yang Lancar

Mempertahankan kemampuan Umum: Penyesuaian ( PEFT/LoRA) memaksa bobot model untuk mengindeks berlebihan pada distribusi data tertentu. Hal ini sering kali menyebabkan "lupa yang parah", yaitu kondisi saat model menjadi lebih baik dalam sintaksis spesifik Anda, tetapi lebih buruk dalam logika dan keamanan umum. APO tidak mengubah bobot, sehingga mempertahankan kemampuan model dasar.
Mengikuti Petunjuk &Penemuan Strategi: Gemini Nano v3 telah dilatih secara ketat untuk mengikuti petunjuk sistem yang kompleks. APO memanfaatkan hal ini dengan menemukan struktur petunjuk yang tepat yang membuka kemampuan laten model, sehingga sering kali menemukan strategi yang mungkin sulit ditemukan oleh engineer manusia.

Kesimpulan

Rilis Pengoptimalan Perintah Otomatis (APO) menandai titik balik untuk AI generatif di perangkat. Dengan menjembatani kesenjangan antara model dasar dan performa tingkat ahli, kami memberi developer alat untuk membangun aplikasi seluler yang lebih andal. Baik Anda baru memulai dengan Pengoptimalan Zero-Shot atau melakukan penskalaan ke produksi dengan penyempurnaan Berbasis Data, jalur menuju kecerdasan di perangkat berkualitas tinggi kini lebih jelas. Luncurkan kasus penggunaan di perangkat Anda ke produksi hari ini dengan Prompt API ML Kit dan Pengoptimalan Perintah Otomatis Vertex AI.

Link yang relevan:

Ditulis oleh:

Chetan Tekur

Product Manager

read_more Lihat profil
Chao Zhao

Software Engineer

read_more Lihat profil
Paul Zhou

Software Engineer Senior

read_more Lihat profil
Caren Chang

Developer Relations Engineer

read_more Lihat profil

Lanjutkan membaca

02 April 2026

02 April 2026

Berita Produk

Pengumuman Gemma 4 di Pratinjau Developer AICore

arrow_forward

Di Google, kami berkomitmen untuk menghadirkan model AI yang paling canggih langsung ke perangkat Android di saku Anda. Hari ini, kami dengan senang hati mengumumkan rilis model terbuka canggih terbaru kami: Gemma 4.
Caren Chang, David Chou • Waktu baca: 3 menit
3 Penulis

30 Oktober 2025

30 Oktober 2025

Berita Produk

Prompt API ML Kit: Membuka Pengalaman Gemini Nano Di Perangkat Kustom

arrow_forward

AI memudahkan pembuatan pengalaman aplikasi yang dipersonalisasi yang mengubah konten menjadi format yang tepat untuk pengguna. Sebelumnya, kami memungkinkan developer berintegrasi dengan Gemini Nano melalui API GenAI ML Kit yang disesuaikan untuk kasus penggunaan tertentu seperti pembuatan ringkasan dan deskripsi gambar.
Caren Chang, Chengji Yan, Penny Li • Waktu baca: 2 menit
19 Mei 2026

19 Mei 2026

Berita Produk

I/O 2026: Yang baru di Google Play

arrow_forward

Di Google I/O tahun ini, kami membahas model bisnis kami yang terus berkembang yang menawarkan lebih banyak pilihan dan cara baru agar aplikasi dan konten Anda dapat ditemukan di dalam dan di luar Play Store. Kami juga memperkenalkan alat dan insight canggih yang akan membantu menskalakan bisnis Anda dengan lebih mudah.
Paul Feng • Waktu baca: 6 menit
- #Google Play
- #Konsol Play
- #Google I/O
- #Developer Android
- +2 ↩