חדשות על מוצרים

איך אופטימיזציה אוטומטית של הנחיות משפרת את האיכות של GenAI Prompt API ב-ML Kit

משך הקריאה: 3 דקות

28 Jan 2026

4 Authors

Chetan Tekur, Chao Zhao, Paul Zhou, Caren Chang

אופטימיזציה אוטומטית של הנחיות (APO)

כדי לעזור לכם להשתמש בתרחישי השימוש של ML Kit Prompt API בסביבת ייצור, אנחנו שמחים להודיע על אופטימיזציה אוטומטית של הנחיות (APO) שמיועדת למודלים במכשיר ב-Vertex AI. התכונה 'אופטימיזציה אוטומטית של הנחיות' עוזרת לכם למצוא באופן אוטומטי את ההנחיה האופטימלית לתרחישי השימוש שלכם.

העידן של AI במכשיר הוא כבר לא הבטחה – הוא מציאות שמתרחשת בפועל. עם ההשקה של Gemini Nano v3, אנחנו מעניקים למשתמשים יכולות חסרות תקדים של הבנת שפה ומולטי-מודאליות ישירות בכף היד. באמצעות משפחת המודלים Gemini Nano, אנחנו מספקים כיסוי רחב של מכשירים נתמכים בסביבה העסקית של Android. אבל למפתחים שיוצרים את הדור הבא של אפליקציות חכמות, גישה למודל עוצמתי היא רק השלב הראשון. האתגר האמיתי הוא התאמה אישית: איך מתאימים מודל בסיסי לביצועים ברמת מומחה לתרחיש השימוש הספציפי שלכם בלי לחרוג מהמגבלות של חומרת הנייד?

בעולם של מעקב בצד השרת, מודלים גדולים של שפה הם בדרך כלל בעלי יכולות גבוהות ודורשים פחות התאמה לדומיין. גם כשצריך, אפשר להשתמש באפשרויות מתקדמות יותר כמו כוונון עדין של LoRA (התאמה בדרגה נמוכה). עם זאת, הארכיטקטורה הייחודית של Android AICore נותנת עדיפות למודל מערכת משותף ויעיל בזיכרון. המשמעות היא שפריסת מתאמי LoRA מותאמים אישית לכל אפליקציה בנפרד מציבה אתגרים בשירותי המערכת המשותפים האלה.

אבל יש דרך חלופית שיכולה להיות משפיעה באותה מידה. בעזרת אופטימיזציה אוטומטית של הנחיות (APO) ב-Vertex AI, מפתחים יכולים להשיג איכות שמתקרבת לזו של כוונון עדין, וכל זאת תוך עבודה חלקה בסביבת הביצוע המקורית של Android. ה-APO מתמקד בהוראות מערכת מעולות, ומאפשר למפתחים להתאים את התנהגות המודל בצורה חזקה וניתנת להרחבה יותר מאשר פתרונות מסורתיים של כוונון עדין.

הערה: ‫Gemini Nano V3 הוא גרסה שעברה אופטימיזציה לאיכות של מודל Gemma 3N המהולל. כל האופטימיזציות להנחיות שמתבצעות במודל Gemma 3N בקוד פתוח יחולו גם על Gemini Nano V3. במכשירים נתמכים, ממשקי ה-API של ML Kit GenAI משתמשים במודל nano-v3 כדי למקסם את האיכות למפתחי Android

ה-APO מתייחס להנחיה לא כאל טקסט סטטי, אלא כאל משטח ניתן לתכנות שאפשר לבצע בו אופטימיזציה. הוא משתמש במודלים בצד השרת (כמו Gemini Pro ו-Flash) כדי להציע הנחיות, להעריך וריאציות ולמצוא את ההנחיה האופטימלית למשימה הספציפית שלכם. התהליך הזה משתמש בשלושה מנגנונים טכניים ספציפיים כדי למקסם את הביצועים:

ניתוח שגיאות אוטומטי: APO מנתח דפוסי שגיאות מנתוני האימון כדי לזהות באופן אוטומטי נקודות חולשה ספציפיות בהנחיה הראשונית.
זיקוק הוראות סמנטיות: הטכנולוגיה הזו מנתחת דוגמאות אימון רבות כדי לזקק את 'הכוונה האמיתית' של משימה, ויוצרת הוראות שמשקפות בצורה מדויקת יותר את התפלגות הנתונים האמיתית.
בדיקת מועמדים במקביל: במקום לבדוק רעיון אחד בכל פעם, APO יוצרת ובודקת במקביל מספר מועמדים להנחיות כדי לזהות את המקסימום הגלובלי של האיכות.

למה APO יכול לשפר את איכות הכוונון

יש תפיסה מוטעית נפוצה שלפיה כוונון עדין תמיד מניב איכות טובה יותר מאשר הנחיות. במודלים מודרניים כמו Gemini Nano v3, הנדסת הנחיות יכולה להניב תוצאות משמעותיות גם בלי שימוש בטכניקות אחרות:

שמירה על יכולות כלליות: כוונון עדין ( PEFT/LoRA) גורם למשקלים של מודל להתמקד יתר על המידה בהתפלגות נתונים ספציפית. זה מוביל לעיתים קרובות ל'שכחה קטסטרופלית', שבה המודל משתפר בתחביר הספציפי שלכם אבל נחלש בלוגיקה ובבטיחות הכלליות. השיטה APO לא משנה את המשקלים, וכך משמרת את היכולות של מודל הבסיס.
מילוי הוראות וגילוי אסטרטגיות: Gemini Nano v3 עבר אימון קפדני כדי למלא הוראות מערכת מורכבות. ה-APO מנצל את זה כדי למצוא את מבנה ההוראות המדויק שפותח את היכולות הסמויות של המודל, ולעתים קרובות מגלה אסטרטגיות שמהנדסים אנושיים עשויים להתקשות למצוא.

כדי לאמת את הגישה הזו, ביצענו הערכה של APO בעומסי עבודה מגוונים בסביבת ייצור. האימות שלנו הראה שיפורים עקביים בדיוק של 5-8% במגוון תרחישי שימוש.בקרב תכונות רבות שמוטמעות במכשיר, APO סיפק שיפורים משמעותיים באיכות.

תרחיש לדוגמה	סוג המשימה	תיאור המשימה	מדד	שיפור APO
סיווג נושאים	סיווג הטקסט	סיווג כתבה לנושאים כמו פיננסים, ספורט וכו'	דיוק	עלייה של 5%
סיווג לפי כוונת המשתמש	סיווג הטקסט	סיווג שאילתה של שירות לקוחות לפי כוונות	דיוק	עלייה של 8.0%
תרגום של דף אינטרנט	תרגום טקסט	תרגום דף אינטרנט מאנגלית לשפה מקומית	BLEU	עלייה של 8.57%

תהליך עבודה חלק מקצה לקצה למפתחים

שמירה על יכולות כלליות: כוונון עדין ( PEFT/LoRA) גורם למשקלים של מודל להתמקד יתר על המידה בהתפלגות נתונים ספציפית. זה מוביל לעיתים קרובות ל'שכחה קטסטרופלית', שבה המודל משתפר בתחביר הספציפי שלכם אבל נחלש בלוגיקה ובבטיחות הכלליות. השיטה APO לא משנה את המשקלים, וכך משמרת את היכולות של מודל הבסיס.
מילוי הוראות וגילוי אסטרטגיות: Gemini Nano v3 עבר אימון קפדני כדי למלא הוראות מערכת מורכבות. ה-APO מנצל את זה כדי למצוא את מבנה ההוראות המדויק שפותח את היכולות הסמויות של המודל, ולעתים קרובות מגלה אסטרטגיות שמהנדסים אנושיים עשויים להתקשות למצוא.

סיכום

ההשקה של אופטימיזציה אוטומטית של הנחיות (APO) מסמנת נקודת מפנה בשימוש ב-AI גנרטיבי במכשיר. אנחנו מצמצמים את הפער בין מודלים בסיסיים לבין ביצועים ברמת מומחה, וכך מספקים למפתחים את הכלים לבניית אפליקציות לנייד שהן חזקות יותר. גם אם אתם רק מתחילים עם אופטימיזציה ללא נתונים או עוברים להגדרה של שיפורים מבוססי נתונים, עכשיו קל יותר להבין איך להגיע לאיכות גבוהה של אינטליגנציה במכשיר. אפשר להשיק היום את תרחישי השימוש במכשיר לייצור באמצעות Prompt API של ML Kit ואופטימיזציה אוטומטית של הנחיות ב-Vertex AI.

קישורים רלוונטיים:

נכתב על ידי:

Chetan Tekur

ניהול מוצרים

read_more הצגת הפרופיל
Chao Zhao

מהנדס תוכנה

read_more הצגת הפרופיל
Paul Zhou

מהנדס תוכנה בכיר

read_more הצגת הפרופיל
Caren Chang

מהנדס יחסי מפתחים

read_more הצגת הפרופיל

להמשך הקריאה

02 Apr 2026

02 Apr 2026

חדשות על מוצרים

השקה של Gemma 4 בתצוגה המקדימה למפתחים של AICore

arrow_forward

אנחנו ב-Google מחויבים להביא את מודלי ה-AI הכי משוכללים ישירות למכשירי Android שנמצאים בכיס שלכם. היום אנחנו שמחים להודיע על השקת המודל הפתוח המתקדם ביותר שלנו: Gemma 4.
Caren Chang, David Chou • משך הקריאה: 3 דקות
3 Authors

30 באוקטובר 2025

30 באוקטובר 2025

חדשות על מוצרים

‫ML Kit’s Prompt API: Unlock Custom On-Device Gemini Nano Experiences

arrow_forward

ה-AI מאפשר ליצור בקלות רבה יותר חוויות שימוש מותאמות אישית באפליקציות, שבהן התוכן מומר לפורמט המתאים למשתמשים. בעבר, אפשרנו למפתחים לשלב את Gemini Nano באמצעות ממשקי API של AI גנרטיבי ב-ML Kit, שמותאמים לתרחישי שימוש ספציפיים כמו סיכום ותיאור תמונות.
Caren Chang, Chengji Yan, Penny Li • משך הקריאה: 2 דקות
07 May 2026

07 May 2026

חדשות על מוצרים

מבט קדימה: הפיכת פרסום אפליקציות בטוחות למהיר וקל יותר

arrow_forward

הסביבה העסקית של הנייד מתפתחת כל הזמן, ומביאה איתה הזדמנויות חדשות וגם איומים חדשים. בעקבות השינויים האלה, אנחנו ב-Android וב-Google Play ממשיכים לפעול כדי להבטיח שמיליארדי משתמשים יוכלו להמשיך ליהנות מהאפליקציות שלהם בביטחון, ושהמפתחים יוכלו להמשיך לחדש.
Vijaya Kaza • משך הקריאה: 3 דקות
- #Android