ข่าวสารผลิตภัณฑ์

Prompt API ของ ML Kit: ปลดล็อกประสบการณ์การใช้งาน Gemini Nano ในอุปกรณ์ที่กำหนดเอง

ใช้เวลาอ่าน 2 นาที
3 ผู้เขียน
Caren Chang, Chengji Yan, Penny Li

AI ช่วยให้การสร้างประสบการณ์การใช้งานแอปที่ปรับเปลี่ยนในแบบของคุณง่ายขึ้น ซึ่งจะแปลงเนื้อหาเป็นรูปแบบที่เหมาะสมสำหรับผู้ใช้ ก่อนหน้านี้เราได้เปิดให้ผู้พัฒนาผสานรวมกับ Gemini Nano ผ่าน ML Kit GenAI API ที่ปรับแต่งมาสำหรับ Use Case ที่เฉพาะเจาะจง เช่น การสรุปและคำอธิบายรูปภาพ

วันนี้เป็นก้าวสำคัญของ Generative AI ในอุปกรณ์ของ Android เราขอประกาศการเปิดตัว API พรอมต์ GenAI ของ ML Kit เวอร์ชันอัลฟ่า API นี้ช่วยให้คุณส่งคำขอภาษาธรรมชาติและคำขอแบบมัลติโมดัลไปยัง Gemini Nano ได้ ซึ่งตอบสนองความต้องการในการควบคุมและความยืดหยุ่นที่มากขึ้นเมื่อสร้างด้วยโมเดล Generative

พาร์ทเนอร์อย่าง Kakao กำลังสร้างแอปด้วย Prompt API เพื่อสร้างประสบการณ์ที่ไม่เหมือนใครซึ่งส่งผลกระทบต่อโลกแห่งความเป็นจริง คุณทดลองใช้ฟีเจอร์ที่มีประสิทธิภาพของ Prompt API ได้แล้ววันนี้ด้วยโค้ดเพียงเล็กน้อย

 

 

ก้าวข้าม GenAI ในอุปกรณ์ที่สร้างไว้ล่วงหน้าไปสู่ GenAI ในอุปกรณ์ที่กำหนดเอง

Prompt API ไม่ได้จำกัดอยู่แค่ฟังก์ชันการทำงานที่สร้างไว้ล่วงหน้า แต่ยังรองรับกรณีการใช้งาน GenAI ที่กำหนดเองและเฉพาะแอป ซึ่งช่วยให้คุณสร้างฟีเจอร์ที่ไม่ซ้ำใครด้วยการเปลี่ยนรูปแบบข้อมูลที่ซับซ้อนได้ Prompt API ใช้ Gemini Nano ในอุปกรณ์เพื่อประมวลผลข้อมูลในเครื่อง ซึ่งช่วยให้ใช้ฟีเจอร์แบบออฟไลน์และปรับปรุงความเป็นส่วนตัวของผู้ใช้ได้

กรณีการใช้งานหลักสำหรับ Prompt API

Prompt API ช่วยให้ใช้ GenAI ได้อย่างปรับแต่งสูง ตัวอย่างที่แนะนำมีดังนี้ 

  • การทำความเข้าใจรูปภาพ: วิเคราะห์รูปภาพเพื่อการจัดประเภท (เช่น การสร้างโพสต์โซเชียลมีเดียฉบับร่างหรือการระบุแท็ก เช่น "สัตว์เลี้ยง" "อาหาร" หรือ "การเดินทาง")
  • การสแกนเอกสารอัจฉริยะ: ใช้โมเดล ML แบบดั้งเดิมเพื่อดึงข้อความจากใบเสร็จ แล้วจัดหมวดหมู่แต่ละรายการด้วย Prompt API
  • การเปลี่ยนรูปแบบข้อมูลสำหรับ UI: การวิเคราะห์เนื้อหาแบบยาวเพื่อสร้างชื่อการแจ้งเตือนแบบสั้นที่น่าสนใจ
  • การแจ้งเตือนเนื้อหา: แนะนำหัวข้อสำหรับบันทึกประจำวันใหม่โดยอิงตามค่ากำหนดของผู้ใช้สำหรับธีม
  • การวิเคราะห์เนื้อหา: จัดประเภทรีวิวของลูกค้าเป็นหมวดหมู่เชิงบวก กลาง หรือเชิงลบ
  • การดึงข้อมูล: ดึงรายละเอียดสำคัญเกี่ยวกับกิจกรรมที่กำลังจะจัดขึ้นจากชุดข้อความอีเมล

การใช้งาน
Prompt API ช่วยให้คุณสร้างพรอมต์ที่กำหนดเองและตั้งค่าพารามิเตอร์การสร้างที่ไม่บังคับได้ด้วยโค้ดเพียงไม่กี่บรรทัด

Generation.getClient().generateContent(
   generateContentRequest(
       ImagePart(bitmapImage),
       TextPart("Categorize this image as one of the following: car, motorcycle, bike, scooter, other. Return only the category as the response."),
   ) {
       // Optional parameters
       temperature = 0.2f
       topK = 10
       candidateCount = 1
       maxOutputTokens = 10
   },
)

ดูตัวอย่างการใช้งาน Prompt API โดยละเอียดเพิ่มเติมได้ในเอกสารประกอบอย่างเป็นทางการและตัวอย่างใน Github

Gemini Nano, ประสิทธิภาพ และการสร้างต้นแบบ

ปัจจุบัน Prompt API ทำงานได้ดีที่สุดในอุปกรณ์ Pixel 10 Series ซึ่งใช้ Gemini Nano เวอร์ชันล่าสุด (nano-v3) Gemini Nano เวอร์ชันนี้สร้างขึ้นบนสถาปัตยกรรมเดียวกันกับ Gemma 3n ซึ่งเป็นโมเดลที่เราแชร์กับชุมชนโมเดลแบบเปิดเป็นครั้งแรกที่ I/O

พื้นฐานที่ใช้ร่วมกันระหว่าง Gemma 3n กับ nano-v3 ช่วยให้นักพัฒนาแอปสร้างต้นแบบฟีเจอร์ได้ง่ายขึ้น สำหรับผู้ที่ไม่มีอุปกรณ์ Pixel 10 คุณสามารถเริ่มทดลองใช้พรอมต์ได้แล้ววันนี้โดยการสร้างต้นแบบด้วย Gemma 3n ในเครื่อง

ดูรายการอุปกรณ์ทั้งหมดที่รองรับ GenAI API ได้ในเอกสารประกอบเกี่ยวกับการรองรับอุปกรณ์

ดูข้อมูลเพิ่มเติม

เริ่มใช้ Prompt API ในแอป Android ได้ตั้งแต่วันนี้โดยดูคำแนะนำจากเอกสารประกอบอย่างเป็นทางการและตัวอย่างใน Github

เขียนโดย

อ่านต่อ