ข่าวสารผลิตภัณฑ์

การอนุมานแบบไฮบริดเวอร์ชันทดลองและโมเดล Gemini ใหม่สำหรับ Android

ใช้เวลาอ่าน 3 นาที
Thomas Ezan
วิศวกรอาวุโสด้านนักพัฒนาซอฟต์แวร์สัมพันธ์

หากคุณเป็นนักพัฒนาแอป Android ที่ต้องการใช้ฟีเจอร์ AI ที่เป็นนวัตกรรมใหม่ในแอป เราได้เปิดตัวการอัปเดตใหม่ที่มีประสิทธิภาพเมื่อเร็วๆ นี้ ดังนี้

  • การอนุมานแบบไฮบริด ซึ่งเป็น API ใหม่สำหรับ Firebase AI Logic เพื่อใช้ประโยชน์จากการอนุมานทั้งในอุปกรณ์และในระบบคลาวด์
  • รองรับโมเดล Gemini ใหม่ๆ รวมถึงโมเดล Nano Banana ล่าสุดสำหรับการสร้างรูปภาพ

ไปดูกันเลย

ทดลองใช้การอนุมานแบบไฮบริด

เราได้ใช้แนวทางการกำหนดเส้นทางตามกฎที่เรียบง่ายเป็นโซลูชันเริ่มต้นเพื่อให้คุณใช้การอนุมานทั้งในอุปกรณ์และในระบบคลาวด์ผ่าน API แบบรวมได้ด้วย Firebase API สำหรับการอนุมานแบบไฮบริด ใหม่ เราวางแผนที่จะมอบความสามารถในการกำหนดเส้นทางที่ซับซ้อนมากขึ้นในอนาคต

ซึ่งจะช่วยให้แอปของคุณสลับไปมาระหว่าง Gemini Nano ที่ทำงานในเครื่องบนอุปกรณ์กับโมเดล Gemini ที่โฮสต์ในระบบคลาวด์ได้อย่างรวดเร็ว การดำเนินการในอุปกรณ์ใช้ Prompt API ของ ML Kit การอนุมานในระบบคลาวด์รองรับโมเดล Gemini ทั้งหมดจาก Firebase AI Logic ทั้งใน Vertex AI และ Developer API

หากต้องการใช้ ให้เพิ่มการอ้างอิง firebase-ai-ondevice ลงในแอปพร้อมกับ Firebase AI Logic ดังนี้

dependencies {
 [...] 
 implementation("com.google.firebase:firebase-ai:17.10.1")
 implementation("com.google.firebase:firebase-ai-ondevice:16.0.0-beta01")
}

ในระหว่างการเริ่มต้น คุณจะสร้างอินสแตนซ์ GenerativeModel และกำหนดค่าด้วยโหมดการอนุมานที่เฉพาะเจาะจง เช่น PREFER_ON_DEVICE (จะกลับไปใช้คลาวด์หาก Gemini Nano ไม่พร้อมใช้งานในอุปกรณ์) หรือ PREFER_IN_CLOUD (จะกลับไปใช้การอนุมานในอุปกรณ์หากออฟไลน์)

val model = Firebase.ai(backend = GenerativeBackend.googleAI())
    .generativeModel(
        modelName = "gemini-3.1-flash-lite",
        onDeviceConfig = OnDeviceConfig(
           mode = InferenceMode.PREFER_ON_DEVICE
        )
    )

val response = model.generateContent(prompt)

API ของ Firebase สำหรับการอนุมานแบบไฮบริดสำหรับ Android ยังอยู่ในขั้นทดลอง เราขอแนะนำให้คุณลองใช้ในแอป โดยเฉพาะอย่างยิ่งหากคุณใช้ Firebase AI Logic อยู่แล้ว 

ปัจจุบัน โมเดลในอุปกรณ์มีความเชี่ยวชาญในการสร้างข้อความแบบเทิร์นเดียวโดยอิงตามข้อความหรืออินพุตรูปภาพ Bitmap เดียว ดูรายละเอียดเพิ่มเติมได้ที่ข้อจำกัด

เราเพิ่งเผยแพร่ตัวอย่างใหม่ในแคตตาล็อกตัวอย่าง AI ที่ใช้ประโยชน์จาก Firebase API สำหรับไฮบริด ซึ่งแสดงให้เห็นวิธีใช้ Firebase API สำหรับการอนุมานแบบไฮบริดเพื่อสร้างรีวิวตามหัวข้อที่เลือก 2-3 หัวข้อ แล้วแปลเป็นภาษาต่างๆ ดูโค้ดเพื่อดูการทำงานได้เลย

Hybrid_Inference-Inline-imagery.gif
ตัวอย่างการอนุมานแบบไฮบริดใหม่ที่ใช้งานจริง

ตัวอย่างการอนุมานแบบไฮบริดใหม่ที่ใช้งานจริง

ลองใช้โมเดลใหม่

ในส่วนของโมเดล Gemini ใหม่ เราได้เปิดตัวโมเดล 2 รายการที่เป็นประโยชน์อย่างยิ่งต่อผู้พัฒนา Android และผสานรวมเข้ากับแอปพลิเคชันของคุณได้ง่ายๆ ผ่าน Firebase AI Logic SDK

Nano Banana
เมื่อปีที่แล้ว เราได้เปิดตัว Nano Banana ซึ่งเป็นโมเดลการสร้างรูปภาพที่ล้ำสมัย และเมื่อไม่กี่สัปดาห์ก่อน เราได้เปิดตัวโมเดล Nana Banana ใหม่ 2 ตัว

Nano Banana Pro (รูปภาพ Gemini 3 Pro) ออกแบบมาเพื่อการผลิตชิ้นงานระดับมืออาชีพ และสามารถแสดงข้อความที่มีความเที่ยงตรงสูง แม้จะเป็นแบบอักษรเฉพาะหรือจำลองลายมือประเภทต่างๆ

Nano Banana 2 (Gemini 3.1 Flash Image) เป็นรุ่นที่มีประสิทธิภาพสูงเทียบเท่ากับ Nano Banana Pro โดยได้รับการเพิ่มประสิทธิภาพเพื่อความเร็วและกรณีการใช้งานที่มีปริมาณสูง โดยสามารถใช้กับกรณีการใช้งานที่หลากหลาย (อินโฟกราฟิก สติกเกอร์เสมือน ภาพประกอบตามบริบท ฯลฯ)  

โมเดล Nano Banana ใหม่ใช้ประโยชน์จากความรู้ในโลกแห่งความเป็นจริงและความสามารถในการให้เหตุผลเชิงลึกเพื่อสร้างรูปภาพที่แม่นยำและมีรายละเอียด

เราได้อัปเดตตัวอย่างเซลฟีมหัศจรรย์ (ใช้การสร้างรูปภาพเพื่อเปลี่ยนพื้นหลังของเซลฟี) ให้ใช้ Nano Banana 2 แล้ว ตอนนี้โมเดลการสร้างรูปภาพจะจัดการการแบ่งกลุ่มพื้นหลังโดยตรง ซึ่งทำให้การใช้งานง่ายขึ้นและช่วยให้ความสามารถในการสร้างรูปภาพที่ได้รับการปรับปรุงของ Nano Banana 2 โดดเด่นยิ่งขึ้น ดูการใช้งานจริงได้ที่นี่

magic_selfie.png
ตัวอย่างการใช้เซลฟีอัจฉริยะที่อัปเดตแล้วใช้ Nanobana 2 เพื่ออัปเดตพื้นหลังของเซลฟี

คุณใช้ฟีเจอร์นี้ได้ผ่าน Firebase AI Logic SDK อ่านข้อมูลเพิ่มเติมได้ในเอกสารประกอบของ Android

Gemini 3.1 Flash-Lite

นอกจากนี้ เรายังได้เปิดตัว Gemini 3.1 Flash-Lite ซึ่งเป็นเวอร์ชันใหม่ของตระกูล Gemini Flash-Lite โมเดล Gemini Flash-Lite ได้รับความนิยมเป็นพิเศษจากนักพัฒนาแอป Android เนื่องจากมีอัตราส่วนคุณภาพ/เวลาในการตอบสนองที่ดีและมีต้นทุนการอนุมานต่ำ นักพัฒนาแอป Android ใช้โมเดลนี้สำหรับกรณีการใช้งานต่างๆ เช่น การแปลข้อความในแอปหรือการสร้างสูตรอาหารจากรูปภาพของอาหาร  

Gemini 3.1 Flash-Lite ซึ่งปัจจุบันอยู่ในเวอร์ชันตัวอย่างจะช่วยให้ใช้กรณีการใช้งานขั้นสูงได้มากขึ้นโดยมีเวลาในการตอบสนองเทียบเท่ากับ Gemini 2.5 Flash-Lite

ดูข้อมูลเพิ่มเติมเกี่ยวกับโมเดลนี้ได้ที่เอกสารประกอบของ Firebase

สรุป

ตอนนี้เป็นเวลาที่เหมาะในการสำรวจตัวอย่างไฮบริดใหม่ในแคตตาล็อกของเราเพื่อดูความสามารถเหล่านี้ในการทำงาน และทำความเข้าใจประโยชน์ของการกำหนดเส้นทางระหว่างการอนุมานในอุปกรณ์และการอนุมานบนระบบคลาวด์ นอกจากนี้ เราขอแนะนำให้คุณดูเอกสารประกอบเพื่อทดสอบโมเดลใหม่ของ Gemini

เขียนโดย

อ่านต่อ