สร้างรูปภาพโดยใช้ Imagen


Vertex AI in Firebase SDK จะช่วยให้คุณเข้าถึงโมเดล Imagen 3 (ผ่าน Imagen API) เพื่อให้คุณสร้างรูปภาพจากพรอมต์ข้อความได้ ความสามารถนี้ช่วยให้คุณทำสิ่งต่างๆ ได้ เช่น

  • สร้างรูปภาพจากพรอมต์ที่เขียนด้วยภาษาที่เป็นธรรมชาติ
  • สร้างรูปภาพในหลากหลายรูปแบบและสไตล์
  • แสดงผลข้อความในรูปภาพ

โปรดทราบว่า Vertex AI in Firebase ยังไม่รองรับฟีเจอร์บางอย่างที่พร้อมใช้งานสำหรับรุ่น Imagen ดูข้อมูลเพิ่มเติมในความสามารถและฟีเจอร์ที่รองรับในหน้านี้

ข้ามไปยังโค้ดสําหรับการป้อนเฉพาะข้อความ

ก่อนเริ่มต้น

ทําตามคู่มือการเริ่มต้นใช้งานให้เสร็จสมบูรณ์หากยังไม่ได้ดำเนินการ ซึ่งรวมถึงการตั้งค่าโปรเจ็กต์ Firebase, การเชื่อมต่อแอปกับ Firebase, การเพิ่ม SDK และเริ่มต้นบริการ Vertex AI ทั้งหมดนี้เป็นงานที่ต้องทําก่อนจึงจะส่งคําขอพรอมต์ไปยังโมเดล Imagen ได้โดยใช้ Vertex AI in Firebase SDK

โปรดทราบว่าในการสร้างรูปภาพโดยใช้โมเดล Imagen

  • ตรวจสอบว่าคุณใช้ไลบรารี Firebase เวอร์ชันต่อไปนี้เป็นอย่างน้อย
    iOS+: v11.9.1+ | Android: v16.2.0+ (BoM: v33.10.0+) | เว็บ: v11.4.1+ | Flutter: v1.4.0+ (BoM: v3.8.0+)

  • เริ่มต้น ImagenModel (ไม่ใช่ GenerativeModel)

  • ส่งพรอมต์ในการโทรหา generateImages() (ไม่ใช่ generateContent() หรือ generateContentStream())

ตัวอย่างการเริ่มต้น ImagenModel และการใช้ generateImages() แสดงอยู่ในหน้านี้

รุ่นที่รองรับความสามารถนี้

โมเดล Imagen 3 รองรับการสร้างรูปภาพ เราจะรองรับการสร้างรูปภาพตามรุ่น Gemini 2.0 ในเร็วๆ นี้

สร้างรูปภาพจากอินพุตที่เป็นข้อความเท่านั้น

คุณขอให้โมเดล Imagen สร้างรูปภาพได้โดยป้อนพรอมต์เป็นข้อความ คุณสามารถสร้างรูปภาพเดียวหรือรูปภาพหลายรูปก็ได้

สร้างรูปภาพ 1 รูปจากอินพุตที่เป็นข้อความเท่านั้น

โปรดอ่านส่วนก่อนเริ่มต้นของคู่มือนี้ให้เสร็จสิ้นก่อนลองใช้ตัวอย่างนี้

คุณสามารถขอให้โมเดล Imagen สร้างรูปภาพเดียวโดยป้อนพรอมต์เป็นข้อความ

ดูวิธีเลือกโมเดลและตำแหน่ง (ไม่บังคับ) ที่เหมาะสมกับกรณีการใช้งานและแอป

สร้างรูปภาพหลายรูปจากอินพุตที่เป็นข้อความเท่านั้น

โปรดอ่านส่วนก่อนเริ่มต้นของคู่มือนี้ให้เสร็จสิ้นก่อนลองใช้ตัวอย่างนี้

โดยค่าเริ่มต้น โมเดล Imagen 3 จะสร้างรูปภาพเพียง 1 รูปต่อคำขอ อย่างไรก็ตาม คุณสามารถขอให้โมเดล Imagen สร้างรูปภาพหลายรูปต่อคำขอได้โดยระบุ generationConfig ในระหว่างการเริ่มต้นใช้งานโมเดล

ดูวิธีเลือกโมเดลและตำแหน่ง (ไม่บังคับ) ที่เหมาะสมกับกรณีการใช้งานและแอป

ฟีเจอร์และข้อกำหนดที่รองรับ

โมเดล Imagen 3 มีฟีเจอร์มากมายที่เกี่ยวข้องกับการสร้างรูปภาพ ส่วนนี้จะอธิบายสิ่งที่รองรับเมื่อใช้โมเดลกับ Vertex AI in Firebase

ความสามารถและฟีเจอร์ที่รองรับ

Vertex AI in Firebase รองรับฟีเจอร์เหล่านี้ของรุ่น Imagen 3

Vertex AI in Firebaseไม่รองรับฟีเจอร์ขั้นสูงเหล่านี้ของรุ่น Imagen 3

โปรดทราบว่าฟีเจอร์ส่วนใหญ่เหล่านี้กำหนดให้ต้องอยู่ในรายชื่อผู้ใช้ที่ได้รับอนุมัติแม้ว่าจะใช้โมเดล Imagen ฝั่งเซิร์ฟเวอร์ก็ตาม

  • ฟีเจอร์แต่งภาพหรือดัดแปลงรูปภาพ ซึ่งรวมถึงการเพิ่มขนาดรูปภาพ

  • การรวมรูปภาพในคำขอไปยังโมเดล (เช่น สําหรับการเรียนรู้แบบตัวอย่างน้อย)

  • การยืนยันลายน้ำดิจิทัลโดยใช้ SDK
    หากต้องการยืนยันว่ารูปภาพมีลายน้ำ คุณสามารถอัปโหลดรูปภาพไปยัง Vertex AI Studio โดยใช้แท็บสื่อ

  • การสร้าง"ภาพเคลื่อนไหว" จากข้อความ (การสร้าง MP4)

  • การสร้างรูปภาพโดยใช้สไตล์ที่กำหนดไว้ล่วงหน้า

  • การตั้งค่าภาษาของข้อความที่ป้อน

  • การเปิดใช้ includeSafetyAttributes ซึ่งหมายความว่าระบบจะแสดงผล safetyAttributes.categories และ safetyAttributes.scores ไม่ได้

  • การปิดใช้การเพิ่มประสิทธิภาพพรอมต์ (พารามิเตอร์ enhancePrompt) ซึ่งหมายความว่าเครื่องมือการเขียนพรอมต์ใหม่ตาม LLM จะเพิ่มรายละเอียดเพิ่มเติมลงในพรอมต์ที่ระบุโดยอัตโนมัติเสมอเพื่อให้ได้รูปภาพที่มีคุณภาพสูงขึ้นซึ่งสะท้อนถึงพรอมต์ที่ระบุได้ดีขึ้น

  • การเขียนรูปภาพที่สร้างขึ้นลงใน Google Cloud Storage โดยตรงโดยเป็นส่วนหนึ่งของคําตอบจากโมเดล (พารามิเตอร์ storageUri) แต่ระบบจะแสดงผลรูปภาพเป็นไบต์รูปภาพที่เข้ารหัสฐาน 64 ในการตอบกลับเสมอ
    หากต้องการอัปโหลดรูปภาพที่สร้างขึ้นไปยัง Cloud Storage ให้ใช้ Cloud Storage for Firebase

ข้อกำหนดและข้อจำกัด

ขีดจํากัด (ต่อคําขอ) Imagen 3 Imagen 3 Fast
จำนวนโทเค็นอินพุตสูงสุด โทเค็น 480 รายการ โทเค็น 480 รายการ
จํานวนรูปภาพเอาต์พุตสูงสุด รูปภาพ 4 รูป รูปภาพ 4 รูป
ความละเอียดรูปภาพเอาต์พุตที่รองรับ (พิกเซล)
  • 1024x1024 พิกเซล (สัดส่วนภาพ 1:1)
  • 896x1280 (สัดส่วนภาพ 3:4)
  • 1280x896 (สัดส่วนภาพ 4:3)
  • 768x1408 (สัดส่วนภาพ 9:16)
  • 1408x768 (สัดส่วนภาพ 16:9)
  • 1024x1024 พิกเซล (สัดส่วนภาพ 1:1)
  • 896x1280 (สัดส่วนภาพ 3:4)
  • 1280x896 (สัดส่วนภาพ 4:3)
  • 768x1408 (สัดส่วนภาพ 9:16)
  • 1408x768 (สัดส่วนภาพ 16:9)

คุณยังทำอะไรได้อีกบ้าง

ดูวิธีควบคุมการสร้างเนื้อหา

ดูข้อมูลเพิ่มเติมเกี่ยวกับรูปแบบที่รองรับ

ดูข้อมูลเกี่ยวกับรูปแบบที่ใช้ได้กับกรณีการใช้งานต่างๆ รวมถึงโควต้าและราคา


แสดงความคิดเห็นเกี่ยวกับประสบการณ์การใช้งาน Vertex AI in Firebase