สร้างรูปภาพโดยใช้ Imagen

Vertex AI in Firebase SDK จะช่วยให้คุณเข้าถึงโมเดล Imagen 3 (ผ่าน Imagen API) เพื่อให้คุณสร้างรูปภาพจากพรอมต์ข้อความได้ ความสามารถนี้ช่วยให้คุณทำสิ่งต่างๆ ได้ เช่น

สร้างรูปภาพจากพรอมต์ที่เขียนด้วยภาษาที่เป็นธรรมชาติ
สร้างรูปภาพในหลากหลายรูปแบบและสไตล์
แสดงผลข้อความในรูปภาพ

โปรดทราบว่า Vertex AI in Firebase ยังไม่รองรับฟีเจอร์บางอย่างที่พร้อมใช้งานสำหรับรุ่น Imagen ดูข้อมูลเพิ่มเติมในความสามารถและฟีเจอร์ที่รองรับในหน้านี้

ข้ามไปยังโค้ดสําหรับการป้อนข้อความเท่านั้น

ก่อนเริ่มต้น

หากยังไม่ได้ดำเนินการ ให้อ่านคู่มือเริ่มต้นใช้งาน ซึ่งอธิบายวิธีตั้งค่าโปรเจ็กต์ Firebase, เชื่อมต่อแอปกับ Firebase, เพิ่ม SDK, เริ่มต้นบริการ Vertex AI และสร้างอินสแตนซ์ ImagenModel

โปรดทราบว่าในการสร้างรูปภาพโดยใช้โมเดล Imagen ให้ทำดังนี้

ตรวจสอบว่าคุณใช้ไลบรารี Firebase เวอร์ชันเป็นอย่างน้อย
iOS+: v11.9.1+ | Android: v16.2.0+ (BoM: v33.10.0+) | เว็บ: v11.4.1+ | Flutter: v1.4.0+ (BoM: v3.8.0+)
สร้างอินสแตนซ์ ImagenModel (ไม่ใช่อินสแตนซ์ GenerativeModel)
ส่งพรอมต์ในการโทรหา generateImages() (ไม่ใช่ generateContent() หรือ generateContentStream())

การสร้าง ImagenModel และการใช้ generateImages() จะแสดงอยู่ในตัวอย่างในหน้านี้

รุ่นที่รองรับความสามารถนี้

โมเดล Imagen 3 รองรับการสร้างรูปภาพ โดยจะรองรับการสร้างรูปภาพตามรุ่น Gemini 2.0 ในเร็วๆ นี้

สร้างรูปภาพจากอินพุตที่เป็นข้อความเท่านั้น

คุณขอให้โมเดล Imagen สร้างรูปภาพได้โดยป้อนพรอมต์เป็นข้อความ คุณสามารถสร้างรูปภาพเดียวหรือรูปภาพหลายรูปก็ได้

สร้างรูปภาพ 1 รูปจากอินพุตที่เป็นข้อความเท่านั้น

โปรดอ่านส่วนก่อนเริ่มต้นของคู่มือนี้ให้เสร็จสิ้นก่อนลองใช้ตัวอย่างนี้

คุณสามารถขอให้โมเดล Imagen สร้างรูปภาพเดียวโดยป้อนพรอมต์เป็นข้อความ

ดูวิธีเลือกโมเดลและตำแหน่ง (ไม่บังคับ) ที่เหมาะสมกับกรณีการใช้งานและแอป

สร้างรูปภาพหลายรูปจากอินพุตที่เป็นข้อความเท่านั้น

โดยค่าเริ่มต้น โมเดล Imagen 3 จะสร้างรูปภาพเพียง 1 รูปต่อคำขอ อย่างไรก็ตาม คุณสามารถขอให้โมเดล Imagen สร้างรูปภาพหลายรูปต่อคำขอได้โดยระบุ generationConfig ในระหว่างการเริ่มต้นใช้งานโมเดล

ฟีเจอร์และข้อกำหนดที่รองรับ

โมเดล Imagen 3 มีฟีเจอร์มากมายที่เกี่ยวข้องกับการสร้างรูปภาพ ส่วนนี้จะอธิบายสิ่งที่รองรับเมื่อใช้รูปแบบกับ Vertex AI in Firebase

ความสามารถและฟีเจอร์ที่รองรับ

Vertex AI in Firebase รองรับฟีเจอร์เหล่านี้ของรุ่น Imagen 3

การสร้างผู้คนและใบหน้า (ในกรณีที่โปรเจ็กต์ Firebase ของคุณได้รับการอนุมัติจาก Google Cloud)
การสร้างข้อความภายในรูปภาพที่สร้างขึ้น
การเพิ่มลายน้ำลงในรูปภาพที่สร้างขึ้น
การกำหนดค่าพารามิเตอร์การสร้างรูปภาพ เช่น จำนวนรูปภาพที่สร้างขึ้น สัดส่วนภาพ และการใส่ลายน้ำ
การกำหนดค่าการตั้งค่าความปลอดภัย

Vertex AI in Firebaseไม่รองรับฟีเจอร์ขั้นสูงเหล่านี้ของรุ่น Imagen 3

โปรดทราบว่าฟีเจอร์ส่วนใหญ่เหล่านี้กำหนดให้ต้องอยู่ในรายชื่อผู้ใช้ที่ได้รับอนุมัติแม้ว่าจะใช้โมเดล Imagen ฝั่งเซิร์ฟเวอร์ก็ตาม

ฟีเจอร์แต่งภาพหรือดัดแปลงรูปภาพ ซึ่งรวมถึงการเพิ่มขนาดรูปภาพ
การรวมรูปภาพในคำขอไปยังโมเดล (เช่น สําหรับการเรียนรู้แบบจำนวนน้อย)
การยืนยันลายน้ำดิจิทัลโดยใช้ SDK
หากต้องการยืนยันว่ารูปภาพมีลายน้ำ คุณสามารถอัปโหลดรูปภาพไปยัง Vertex AI Studio โดยใช้แท็บสื่อ
การสร้าง"รูปภาพสด" จากข้อความ (การสร้าง MP4)
การสร้างรูปภาพโดยใช้สไตล์ที่กำหนดไว้ล่วงหน้า
การตั้งค่าภาษาของข้อความที่ป้อน
การเปิดใช้ includeSafetyAttributes ซึ่งหมายความว่าระบบจะแสดงผล safetyAttributes.categories และ safetyAttributes.scores ไม่ได้
การปิดใช้การเพิ่มประสิทธิภาพพรอมต์ (พารามิเตอร์ enhancePrompt) ซึ่งหมายความว่าเครื่องมือการเขียนพรอมต์ใหม่ตาม LLM จะเพิ่มรายละเอียดเพิ่มเติมลงในพรอมต์ที่ระบุโดยอัตโนมัติเสมอเพื่อให้ได้รูปภาพที่มีคุณภาพสูงขึ้นซึ่งสะท้อนถึงพรอมต์ที่ระบุได้ดีขึ้น
การเขียนรูปภาพที่สร้างขึ้นลงใน Google Cloud Storage โดยตรงโดยเป็นส่วนหนึ่งของคําตอบจากโมเดล (พารามิเตอร์ storageUri) แต่ระบบจะแสดงผลรูปภาพเป็นไบต์รูปภาพที่เข้ารหัสฐาน 64 ในการตอบกลับเสมอ
หากต้องการอัปโหลดรูปภาพที่สร้างขึ้นไปยัง Cloud Storage ให้ใช้ Cloud Storage for Firebase

ข้อกำหนดและข้อจำกัด

ขีดจํากัด (ต่อคําขอ)	Imagen 3	Imagen 3 Fast
จำนวนโทเค็นอินพุตสูงสุด	โทเค็น 480 รายการ	โทเค็น 480 รายการ
จํานวนรูปภาพเอาต์พุตสูงสุด	รูปภาพ 4 รูป	รูปภาพ 4 รูป
ความละเอียดรูปภาพเอาต์พุตที่รองรับ (พิกเซล)	1024x1024 พิกเซล (สัดส่วนภาพ 1:1) 896x1280 (สัดส่วนภาพ 3:4) 1280x896 (สัดส่วนภาพ 4:3) 768x1408 (สัดส่วนภาพ 9:16) 1408x768 (สัดส่วนภาพ 16:9)	1024x1024 พิกเซล (สัดส่วนภาพ 1:1) 896x1280 (สัดส่วนภาพ 3:4) 1280x896 (สัดส่วนภาพ 4:3) 768x1408 (สัดส่วนภาพ 9:16) 1408x768 (สัดส่วนภาพ 16:9)

คุณยังทำอะไรได้อีกบ้าง

เริ่มคิดเกี่ยวกับการเตรียมความพร้อมสําหรับเวอร์ชันที่ใช้งานจริง ซึ่งรวมถึงการตั้งค่า Firebase App Check เพื่อปกป้อง API ที่คุณใช้ในแอปจากการละเมิดโดยไคลเอ็นต์ที่ไม่ได้รับอนุญาต นอกจากนี้ โปรดอ่านรายการตรวจสอบเวอร์ชันที่ใช้งานจริง

ดูวิธีควบคุมการสร้างเนื้อหา

ทำความเข้าใจการออกแบบพรอมต์ ซึ่งรวมถึงแนวทางปฏิบัติแนะนำ กลยุทธ์ และตัวอย่างพรอมต์
กำหนดค่าพารามิเตอร์ของโมเดล Imagen เช่น สัดส่วนภาพ การสร้างบุคคล และการใส่ลายน้ำ
ใช้การตั้งค่าความปลอดภัยเพื่อปรับความเป็นไปได้ที่จะได้รับคำตอบที่อาจถือว่าอันตราย

ดูข้อมูลเพิ่มเติมเกี่ยวกับรูปแบบที่รองรับ

ดูข้อมูลเกี่ยวกับรูปแบบที่ใช้ได้กับกรณีการใช้งานต่างๆ รวมถึงโควต้าและราคา

แสดงความคิดเห็นเกี่ยวกับประสบการณ์การใช้งาน Vertex AI in Firebase