按一下 Gemini API 供應商,即可在這個頁面查看供應商專屬內容和程式碼。 |
速率限制 (通常稱為配額) 會控管您在指定時間範圍內可向 Gemini API 發出的要求數量。這些限制有助於確保公平使用、防止濫用,並為所有使用者維持系統效能。
使用 Firebase AI Logic 將要求傳送至 Gemini 和 Imagen 模型時,專案的速率限制取決於所選的「Gemini API」供應商。Firebase AI Logic 也提供設定「個別使用者」速率限制的方法。
查看 Gemini Developer API 的速率限制
速率限制 (配額) 的運作方式
速率限制 (配額) 的衡量標準有四個維度:
- 每分鐘要求數 (RPM)
- 每日要求數 (RPD)
- 每分鐘權杖數 (TPM)
- 每日權杖數 (TPD)
系統會根據各項限制評估您的用量,如果超出任何限制,就會觸發 429 配額超出錯誤。舉例來說,如果 RPM 限制為 20,即使您未超過 TPM 或其他限制,在一分鐘內提出 21 個要求仍會導致錯誤。
頻率限制適用於專案層級,且使用該 Firebase 專案的所有應用程式和 IP 位址均須遵守這些限制。
限制會因使用的特定模型而異,部分限制僅適用於特定模型。舉例來說,每分鐘圖像數 (IPM) 只會針對可生成圖像的模型 (Imagen 3) 計算,但概念上與 TPM 相似。
實驗和預先發布版模型的速率限制較嚴格。
要求提高速率限制
如果您是 Gemini Developer API 的「付費層級」使用者,可以要求提高速率限制。
設定「每位使用者」的速率限制
如要使用 Firebase AI Logic,專案必須啟用所選的Gemini API供應商,但您也需要啟用 Firebase AI Logic API,做為用戶端 SDK 和 Gemini API 供應商之間的閘道。在 Firebase 專案中首次設定 Firebase AI Logic 時,系統會為您啟用這項 API。
您可以將 Firebase AI Logic API 速率限制 (配額) 設為應用程式的「每位使用者」速率限制,特別是針對依賴 Firebase AI Logic 的 AI 功能。您應設定這項限制,以合理容納單一使用者存取 AI 功能,同時確保沒有任何單一使用者超出 Gemini API 供應商的限制 (所有使用者應共用這項限制)。
「每位使用者」速率限制的詳細資料
以下是 Firebase AI Logic API 速率限制 (配額) 的幾項重要細節,特別是每分鐘要求數 (RPM):
費用是根據「產生內容要求」計算,以每位使用者、每個區域每分鐘為單位,不會因模型而異。
這項限制適用於專案層級,以及使用該 Firebase 專案的所有應用程式和 IP 位址。
這項限制適用於來自任何 Firebase AI Logic SDK 的呼叫。
預設的頻率限制為每位使用者每分鐘 100 個要求。
請注意,您仍須考量 Gemini API 供應商的限制 (見上文), 這些限制的優先順序高於 Firebase AI Logic API。
調整「每位使用者」的速率限制
如要調整速率限制 (配額),您必須具備 serviceusage.quotas.update
權限,擁有者和編輯者角色預設具備這項權限。
如要編輯速率限制 (配額) 或申請提高配額,請按照下列步驟操作:
在 Google Cloud 控制台中,前往 Firebase AI Logic API 的頁面。
點選「管理」。
在頁面下方,按一下「配額與系統限制」分頁標籤。
篩選表格,顯示您感興趣的配額,例如功能 (產生內容的要求) 和區域。
舉例來說,如要查看在任何支援的亞洲區域中,產生內容要求的使用者配額,篩選器會類似於以下內容:
Generate content requests
+Dimension:region:asia
勾選感興趣配額左側的核取方塊。
在配額列的結尾,按一下
,然後選取「編輯配額」。在「Quota changes」(配額變更) 表單中執行下列操作:
在「New value」(新值) 欄位中輸入要增加的配額。
這項配額適用於專案層級,且使用同一項 Firebase 專案的所有應用程式和 IP 位址均須共用這項配額。
填妥表單中任何其他欄位,然後按一下「Done」(完成)。
按一下 [提交要求]。