瞭解支援的型號

對於行動和網路應用程式,您可以使用 Firebase AI Logic SDK 直接從應用程式與支援的Gemini模型Imagen模型互動。

Gemini 模型屬於多模態模型,因為能夠處理甚至生成多種模態,包括文字、程式碼、PDF、圖片、影片和音訊。Imagen 模型可根據文字提示生成圖片。

下表簡要概述 Firebase AI Logic 支援的型號,以及這些型號的最新穩定版名稱。這個表格也列出可用於原型設計用途的預先發布和實驗模型。

此外,請參閱常見問題,瞭解 Firebase AI Logic 支援和不支援的所有模型。

Gemini 個模型

模型 輸入 輸出 說明
Gemini 模型 (穩定版)
Gemini 2.5 Pro
gemini-2.5-pro
文字、程式碼、PDF、圖片、影片、音訊 文字、程式碼、JSON Google 最先進的推理模型,可以解決複雜問題。
Gemini 2.5 Flash
gemini-2.5-flash
文字、程式碼、PDF、圖片、影片、音訊 文字、程式碼、JSON 這個模型功能強大且全面,兼顧價格與效能。
Gemini 2.0 Flash
gemini-2.0-flash-001
文字、程式碼、PDF、圖片、影片、音訊 文字、程式碼、JSON 多模態模型,具備新一代功能和改良效能,包括速度更快、內建工具使用功能,以及支援 100 萬個詞元的脈絡窗口
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
文字、程式碼、PDF、圖片、影片、音訊 文字、程式碼、JSON 這是我們速度最快且最具成本效益的 Flash 模型。如果 1.5 Flash 使用者希望以相同的價格和速度獲得更優質的服務,可以選擇升級至 1.5 Pro。
Gemini 模型,提供預先發布版和實驗版 (僅建議用於原型設計)
Gemini 2.5 Flash‑Lite
gemini-2.5-flash-lite-preview-06-17
文字、程式碼、PDF、圖片、影片、音訊 文字、程式碼、JSON 我們表現最均衡的 Gemini 模型,專為低延遲應用場景設計。
Gemini 2.0 Flash Image Generation
gemini-2.0-flash-preview-image-generation
文字、程式碼、PDF、圖片、影片、音訊 圖片、文字和圖片 支援多模態輸入內容和圖片輸出的多模態模型。
Gemini 2.0 Flash Live 1
gemini-2.0-flash-live-preview-04-09
文字 (串流)、
音訊 (串流)
文字 (串流)、
音訊 (串流)
這個多模態模型支援多模態輸入和輸出內容的低延遲即時串流。

1 使用 Gemini Developer APIFirebase AI Logic SDK 時,不支援這項功能。

Imagen 個模型

模型 輸入 輸出 說明
Imagen 模型 (穩定版)
Imagen 3
imagen-3.0-generate-002
文字 圖片 根據自然語言文字提示生成逼真的高品質圖片
Imagen 3 Fast 2
imagen-3.0-fast-generate-001
文字 圖片 生成圖片,用於原型設計或低延遲應用場景
Imagen 模型,提供預先發布版和實驗版 (僅建議用於原型設計)
Imagen 4 2
imagen-4.0-generate-preview-06-06
文字 圖片 根據自然語言文字提示生成逼真的高品質圖片
Imagen 4 Fast 2
imagen-4.0-fast-generate-preview-06-06
文字 圖片 生成圖片,用於原型設計或低延遲應用場景
Imagen 4 Ultra 2
imagen-4.0-ultra-generate-preview-06-06
文字 圖片 根據自然語言文字提示生成逼真的高品質圖片

2 無論您如何存取 API,Gemini Developer API 都不支援 Imagen 模型。


本頁其餘部分將詳細說明 Firebase AI Logic 支援的機型。

如要查看舊款機型的詳細資訊,請前往本頁面底部的這個網頁



比較模式

每個模型的功能各不相同,可支援各種用途。請注意,本節中的每個表格都會說明搭配 Firebase AI Logic 使用時的各個模型。使用 SDK 時,可能無法存取每個模型提供的其他功能。

如果下列子章節沒有您要找的資訊,請參閱所選 API 供應商的文件,瞭解更多資訊:

支援的輸入和輸出

以下是使用 Firebase AI Logic 時,各模型支援的輸入和輸出類型

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash
圖像生成 </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen
輸入類型
文字
文字 (串流)
程式碼
文件
(PDF 或純文字)
圖片
影片
音訊
音訊 (串流)
輸出類型
文字
文字 (串流)
程式碼
結構化輸出內容
(例如 JSON)
圖片
音訊
音訊 (串流)

如要瞭解支援的檔案類型,請參閱「支援的輸入檔案和規定」。

支援的功能

以下是Firebase AI Logic搭配各模型時支援的功能:

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash
圖像生成 </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen
生成文字,可使用純文字或多模態輸入內容 交錯或做為圖片的一部分 僅限串流
生成圖片
(GeminiImagen)
生成音訊 僅限串流
產生結構化輸出內容
(例如 JSON)
分析文件
(PDF 或純文字)
分析圖片 (視覺)
分析影片 (視覺)
分析音訊 僅限串流
多輪對話
函式呼叫 (工具)
計算權杖
系統指示
雙向多模態串流

規格和限制

以下是使用 Firebase AI Logic 時,各模型適用的規格和限制:

屬性 <span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash
圖像生成 </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen
脈絡窗口 *
詞元總數上限
(輸入 + 輸出)
1,048,576 個權杖 1,048,576 個權杖 1,048,576 個權杖 1,048,576 個權杖 1,048,576 個權杖 32,768 個權杖 32,768 個權杖 480 個符記
輸出權杖限制 * 65,536 個符記 65,536 個符記 65,536 個符記 8,192 個權杖 8,192 個權杖 8,192 個權杖 8,192 個權杖 ---
知識截點日期 2025 年 1 月 2025 年 1 月 2025 年 1 月 2024 年 6 月 2024 年 6 月 2024 年 8 月 2024 年 8 月 ---
PDF (每個要求)
輸入 PDF 檔案數量上限
**
3,000 個檔案 3,000 個檔案 3,000 個檔案 3,000 個檔案 3,000 個檔案 3,000 個檔案 --- ---
每個輸入 PDF 檔案的頁數上限

**
1,000 頁 1,000 頁 1,000 頁 1,000 頁 1,000 頁 1,000 頁 --- ---
每個輸入 PDF 檔案的大小上限
50 MB 50 MB 50 MB 50 MB 50 MB 50 MB --- ---
圖片 (每次要求)

輸入圖片數量上限
3,000 張圖片 3,000 張圖片 3,000 張圖片 3,000 張圖片 3,000 張圖片 3,000 張圖片 --- ---
輸出圖片數量上限
--- --- --- --- --- 10 張圖片 --- 4 張圖片
每個輸入的 Base64 編碼圖片大小上限
7 MB 7 MB 7 MB 7 MB 7 MB 7 MB --- ---
影片 (單次要求)
輸入影片檔案數量上限
10 個檔案 10 個檔案 10 個檔案 10 個檔案 10 個檔案 10 個檔案 --- ---
所有輸入影片的長度上限
(僅限影格)
約 60 分鐘 約 60 分鐘 約 60 分鐘 約 60 分鐘 約 60 分鐘 約 60 分鐘 --- ---
所有輸入影片的長度上限
(影格 + 音訊)
約 45 分鐘 約 45 分鐘 約 45 分鐘 約 45 分鐘 約 45 分鐘 約 45 分鐘 --- ---
音訊 (依要求)
輸入音訊檔案數量上限
1 個檔案 1 個檔案 1 個檔案 1 個檔案 1 個檔案 1 個檔案 --- ---
輸出音訊檔案數量上限
--- --- --- --- --- --- --- ---
所有輸入音訊的長度上限
約 8.4 小時 約 8.4 小時 約 8.4 小時 約 8.4 小時 約 8.4 小時 約 8.4 小時 --- ---
所有輸出音訊的長度上限
--- --- --- --- --- --- --- ---

* 對於所有 Gemini 模型,一個權杖約等於 4 個字元,因此 100 個權杖約等於 60 到 80 個英文字。如果是 Gemini 模型,您可以使用 countTokens 判斷要求中的權杖總數。

** 系統會將 PDF 視為圖片,因此 PDF 的單一頁面會視為一張圖片。要求中的頁數上限取決於模型支援的圖片數量。

取得其他詳細資訊



模型版本管理和命名模式

模型提供穩定預先發布實驗版本。為方便起見,系統支援不含明確版本值的別名。

如要找出可在程式碼中使用的特定模型名稱,請參閱本頁面稍後的「可用模型名稱」一節。

版本類型 /
發布階段
說明 模型名稱模式
穩定版 穩定版將於發布日推出,並提供支援,可供正式環境使用。

穩定版模型通常會連同淘汰日期一起發布, 表示模型可用的最後一天。之後您就無法再存取該模型,Google 也不會再提供支援。

  • Gemini 2.5 models
    穩定版模型名稱沒有後置字元

    範例:gemini-2.5-pro

  • Gemini 2.0Imagen 模型
    穩定版模型名稱會附加特定三位數版本號碼

    示例:gemini-2.0-flash-001
    示例:imagen-3.0-generate-002

自動更新的穩定別名
(僅限 Gemini 2.0 模型)
自動更新的穩定別名一律指向該模型的最新穩定版本。 如果發布新的穩定版本,自動更新別名會自動指向該新穩定版本。

Gemini 2.0 模型專用
別名的模型名稱沒有後置字元

範例:gemini-2.0-flash

預覽 預覽版本提供新功能,但不穩定

這些模型建議用於實際工作環境,且設有更嚴格的速率限制,可能還會產生費用。

對於 Vertex AI Gemini API,2025 年 6 月後發布的預先發布模型通常需要將模型位置設為 global

預覽版本的模型名稱會附加 -preview,以及模型的發布日期 (-MM-DD)。

範例:gemini-2.5-flash-preview-04-17
(於 2025 年 4 月 17 日發布)

實驗功能 實驗版本具有新功能,但不穩定

這些模型建議用於實際工作環境,且附帶更嚴格的速率限制。實驗模型旨在收集意見回饋,並讓使用者試用最新功能。

對於 Vertex AI Gemini API,2025 年 6 月後發布的實驗模型需要將模型位置設為 global

實驗版本的模型名稱會附加 -exp,以及模型的發布日期 (-MM-DD)。

範例:gemini-2.5-pro-exp-03-25
(2025 年 3 月 25 日發布)

退休 已淘汰的版本已過淘汰日期,且已永久停用。

Google 不再提供已淘汰模型,也不再支援這些模型。如果要求參照已淘汰的模型 ID,通常會傳回 404 錯誤。

---



可用的模型名稱

模型名稱是您在模型初始化期間程式碼中加入的明確值。

透過程式列出所有可用模型

您可以使用 REST API 列出所有可用的模型名稱:

請注意,傳回的清單會包含 API 提供者支援的所有模型,但 Firebase AI Logic 僅支援本頁面所述的 GeminiImagen 模型。此外,請注意,自動更新的別名 (例如 gemini-2.0-flash) 不會列出,因為這是基礎模型的便利別名。

Gemini 個模型名稱

如需您平台適用的初始化範例,請參閱入門指南

如要進一步瞭解發布階段 (特別是使用案例和計費),請參閱模型版本控管和命名模式

Gemini 2.5 Pro 個模型名稱

模型名稱 說明 發布階段 發布日期 淘汰日期
gemini-2.5-pro 最新的 Gemini 2.5 Pro 穩定版 穩定 2025-06-17 不得早於 2026 年 6 月 17 日
gemini-2.5-pro-preview-06-05 預覽版本指向最新穩定版本的 Gemini 2.5 Pro
(目前為 gemini-2.5-pro)
預覽 2025-06-05 不得早於
2025 年 7 月 15 日
gemini-2.5-pro-preview-05-06 預先發布版指向最新穩定版 Gemini 2.5 Pro*
(目前為 gemini-2.5-pro)
預覽 2025-05-06 不得早於
2025 年 7 月 15 日
gemini-2.5-pro-preview-03-25 預先發布版指向最新穩定版 Gemini 2.5 Pro*
(目前為 gemini-2.5-pro)
預覽 2025-03-25 不得早於
2025 年 7 月 15 日

* 現有的 Gemini 2.5 Pro 模型搶先版將於 2025 年 6 月 19 日開始指向穩定版。

Gemini 2.5 Flash 個模型名稱

模型名稱 說明 發布階段 發布日期 淘汰日期
gemini-2.5-flash 最新的 Gemini 2.5 Flash 穩定版 穩定 2025-06-17 不得早於 2026 年 6 月 17 日
gemini-2.5-flash-preview-05-20 預覽版本指向最新穩定版本的 Gemini 2.5 Flash
(目前為 gemini-2.5-flash)
預覽 2025-05-20 不得早於
2025 年 7 月 15 日
gemini-2.5-flash-preview-04-17 預先發布版指向最新穩定版 Gemini 2.5 Flash*
(目前為 gemini-2.5-flash)
預覽 2025-04-17 不得早於
2025 年 7 月 15 日

* 現有的 Gemini 2.5 Flash 模型搶先版將於 2025 年 6 月 19 日開始指向穩定版。

Gemini 2.5 Flash‑Lite 個模型名稱

模型名稱 說明 發布階段 發布日期 淘汰日期
gemini-2.5-flash-lite-preview-06-17 Gemini 2.5 Flash‑Lite 的初始預覽版本 預覽 2025-06-17 待定

Gemini 2.0 Flash 個模型名稱

模型名稱 說明 發布階段 發布日期 淘汰日期
gemini-2.0-flash-001 最新的 Gemini 2.0 Flash 穩定版 穩定 2025-02-05 不得早於
2026 年 2 月 5 日
gemini-2.0-flash 自動更新的別名,指向 最新穩定版本的 Gemini 2.0 Flash
(目前為 gemini-2.0-flash-001)
穩定 2025-02-10 ---

Gemini 2.0 Flash‑Lite 個模型名稱

模型名稱 說明 發布階段 發布日期 淘汰日期
gemini-2.0-flash-lite-001 最新的 Gemini 2.0 Flash‑Lite 穩定版 穩定 2025-02-25 不得早於
2026 年 2 月 25 日
gemini-2.0-flash-lite 自動更新的別名,指向 最新穩定版本的 Gemini 2.0 Flash‑Lite
(目前為 gemini-2.0-flash-lite-001)
穩定 2025-02-25 ---

Gemini 2.0 Flash Image Generation 個模型名稱

模型名稱 說明 發布階段 發布日期 淘汰日期
gemini-2.0-flash-preview-image-generation 1 Gemini 2.0 Flash Image Generation」的預覽版本 預覽 2025-05-06 待定

Gemini 2.0 Flash Live 個模型名稱

只有在 Vertex AI Gemini API 是 API 供應商時,才能使用這項功能。

模型名稱 說明 發布階段 發布日期 淘汰日期
gemini-2.0-flash-live-preview-04-09 1 Gemini 2.0 Flash Live」的預覽版本 預覽 2025-04-09 待定

1 使用 Gemini Developer APIFirebase AI Logic SDK 時,不支援這項功能。

Imagen 個模型名稱

如需您平台適用的初始化範例,請參閱「使用 Imagen 生成圖片」指南。

如要進一步瞭解發布階段 (特別是使用案例和計費),請參閱模型版本控管和命名模式

Imagen 4 個模型名稱

模型名稱 說明 發布階段 發布日期 淘汰日期
imagen-4.0-generate-preview-06-06 2 Imagen 4」的預覽版本 預覽 2025-06-06 待定
imagen-4.0-generate-preview-05-20 2 Imagen 4」的預覽版本 預覽 2025-05-20 不得早於 2025 年 7 月 7 日

Imagen 4 Fast 個模型名稱

模型名稱 說明 發布階段 發布日期 淘汰日期
imagen-4.0-fast-generate-preview-06-06 2 Imagen 4 Fast」的預覽版本 預覽 2025-06-06 待定

Imagen 4 Ultra 個模型名稱

模型名稱 說明 發布階段 發布日期 淘汰日期
imagen-4.0-ultra-generate-preview-06-06 2 Imagen 4 Ultra」的預覽版本 預覽 2025-06-06 待定
imagen-4.0-ultra-generate-exp-05-20 2 實驗版 Imagen 4 Ultra 實驗功能 2025-05-20 不得早於 2025 年 7 月 7 日

Imagen 3 個模型名稱

模型名稱 說明 發布階段 發布日期 淘汰日期
imagen-3.0-generate-002 最新的 Imagen 3 穩定版 穩定 2025-01-23 不得早於 2026 年 1 月 23 日
imagen-3.0-generate-001 2 Imagen 3 的初始穩定版本 穩定 2024-07-31 不得早於 2025 年 7 月 31 日

Imagen 3 Fast 個模型名稱

模型名稱 說明 發布階段 發布日期 淘汰日期
imagen-3.0-fast-generate-001 2 Imagen 3 Fast 的初始穩定版本 穩定 2024-07-31 不得早於 2025 年 7 月 31 日

2 無論您如何存取 API,Gemini Developer API 均不支援。



支援的語言

Gemini

  • 所有 Gemini 模型都能理解並回覆下列語言:

    阿拉伯文 (ar)、孟加拉文 (bn)、保加利亞文 (bg)、 簡體中文和繁體中文 (zh)、克羅埃西亞文 (hr)、捷克文 (cs)、 丹麥文 (da)、荷蘭文 (nl)、英文 (en)、愛沙尼亞文 (et)、芬蘭文 (fi)、 法文 (fr)、德文 (de)、希臘文 (el)、希伯來文 (iw)、印地文 (hi)、匈牙利文 (hu)、 印尼文 (id)、義大利文 (it)、日文 (ja)、韓文 (ko)、拉脫維亞文 (lv)、 立陶宛文 (lt)、挪威文 (no)、波蘭文 (pl)、葡萄牙文 (pt)、羅馬尼亞文 (ro)、 俄文 (ru)、塞爾維亞文 (sr)、斯洛伐克文 (sk)、斯洛維尼亞文 (sl)、西班牙文 (es)、 史瓦希里文 (sw)、瑞典文 (sv)、泰文 (th)、土耳其文 (tr)、烏克蘭文 (uk)、 越南文 (vi)

  • Gemini 2.0 FlashGemini 1.5 ProGemini 1.5 Flash 模型可理解並回覆下列其他語言:

    南非文 (af)、阿姆哈拉文 (am)、阿薩姆文 (as)、亞塞拜然文 (az)、 白俄羅斯文 (be)、波士尼亞文 (bs)、加泰隆尼亞文 (ca)、宿霧文 (ceb)、科西嘉文 (co)、 威爾斯文 (cy)、迪維希文 (dv)、世界語 (eo)、巴斯克文 (eu)、波斯文 (fa)、 菲律賓文 (他加祿文) (fil)、弗里斯蘭文 (fy)、愛爾蘭文 (ga)、蘇格蘭蓋爾文 (gd)、 加利西亞文 (gl)、古吉拉特文 (gu)、豪薩文 (ha)、夏威夷文 (haw)、苗文 (hmn)、 海地克里奧文 (ht)、亞美尼亞文 (hy)、伊博文 (ig)、冰島文 (is)、爪哇文 (jv)、 喬治亞文 (ka)、哈薩克文 (kk)、高棉文 (km)、卡納達文 (kn)、克里奧文 (kri)、 庫德文 (ku)、吉爾吉斯文 (ky)、拉丁文 (la)、盧森堡文 (lb)、寮文 (lo)、 馬達加斯加文 (mg)、毛利文 (mi)、馬其頓文 (mk)、馬拉雅拉姆文 (ml)、蒙古文 (mn)、 曼尼普爾文 (mni-Mtei)、馬拉地文 (mr)、馬來文 (ms)、馬爾他文 (mt)、 緬甸文 (my)、尼泊爾文 (ne)、尼揚加文 (奇切瓦文) (ny)、 奧里亞文 (or)、旁遮普文 (pa)、巴什托文 (ps)、信德文 (sd)、 僧伽羅文 (si)、薩摩亞文 (sm)、修納文 (sn)、索馬利亞文 (so)、阿爾巴尼亞文 (sq)、 南索托文 (st)、巽他文 (su)、泰米爾文 (ta)、泰盧固文 (te)、塔吉克文 (tg)、 維吾爾文 (ug)、烏都文 (ur)、烏茲別克文 (uz)、科薩文 (xh)、意第緒文 (yi)、約魯巴文 (yo)、 祖魯文 (zu)

Imagen

  • 正式發布:英文

  • 預覽:簡體中文、繁體中文、北印度文、日文、韓文、葡萄牙文、西班牙文



舊款機型的相關資訊

Firebase AI Logic 支援舊版有效 Gemini 型號 (例如 Gemini 1.5 型號)。

Firebase AI Logic支援舊版 Imagen 型號 (例如 Imagen 2)。

模型 輸入 輸出 適合用途
Gemini 1.5 Pro
gemini-1.5-pro-002
文字、程式碼、PDF、圖片、影片、音訊 文字、程式碼、JSON 支援需要更多智慧的複雜推理工作; 200 萬個詞元的長脈絡
Gemini 1.5 Flash
gemini-1.5-flash-002
文字、程式碼、PDF、圖片、影片、音訊 文字、程式碼、JSON 可快速執行各種工作,且效能多元
Gemini 1.0 Pro Vision
gemini-1.0-pro-vision-001
文字、程式碼、PDF、圖片、影片 (僅限影格) 文字、程式碼 處理文字、圖片和影片,並生成文字或程式碼回覆。無法用於即時通訊。
Gemini 1.0 Pro
gemini-1.0-pro-002
文字、程式碼 文字、程式碼 自然語言工作、多輪文字和程式碼對話,以及程式碼生成



後續步驟

試用 Gemini API 的功能