モバイルアプリとウェブアプリの場合、Firebase AI Logic SDK を使用すると、アプリからサポートされている Gemini モデルと Imagen モデルを直接操作できます。
Gemini モデルは、テキスト、コード、PDF、画像、動画、音声など、複数のモダリティを処理し、生成することもできるため、マルチモーダルと見なされます。Imagen モデルは、テキストでプロンプトを指定して画像を生成できます。
また、Firebase AI Logic がサポートしているモデルとサポートしていないモデルに関するよくある質問もご覧ください。
汎用モデル
Gemini 3 Pro
gemini-3-pro-preview
マルチモーダル理解に最適なモデルであり、Google 史上最も強力なエージェント型モデルであり、バイブ コーディング モデルでもあります。最先端の推論技術を基盤として構築されており、より充実したビジュアルとより深いインタラクティビティを実現します。
Gemini 3 Flash
gemini-3-flash-preview
速度、効率、費用対効果を重視して構築された、最もインテリジェントなモデル。推論が改善され、日常的なタスクをこなせるだけでなく、最も複雑なエージェント ワークフローにも対応できます。
Gemini 2.5 Pro
gemini-2.5-pro
コード、数学、STEM の複雑な問題を推論し、長いコンテキストを使用して大規模なデータセット、コードベース、ドキュメントを分析できる最先端の思考モデル。
Gemini 2.5 Flash
gemini-2.5-flash
バランスの取れた機能を提供する、価格とパフォーマンスの面で最適なモデル。2.5 Flash は、大規模な処理、低レイテンシ、思考を必要とする大量のタスク、エージェントのユースケースに最適です。
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
費用対効果と高スループット向けに最適化された、最も高速な Flash モデル。
画像生成モデル
画像は Gemini モデルまたは Imagen モデルで生成できます。
Gemini
Gemini 3 Pro Image(別名: nano banana pro)
gemini-3-pro-image-preview
プロフェッショナルなアセット制作と複雑な指示に対応するように設計されています。Google 検索を使用した現実世界のグラウンディング、生成前に構成を調整するデフォルトの「思考」プロセス、最大 4K 解像度の画像を生成できる機能が搭載されています。
Gemini 2.5 Flash Image(別名 nano banana)
gemini-2.5-flash-image
速度と効率性を重視した設計。大容量で低レイテンシのタスク向けに最適化されており、1024 ピクセルの解像度で画像を生成します。
Imagen
Imagen 4
imagen-4.0-generate-001
自然言語テキスト プロンプトからリアルで高品質な画像を生成します。
Imagen 4 Fast
imagen-4.0-fast-generate-001
プロトタイピングや低レイテンシのユースケース用の画像を生成します。
Imagen 4 Ultra
imagen-4.0-ultra-generate-001
自然言語テキスト プロンプトからリアルで高品質な画像を生成します。
音声生成モデル
Gemini Live API をサポートするモデルを使用して、ストリーミング音声生成できます。
Gemini 2.5 Flash と Gemini Live API のネイティブ音声
Gemini Developer API: gemini-2.5-flash-native-audio-preview-12-2025
Vertex AI Gemini API: gemini-live-2.5-flash-native-audio
双方向の Gemini モデルとの音声と動画によるやり取りを低レイテンシかつリアルタイムで行うことができます。
以前の世代のモデル
以下は現行モデルですが、旧世代のモデルです。可能であれば、代わりに最新のモデルのいずれかを使用することをおすすめします。
Gemini モデル
Gemini 2.0 Flash
gemini-2.0-flash-001
100 万トークンのコンテキスト ウィンドウを備えた第 2 世代の主力モデル。優れたスピードやネイティブ ツールの使用など、次世代の機能と強化された機能を提供します。
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
100 万トークンのコンテキスト ウィンドウを備えた第 2 世代の小型主力モデル。費用対効果と低レイテンシを重視して最適化されています。
このページの残りの部分では、Firebase AI Logic でサポートされているモデルについて詳しく説明します。
-
- サポートされている入出力
- サポートされている機能の概要の比較
- 仕様と制限事項(入力トークンの最大数や入力動画の最大長など)
モデルのバージョン管理方法(特に、安定版、自動更新版、プレビュー版、試験運用版)の説明
初期化時にコードに含める使用可能なモデル名のリスト
モデルのサポートされている言語のリスト
このページの下部で、以前の世代のモデルの詳細情報を確認できます。
モデルの比較
各モデルには、さまざまなユースケースに対応するための異なる機能が備わっています。このセクションの各表では、各モデルを Firebase AI Logic と組み合わせて使用する場合について説明します。各モデルには、SDK を使用する際には利用できない追加機能がある場合があります。
次のサブセクションでお探しの情報が見つからない場合は、選択した API プロバイダのドキュメントで詳細を確認してください。
Gemini Developer API: Gemini モデルと Imagen モデル
Vertex AI Gemini API: Gemini モデルと Imagen モデル
サポートされている入出力
Firebase AI Logic で各モデルを使用する場合、サポートされている入出力の型は次のとおりです。
|
<span="notranslate">Gemini 3 Pro、Flash </span="notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro、Flash、Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Live *** </span="notranslate"> |
Imagen(生成) | Imagen(機能) | |
|---|---|---|---|---|---|---|---|
| 入力値の型 | |||||||
| テキスト | (ストリーミング) | ||||||
| コード | |||||||
| ドキュメント (PDF または書式なしテキスト) |
|||||||
| 画像 | |||||||
| 動画 | (ストリーミング) | ||||||
| 音声 | (ストリーミング) | ||||||
| 出力タイプ | |||||||
| テキスト | |||||||
| テキスト(ストリーミング) | (文字起こし) | ||||||
| コード | |||||||
| 構造化出力 (JSON など) |
|||||||
| 画像 | |||||||
| 音声 | (ストリーミング) | ||||||
サポートされているファイル形式については、サポートされている入力ファイルと要件をご覧ください。
サポートされている機能
Firebase AI Logic で各モデルを使用する場合にサポートされる機能は次のとおりです。
|
<span="notranslate">Gemini 3 Pro、Flash </span="notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro、Flash、Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Live *** </span="notranslate"> |
Imagen(生成) | Imagen(機能) | |
|---|---|---|---|---|---|---|---|
| 思考 | |||||||
| テキストのみの入力またはマルチモーダル入力からテキストを生成する | インターリーブまたは画像の一部として | インターリーブまたは画像の一部として | 文字起こしのみ | ||||
|
画像を生成する (Gemini または Imagen) |
|||||||
|
画像を編集する (Gemini または Imagen) |
|||||||
| 音声を生成する | ストリーミングのみ | ||||||
|
構造化出力
(JSON など)を生成する |
|||||||
|
ドキュメントを分析する
(PDF またはプレーン テキスト) |
|||||||
| 画像を分析する(vision) | |||||||
| 動画を分析する(ビジョン) | ストリーミングのみ | ||||||
| 音声を分析する | ストリーミングのみ | ||||||
| マルチターン チャット | ストリーミングのみ | ||||||
| 双方向マルチモーダル ストリーミング | |||||||
| 関数呼び出し | |||||||
| コードの実行 | |||||||
| Google 検索によるグラウンディング | |||||||
| システム指示 | |||||||
| トークンのカウント |
仕様と制限事項
Firebase AI Logic で各モデルを使用する場合の仕様と制限事項は次のとおりです。
| プロパティ |
<span="notranslate">Gemini 3 Pro、Flash </span="notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro、Flash、Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Live *** </span="notranslate"> |
Imagen(生成) | Imagen(機能) |
|---|---|---|---|---|---|---|---|
| 入力トークンの上限* | 1,048,576 個のトークン | 65,536 個のトークン | 1,048,576 個のトークン | 32,768 トークン | 32,000(デフォルト、128,000 にアップグレード可能)トークン | 480 トークン | 480 トークン |
| 出力トークンの上限 * | 65,536 個のトークン | 32,768 トークン | 65,536 個のトークン | 8,192 個のトークン | 64K トークン | --- | --- |
| ナレッジ カットオフ日 | 2025 年 1 月 | 2025 年 1 月 | 2025 年 1 月 | June 2025 | 2025 年 1 月 | --- | --- |
| PDF(リクエストごと) | |||||||
| 入力 PDF ファイルの最大数 ** |
900 ファイル | 14 ファイル | 3,000 ファイル | 3 ファイル | --- | --- | --- |
| 入力 PDF ファイルあたりの最大ページ数 ** |
900 ページ | 14 ページ | 1,000 ページ | 3 ページ | --- | --- | --- |
| 入力 PDF ファイルあたりの最大サイズ |
50 MB | 50 MB | 50 MB | 50 MB | --- | --- | --- |
| 画像(リクエストあたり) | |||||||
| 入力画像の最大数 |
1,000 個の画像 | 画像 14 枚 | 3,000 個の画像 | 画像 3 枚 | --- | --- | 4 枚 |
| 出力画像の最大数 |
--- | 10 枚の画像 | --- | 10 枚の画像 | --- | 4 枚 | 4 枚 |
| 入力された base64 エンコード画像の最大サイズ |
7 MB | 7 MB | 7 MB | 7 MB | --- | --- | --- |
| 動画(リクエストごと) | |||||||
| 入力動画ファイルの最大数 |
10 ファイル | --- | 10 ファイル | --- | --- | --- | --- |
| すべての入力動画の最大長 (フレームのみ) |
~ 60 分 | --- | ~ 60 分 | --- | --- | --- | --- |
| すべての入力動画 (フレーム + 音声)の最大長 |
45 分程度 | --- | 45 分程度 | --- | --- | --- | --- |
| 音声(リクエストごと) | |||||||
| 入力音声ファイルの最大数 |
1 個のファイル | --- | 1 個のファイル | --- | --- | --- | --- |
| 出力音声ファイルの最大数 |
--- | --- | --- | --- | --- | --- | --- |
| すべての入力音声の最大長 |
約 8.4 時間 | --- | 約 8.4 時間 | --- | --- | --- | --- |
| すべての出力音声の最大長 |
--- | --- | --- | --- | --- | --- | --- |
*
すべての Gemini モデルでは、1 つのトークンは約 4 文字に相当するため、100 トークンは約 60 ~ 80 語の英単語に相当します。Gemini モデルの場合、countTokens を使用して、リクエスト内のトークンの合計数を特定できます。
** PDF は画像として扱われるため、PDF の 1 ページは 1 つの画像として扱われます。リクエストで許可されるページ数は、モデルがサポートできる画像の数に制限されます。
*** Gemini 2.5 Flash-Live モデルは、Gemini Live API をサポートするネイティブ音声モデルです。
詳細情報を確認する
サポートされている入力ファイル形式、MIME タイプの指定方法、入力ファイルとマルチモーダル リクエストが サポートされている入力ファイルと要件の要件を満たし、ベスト プラクティスに準拠していることを確認する方法について説明します。
モデルのバージョニングと命名パターン
モデルは、安定版、プレビュー版、試験運用版で提供されます。便宜上、明示的なバージョン値のないエイリアスがサポートされています。
コードで使用する特定のモデル名については、このページの後半の「使用可能なモデル名」セクションをご覧ください。
| バージョンの種類 / リリース ステージ |
説明 | モデル名のパターン | |
|---|---|---|---|
| Stable |
安定版は、リリース日から本番環境で使用でき、サポートされます。
|
|
|
| 自動更新される安定版エイリアス (Gemini 2.0 モデルのみ) |
自動更新安定版エイリアスは、常にそのモデルの最新の安定版バージョンを参照します。
|
Gemini 2.0 モデルのみ
例: |
|
| プレビュー |
プレビュー版には新しい機能が搭載されていますが、安定版ではありません。
|
プレビュー バージョンのモデル名には
例: |
|
| 試験運用版 |
試験運用バージョンには新しい機能が搭載されていますが、安定していないと見なされます。
|
試験運用版のモデル名には、モデルのリリース日(
例: |
|
| 退職 |
廃止されたバージョンは、廃止日を過ぎており、完全に無効になっています。
|
--- |
|
使用可能なモデル名
モデル名は、モデルの初期化時にコードに含める明示的な値です。
Gemini モデル名にジャンプ Imagen モデル名にジャンプ
使用可能なすべてのモデルをプログラムで一覧表示する
REST API を使用して、使用可能なすべてのモデル名を一覧表示できます。
Gemini Developer API:
models.listエンドポイントを呼び出します。Vertex AI Gemini API:
publishers.models.listエンドポイントを呼び出します。
返されるリストには、API プロバイダがサポートするすべてのモデルが含まれますが、Firebase AI Logic はこのページで説明する Gemini モデルと Imagen モデルのみをサポートします。また、自動更新エイリアス(gemini-2.0-flash など)は基本モデルの便利なエイリアスであるため、一覧表示されません。
Gemini モデル名
プラットフォームの初期化の例については、スタートガイドをご覧ください。
リリース ステージ(特にユースケース、課金、廃止)の詳細については、モデルのバージョン管理と命名パターンをご覧ください。
Gemini 3 Pro モデル名
Gemini API プロバイダに関係なく、従量課金制の Blaze 料金プランが必要です。
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
gemini-3-pro-preview |
Gemini 3 Pro のプレビュー版 | プレビュー | 2025-11-18 | 未定 |
Gemini 3 Flash モデル名
Gemini Developer API を使用している場合、従量課金制の Blaze 料金プランは不要です(通常、プレビュー モデルには有料プランが必要です)。
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
gemini-3-flash-preview |
Gemini 3 Flash のプレビュー版 | プレビュー | 2025-12-17 | 未定 |
Gemini 3 Pro Image モデル名(「nano banana pro」とも呼ばれます)
Gemini API プロバイダに関係なく、従量課金制の Blaze 料金プランが必要です。
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
gemini-3-pro-image-preview |
Gemini 3 Pro Image (「nano banana pro」)のプレビュー版 |
プレビュー | 2025-11-20 | 未定 |
Gemini 2.5 Pro モデル名
Gemini Developer API を使用している場合は、従量課金制の Blaze 料金プランは不要です。
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
gemini-2.5-pro |
Gemini 2.5 Pro の安定版 | Stable | 2025-06-17 | 2026 年 6 月 17 日以降 |
Gemini 2.5 Flash モデル名
Gemini Developer API を使用している場合は、従量課金制の Blaze 料金プランは不要です。
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
gemini-2.5-flash |
Gemini 2.5 Flash の安定版 | Stable | 2025-06-17 | 2026 年 6 月 17 日以降 |
Gemini 2.5 Flash‑Lite モデル名
Gemini Developer API を使用している場合は、従量課金制の Blaze 料金プランは不要です。
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
gemini-2.5-flash-lite |
Gemini 2.5 Flash‑Lite の安定版 | Stable | 2025-07-22 | 2026 年 7 月 22 日以降 |
Gemini 2.5 Flash Image モデル名(「nano banana」とも呼ばれます)
Gemini API プロバイダに関係なく、従量課金制の Blaze 料金プランが必要です。
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
gemini-2.5-flash-image |
Gemini 2.5 Flash Image(「nano banana」とも呼ばれます)の安定版 | Stable | 2025-10-02 | 2026 年 10 月 2 日以降 |
Gemini 2.5 Flash Live モデル名
Gemini Developer API を使用している場合は、従量課金制の Blaze 料金プランは不要です(通常、プレビュー モデルには有料プランが必要です)。
Gemini 2.5 Flash Live モデルは、Gemini Live API をサポートするネイティブ オーディオ モデルです。モデルには Gemini API プロバイダに応じて異なるモデル名が付けられていますが、モデルの動作と機能は同じです。
| Gemini Developer API モデル名 |
説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
gemini-2.5-flash-native-audio-preview-12-2025 1 |
Gemini Developer API の Live API の最新プレビュー バージョン | プレビュー | 2025-12-12 | 未定 |
gemini-2.5-flash-native-audio-preview-09-2025 1 |
Gemini Developer API の Live API の初期プレビュー バージョン | プレビュー | 2025-09-18 | 未定 |
| Vertex AI Gemini API モデル名 |
説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
gemini-live-2.5-flash-native-audio 2 |
Vertex AI Gemini API の Live API の安定版 | Stable | 2025-12-12 | 2026-12-12 以降 |
gemini-live-2.5-flash-preview-native-audio-09-2025 2 |
Vertex AI Gemini API の Live API のプレビュー版 | プレビュー | 2025-09-18 | 未定 |
1 Gemini Developer API でのみサポートされています。また、これらのモデルはプレビュー モデルですが、Gemini Developer API の「無料枠」で利用できます。
2 Vertex AI Gemini API でのみサポートされています。
また、これらのモデルは global ロケーションではサポートされていません。
Imagen モデル名
プラットフォームの初期化の例については、Imagen を使用して画像を生成するガイドをご覧ください。
リリース ステージ(特にユースケース、課金、廃止)の詳細については、モデルのバージョン管理と命名パターンをご覧ください。
Imagen 4 モデル名
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
imagen-4.0-generate-001 |
Imagen 4 の安定版 | Stable | 2025-08-14 | 2026 年 8 月 14 日以降 |
Imagen 4 Fast モデル名
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
imagen-4.0-fast-generate-001 |
Imagen 4 Fast の安定版 | Stable | 2025-08-14 | 2026 年 8 月 14 日以降 |
Imagen 4 Ultra モデル名
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
imagen-4.0-ultra-generate-001 |
Imagen 4 Ultra の安定版 | Stable | 2025-08-14 | 2026 年 8 月 14 日以降 |
Imagen 3 Capability モデル名
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
imagen-3.0-capability-001 2 |
Imagen 3 Capability の最初の安定版 | Stable | 2024-12-10 | 2025 年 12 月 10 日以降 |
2 アクセス方法に関係なく、Gemini Developer API ではサポートされていません。
サポートされている言語
Gemini
すべての Gemini モデルは、次の言語を理解して回答できます。
アラビア語(ar)、ベンガル語(bn)、ブルガリア語(bg)、中国語(簡体字、繁体字)(zh)、クロアチア語(hr)、チェコ語(cs)、デンマーク語(da)、オランダ語(nl)、英語(en)、エストニア語(et)、フィンランド語(fi)、フランス語(fr)、ドイツ語(de)、ギリシャ語(el)、ヘブライ語(iw)、ヒンディー語(hi)、ハンガリー語(hu)、インドネシア語(id)、イタリア語(it)、日本語(ja)、韓国語(ko)、ラトビア語(lv)、リトアニア語(lt)、ノルウェー語(no)、ポーランド語(pl)、ポルトガル語(pt)、ルーマニア語(ro)、ロシア語(ru)、セルビア語(sr)、スロバキア語(sk)、スロベニア語(sl)、スペイン語(es)、スワヒリ語(sw)、スウェーデン語(sv)、タイ語(th)、トルコ語(tr)、ウクライナ語(uk)、ベトナム語(vi)
Gemini 2.0 Flash、Gemini 1.5 Pro、Gemini 1.5 Flash モデルは、次の追加言語を理解して応答できます。
アフリカーンス語(af)、アムハラ語(am)、アッサム語(as)、アゼルバイジャン語(az)、ベラルーシ語(be)、ボスニア語(bs)、カタルーニャ語(ca)、セブアノ語(ceb)、コルシカ語(co)、ウェールズ語(cy)、ディベヒ語(dv)、エスペラント語(eo)、バスク語(eu)、ペルシア語(fa)、フィリピン語(タガログ語)(fil)、フリジア語(fy)、アイルランド語(ga)、スコットランド ゲール語(gd)、ガリシア語(gl)、グジャラート語(gu)、ハウサ語(ha)、ハワイ語(haw)、モン語(hmn)、クレオール語(ハイチ)(ht)、アルメニア語(hy)、イボ語(ig)、アイスランド語(is)、ジャワ語(jv)、ジョージア語(ka)、カザフ語(kk)、クメール語(km)、カンナダ語(kn)、クリオ語(kri)、クルド語(ku)、キルギス語(ky)、ラテン語(la)、ルクセンブルク語(lb)、ラオ語(lo)、マダガスカル語(mg)、マオリ語(mi)、マケドニア語(mk)、マラヤーラム語(ml)、モンゴル語(mn)、メイテイ語(マニプル語)(mni-Mtei)、マラーティー語(mr)、マレー語(ms)、マルタ語(mt)、ミャンマー語(ビルマ語)(my)、ネパール語(ne)、ニャンジャ語(チェワ語)(ny)、オディア語(オリヤー語)(or)、パンジャブ語(pa)、パシュトゥ語(ps)、シンド語(sd)、シンハラ語(si)、サモア語(sm)、ショナ語(sn)、ソマリ語(so)、アルバニア語(sq)、ソト語(st)、スンダ語(su)、タミル語(ta)、テルグ語(te)、タジク語(tg)、ウイグル語(ug)、ウルドゥー語(ur)、ウズベク語(uz)、コーサ語(xh)、イディッシュ語(yi)、ヨルバ語(yo)、ズールー語(zu)
Imagen
一般提供: 英語
プレビュー: 中国語(簡体)、中国語(繁体)、ヒンディー語、日本語、韓国語、ポルトガル語、スペイン語
以前のモデルに関する情報
以下は現行モデルですが、旧世代のモデルです。可能であれば、代わりに最新のモデルのいずれかを使用することをおすすめします。
Gemini 個のモデル
gemini-2.0-flash-001(および自動更新エイリアスgemini-2.0-flash)gemini-2.0-flash-lite-001(および自動更新エイリアスgemini-2.0-flash-lite)
以前の Gemini Live API モデルについては、Gemini API プロバイダのドキュメントをご覧ください。
Imagen 個のモデル
imagen-3.0-generate-002imagen-3.0-fast-generate-001
次のステップ
Gemini API の機能を試す
- マルチターン会話(チャット)を構築します。
- テキストのみのプロンプトからテキストを生成します。
- 画像、PDF、動画、音声など、さまざまなファイル形式でプロンプトを入力してテキストを生成します。
- テキスト プロンプトとマルチモーダル プロンプトの両方から構造化出力(JSON など)を生成します。
- テキスト プロンプトから画像を生成します(Gemini または Imagen)。
- Gemini Live API を使用したストリームの入出力(音声を含む)。
- 関数呼び出しや Google 検索によるグラウンディングなどのツールを使用して、Gemini モデルをアプリの他の部分や外部システム、情報に接続します。