Saiba mais sobre os modelos compatíveis

Para apps para dispositivos móveis e Web, os SDKs do Firebase AI Logic permitem interagir com os modelos Gemini e Imagen compatíveis diretamente do seu app.

Os modelos Gemini são considerados multimodais porque são capazes de processar e até gerar várias modalidades, incluindo texto, código, PDFs, imagens, vídeo e áudio. É possível pedir aos modelos Imagen para gerar imagens com texto.

Consulte também nossas perguntas frequentes sobre todos os modelos que o Firebase AI Logic aceita e não aceita.

Modelos de uso geral

Pular para comparações de modelos

NOSSO MODELO MAIS INTELIGENTE

gemini-3-pro-preview

Nosso melhor modelo para compreensão multimodal e o modelo de agentes e vibe coding mais avançado que já desenvolvemos até o momento, oferecendo recursos visuais mais ricos e interatividade mais profunda, tudo com base em um raciocínio de última geração. (faturamento obrigatório)

NOSSO MODELO MAIS RÁPIDO E INTELIGENTE

gemini-3-flash-preview

Nosso modelo mais inteligente, criado para velocidade, eficiência e custo. Ele permite realizar tarefas diárias com raciocínio aprimorado, além de lidar com os fluxos de trabalho agênticos mais complexos. (faturamento não obrigatório)


NOSSO MODELO DE RACIOCÍNIO AVANÇADO

gemini-2.5-pro

Nosso modelo de pensamento de última geração, capaz de resolver problemas complexos em programação, matemática e STEM, além de analisar grandes conjuntos de dados, bases de código e documentos usando contexto longo. (faturamento não obrigatório)

RÁPIDO E INTELIGENTE

gemini-2.5-flash

Nosso melhor modelo em termos de custo-benefício, com recursos completos. O 2.5 Flash é ideal para processamento em grande escala, tarefas de baixo volume, alta latência e que exigem raciocínio, além de casos de uso de agentes. (faturamento não obrigatório)

ULTRA FAST

gemini-2.5-flash-lite

Nosso modelo flash mais rápido, otimizado para eficiência de custo e alta capacidade de processamento. (faturamento não obrigatório)

Modelos de geração de imagens

Você pode gerar imagens com os modelos Gemini ou Imagen.

Pular para comparações de modelos

Gemini

gemini-3-pro-image-preview

Projetado para produção profissional de recursos e instruções complexas. Ele apresenta embasamento no mundo real usando a Pesquisa Google, um processo padrão de "Pensamento" que refina a composição antes da geração e pode gerar imagens de até 4K de resolução. (faturamento obrigatório)

gemini-2.5-flash-image

Projetado para velocidade e eficiência. Ele é otimizado para tarefas de alto volume e baixa latência e gera imagens com resolução de 1024 pixels. (faturamento obrigatório)

Imagen

imagen-4.0-generate-001

Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural. (faturamento obrigatório)

imagen-4.0-fast-generate-001

Gera imagens para prototipagem ou casos de uso de baixa latência. (faturamento obrigatório)

imagen-4.0-ultra-generate-001

Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural. (faturamento obrigatório)

Modelos de geração de áudio

É possível gerar áudio transmitido por streaming com modelos que oferecem suporte ao Gemini Live API.

Pular para comparações de modelos

API Gemini Developer: gemini-2.5-flash-native-audio-preview-12-2025

API Gemini da Vertex AI: gemini-live-2.5-flash-native-audio

Permite interações de voz e vídeo em tempo real e de baixa latência com um modelo do Gemini bidirecional. (faturamento não obrigatório)


O restante desta página oferece informações detalhadas sobre os modelos compatíveis com Firebase AI Logic.

  • Comparar modelos:

    • Entrada e saída compatíveis
    • Comparação de alto nível dos recursos compatíveis
    • Especificações e limitações, por exemplo, número máximo de tokens de entrada ou duração máxima do vídeo de entrada
  • Descrição de como os modelos são versionados, especificamente as versões estável, atualizada automaticamente, prévia e experimental

  • Listas de nomes de modelos disponíveis para incluir no código durante a inicialização

  • Listas de idiomas disponíveis para os modelos

Na parte de baixo desta página, você pode conferir informações detalhadas sobre modelos de geração anterior.



Comparação de modelos

Cada modelo tem recursos diferentes para oferecer suporte a vários casos de uso. Cada uma das tabelas nesta seção descreve cada modelo quando usado com Firebase AI Logic. Cada modelo pode ter outros recursos que não estão disponíveis ao usar nossos SDKs.

Se você não encontrar as informações que procura nas subseções a seguir, consulte a documentação do provedor de API escolhido para mais detalhes:

Entrada e saída compatíveis

Estes são os tipos de entrada e saída compatíveis ao usar cada modelo com Firebase AI Logic:

<span="notranslate">Gemini
3 Pro, Flash </span="notranslate">
<span="notranslate">Gemini
3 Pro
Imagem </span="notranslate">
<span="notranslate">Gemini
2.5 Pro, Flash, Flash-Lite </span="notranslate">
<span="notranslate">Imagem de flash do Gemini
2.5 
</span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Live *** </span="notranslate">
Imagen (gerar) Imagen (capacidade)
Tipos de entrada
Texto (streaming)
Código
Documentos
(PDFs ou texto simples)
Imagens
Vídeo (streaming)
Áudio (streaming)
Tipos de saída
Texto
Texto (streaming) (transcrição)
Código
Saída estruturada
(como JSON)
Imagens
Áudio (streaming)

Para saber mais sobre os tipos de arquivo compatíveis, consulte Arquivos de entrada e requisitos compatíveis.

Recursos e funcionalidades compatíveis

Estas são as funcionalidades e os recursos compatíveis ao usar cada modelo com Firebase AI Logic:

<span="notranslate">Gemini
3 Pro, Flash </span="notranslate">
<span="notranslate">Gemini
3 Pro
Imagem </span="notranslate">
<span="notranslate">Gemini
2.5 Pro, Flash, Flash-Lite </span="notranslate">
<span="notranslate">Imagem de flash do Gemini
2.5 
</span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Live *** </span="notranslate">
Imagen (gerar) Imagen (capacidade)
Pensamento
Gerar texto com base em entradas somente de texto ou multimodais intercalado ou como parte da imagem intercalado ou como parte da imagem somente transcrição
Gerar imagens
(Gemini ou Imagen)
Editar imagens
(Gemini ou Imagen)
Gerar áudio somente streaming
Gerar saída estruturada
(como JSON)
Analisar documentos
(PDFs ou texto simples)
Analisar imagens (visão)
Analisar vídeo (visão) somente streaming
Analisar áudio somente streaming
Chat multiturno somente streaming
Streaming multimodal bidirecional
Chamadas de função
Execução de código
Embasamento com a Pesquisa Google
Instruções do sistema
Contar tokens

Especificações e limitações

Estas são as especificações e limitações ao usar cada modelo com o Firebase AI Logic:

Propriedade <span="notranslate">Gemini
3 Pro, Flash </span="notranslate">
<span="notranslate">Gemini
3 Pro
Imagem </span="notranslate">
<span="notranslate">Gemini
2.5 Pro, Flash, Flash-Lite </span="notranslate">
<span="notranslate">Imagem de flash do Gemini
2.5 
</span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Live *** </span="notranslate">
Imagen (gerar) Imagen (capacidade)
Limite de token de entrada * 1.048.576 tokens 65.536 tokens 1.048.576 tokens 32.768 tokens 32 mil tokens (padrão; pode ser atualizado para 128 mil) 480 tokens 480 tokens
Limite de token de saída * 65.536 tokens 32.768 tokens 65.536 tokens 8.192 tokens 64 mil tokens --- ---
Data limite de conhecimento Janeiro de 2025 Janeiro de 2025 Janeiro de 2025 Junho de 2025 Janeiro de 2025 --- ---
PDFs (por solicitação)
Número máximo
de arquivos PDF de entrada **
900 arquivos 14 arquivos 3.000 arquivos 3 arquivos --- --- ---
Número máximo
de páginas
por arquivo PDF de entrada **
900 páginas 14 páginas 1.000 páginas 3 páginas --- --- ---
Tamanho máximo
por arquivo PDF de entrada
50 MB 50 MB 50 MB 50 MB --- --- ---
Imagens (por solicitação)
Número máximo
de imagens de entrada
1.000 imagens 14 imagens 3.000 imagens 3 imagens --- --- 4 imagens
Número máximo
de imagens de saída
--- 10 imagens --- 10 imagens --- 4 imagens 4 imagens
Tamanho máximo
por imagem codificada em base64 de entrada
7 MB 7 MB 7 MB 7 MB --- --- ---
Vídeo (por solicitação)
Número máximo
de arquivos de vídeo de entrada
10 arquivos --- 10 arquivos --- --- --- ---
Duração máxima
de todos os vídeos de entrada
(somente frames)
aproximadamente 60 minutos --- aproximadamente 60 minutos --- --- --- ---
Duração máxima
de todos os vídeos de entrada
(frames e áudio)
aproximadamente 45 minutos --- aproximadamente 45 minutos --- --- --- ---
Áudio (por solicitação)
Número máximo
de arquivos de áudio de entrada
1 arquivo --- 1 arquivo --- --- --- ---
Número máximo
de arquivos de áudio de saída
--- --- --- --- --- --- ---
Comprimento máximo
de todo o áudio de entrada
Cerca de 8,4 horas --- Cerca de 8,4 horas --- --- --- ---
Comprimento máximo
de todo o áudio de saída
--- --- --- --- --- --- ---

* Para todos os modelos Gemini, um token equivale a cerca de quatro caracteres, portanto, 100 tokens equivalem a cerca de 60 a 80 palavras em inglês. Para modelos Gemini, é possível determinar a contagem total de tokens nas solicitações usando countTokens.

** Os PDFs são tratados como imagens. Por isso, uma única página de um PDF é tratada como uma imagem. O número de páginas permitido em uma solicitação é limitado ao número de imagens que o modelo aceita.

*** Os modelos Gemini 2.5 Flash-Live são os modelos de áudio nativos que oferecem suporte ao Gemini Live API.

Encontrar mais informações detalhadas



Controle de versões e padrões de nomenclatura de modelos

Os modelos são oferecidos em versões estável, prévia e experimental. Para facilidade, aliases sem valores de versão explícitos são aceitos.

Para encontrar nomes de modelos específicos a serem usados no seu código, consulte a seção "nomes de modelos disponíveis" mais adiante nesta página.

Tipo de versão /
Etapa da versão
Descrição Padrão de nome do modelo
Estável As versões estáveis estão disponíveis e têm suporte para uso em produção a partir da data de lançamento.
  • Normalmente, uma versão estável de um modelo é lançada com uma data de desativação, que indica o último dia em que o modelo fica disponível. Depois dessa data, o modelo não estará mais acessível nem terá suporte do Google.
  • Modelos Gemini 2.5
    Os nomes de modelos de versões estáveis não têm sufixo

    Exemplo: gemini-2.5-pro

  • Modelos Gemini 2.0 e Imagen
    Os nomes de modelos de versões estáveis são anexados com um número de versão específico de três dígitos.

    Exemplo: gemini-2.0-flash-001
    Exemplo: imagen-3.0-generate-002

Alias estável atualizado automaticamente
(somente modelos Gemini 2.0)
Os aliases estáveis atualizados automaticamente sempre apontam para a versão mais recente estável desse modelo.
  • Se uma nova versão estável for lançada, o alias atualizado automaticamente começará a apontar para essa nova versão estável.

Somente modelos Gemini 2.0
Os nomes de modelos de aliases não têm sufixo

Exemplo: gemini-2.0-flash

Visualizar As versões de pré-lançamento têm novos recursos e são consideradas instáveis.
  • Esses modelos não são recomendados para uso em produção, vêm com limites de taxa mais restritivos e podem ter requisitos de faturamento.
  • Esses modelos são desativados algumas semanas ou meses após o lançamento da versão estável associada.
  • Para o Vertex AI Gemini API, os modelos de prévia lançados após junho de 2025 geralmente exigem que você defina o local do modelo como global.

Os nomes dos modelos de versões de prévia são anexados com -preview e geralmente a data de lançamento do modelo (-MM-DD para modelos mais antigos ou -MM-YYYY para modelos mais recentes)

Exemplos:
gemini-2.5-flash-preview-04-17
(lançado em 17 de abril de 2025)
ou
gemini-2.5-flash-preview-09-2025
(lançado em setembro de 2025)
ou
gemini-3-pro-preview
(lançado em novembro de 2025)

Experimental As versões experimentais têm novos recursos e são consideradas instáveis.
  • Esses modelos não são recomendados para uso em produção e têm limites de taxa mais restritivos. Os modelos experimentais são destinados a coletar feedback e permitir testes com nossos recursos mais recentes.
  • Esses modelos são desativados algumas semanas ou meses após o lançamento da versão estável associada.
  • Para o Vertex AI Gemini API, os modelos experimentais lançados depois de junho de 2025 exigem que você defina o local do modelo como global.

Os nomes de modelos de versões experimentais são anexados com -exp junto com a data de lançamento do modelo (-MM-DD).

Exemplo: gemini-2.5-pro-exp-03-25
(lançado em 25 de março de 2025)

Aposentado Versões desativadas já passaram da data de desativação e foram desativadas permanentemente.
  • Os modelos desativados não estão mais acessíveis nem têm suporte do Google, e uma solicitação usando o nome de um modelo desativado retorna um erro 404.

---



Nomes de modelos disponíveis

Os nomes de modelos são os valores explícitos que você inclui no seu código durante a inicialização do modelo.

Ir para nomes de modelos Gemini Ir para nomes de modelos Imagen

Listar todos os modelos disponíveis de maneira programática

É possível listar todos os nomes de modelos disponíveis usando a API REST:

A lista retornada inclui todos os modelos compatíveis com os provedores de API, mas o Firebase AI Logic só é compatível com os modelos Gemini e Imagen descritos nesta página. Além disso, os aliases atualizados automaticamente (por exemplo, gemini-2.0-flash) não são listados porque são um alias de conveniência para o modelo de base.

Gemini nomes de modelos

Para ver exemplos de inicialização da sua plataforma, consulte o guia de primeiros passos.

Para detalhes sobre as etapas de lançamento (especialmente para casos de uso, faturamento e desativação), consulte padrões de nomenclatura e controle de versões de modelos.

Gemini 3 Pro nomes de modelos

Exige o plano de preços Blaze de pagamento por uso, independente do seu provedor de Gemini API.

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-3-pro-preview Versão de prévia de Gemini 3 Pro Visualizar 2025-11-18 A ser determinado

Gemini 3 Flash nomes de modelos

O não exige o plano de preços Blaze de pagamento por uso se você estiver usando o Gemini Developer API (geralmente, os modelos de prévia exigem um plano pago).

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-3-flash-preview Versão de prévia de Gemini 3 Flash Visualizar 2025-12-17 A ser determinado

Nomes de modelos Gemini 3 Pro Image (também conhecidos como "nano banana pro")

Exige o plano de preços Blaze de pagamento por uso, independente do seu provedor de Gemini API.

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-3-pro-image-preview Versão de prévia do Gemini 3 Pro Image
(também conhecido como "nano banana pro")
Visualizar 2025-11-20 A ser determinado

Gemini 2.5 Pro nomes de modelos

O não exige o plano de preços Blaze de pagamento por uso se você estiver usando o Gemini Developer API?

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-2.5-pro Versão estável do Gemini 2.5 Pro Estável 2025-06-17 A partir de
2026-06-17

Gemini 2.5 Flash nomes de modelos

O não exige o plano de preços Blaze de pagamento por uso se você estiver usando o Gemini Developer API?

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-2.5-flash Versão estável do Gemini 2.5 Flash Estável 2025-06-17 A partir de
2026-06-17

Gemini 2.5 Flash‑Lite nomes de modelos

O não exige o plano de preços Blaze de pagamento por uso se você estiver usando o Gemini Developer API?

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-2.5-flash-lite Versão estável do Gemini 2.5 Flash‑Lite Estável 2025-07-22 A partir de
2026-07-22

Nomes de modelos Gemini 2.5 Flash Image (também conhecidos como "nano banana")

Exige o plano de preços Blaze de pagamento por uso, independente do seu provedor de Gemini API.

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-2.5-flash-image Versão estável para Gemini 2.5 Flash Image (também conhecida como "nano banana") Estável 2025-10-02 A partir de
2026-10-02

Gemini 2.5 Flash Live nomes de modelos

O não exige o plano de preços Blaze de pagamento por uso se você estiver usando o Gemini Developer API (geralmente, os modelos de prévia exigem um plano pago).

Os modelos Gemini 2.5 Flash Live são os modelos de áudio nativo que oferecem suporte ao Gemini Live API. Embora o modelo tenha nomes diferentes dependendo do provedor da API Gemini, o comportamento e os recursos são os mesmos.

Gemini Developer API
Nome do modelo
Descrição Etapa de lançamento Data da versão Data de desativação
gemini-2.5-flash-native-audio-preview-12-2025 1 Versão de prévia mais recente do Live API no Gemini Developer API Visualizar 2025-12-12 A ser determinado
gemini-2.5-flash-native-audio-preview-09-2025 1 Versão de prévia inicial do Live API no Gemini Developer API Visualizar 2025-09-18 A ser determinado
Vertex AI Gemini API
Nome do modelo
Descrição Etapa de lançamento Data da versão Data de desativação
gemini-live-2.5-flash-native-audio 2 Versão estável do Live API no Vertex AI Gemini API Estável 2025-12-12 A partir de
2026-12-12
gemini-live-2.5-flash-preview-native-audio-09-2025 2 Versão de pré-lançamento do Live API no Vertex AI Gemini API Visualizar 2025-09-18 A ser determinado

1 Apenas compatível com Gemini Developer API. Além disso, mesmo sendo modelos de prévia, eles estão disponíveis no "nível sem custo financeiro" do Gemini Developer API.
2 Somente compatível com Vertex AI Gemini API. Além disso, esses modelos não estão disponíveis no local global.

Imagen nomes de modelos

Para exemplos de inicialização da sua plataforma, consulte o guia de geração de imagens com Imagen.

Para detalhes sobre as etapas de lançamento (especialmente para casos de uso, faturamento e desativação), consulte padrões de nomenclatura e controle de versões de modelos.

Imagen 4 nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
imagen-4.0-generate-001 Versão estável do Imagen 4 Estável 2025-08-14 A partir de 14 de agosto de 2026

Imagen 4 Fast nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
imagen-4.0-fast-generate-001 Versão estável do Imagen 4 Fast Estável 2025-08-14 A partir de 14 de agosto de 2026

Imagen 4 Ultra nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
imagen-4.0-ultra-generate-001 Versão estável do Imagen 4 Ultra Estável 2025-08-14 A partir de 14 de agosto de 2026

Imagen 3 Capability nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
imagen-3.0-capability-001 2 Versão estável inicial do Imagen 3 Capability Estável 2024-12-10 A partir de 10 de dezembro de 2025

2 Não é compatível com o Gemini Developer API, não importa como você acesse.



Idiomas compatíveis

Gemini

  • Todos os modelos do Gemini podem entender e responder nos seguintes idiomas:

    Árabe (ar), bengali (bn), búlgaro (bg), chinês simplificado e tradicional (zh), croata (hr), tcheco (cs), dinamarquês (da), neerlandês (nl), inglês (en), estoniano (et), finlandês (fi), francês (fr), alemão (de), grego (el), hebraico (iw), hindi (hi), húngaro (hu), indonésio (id), italiano (it), japonês (ja), coreano (ko), letão (lv), lituano (lt), norueguês (no), polonês (pl), português (pt), romeno (ro), russo (ru), sérvio (sr), eslovaco (sk), esloveno (sl), espanhol (es), swahili (sw), sueco (sv), tailandês (th), turco (tr), ucraniano (uk), vietnamita (vi)

  • Os modelos Gemini 2.0 Flash, Gemini 1.5 Pro e Gemini 1.5 Flash podem entender e responder nos seguintes outros idiomas:

    Africâner (af), amárico (am), assamês (as), azerbaijano (az), bielorrusso (be), bósnio (bs), catalão (ca), cebuano (ceb), córsico (co), galês (cy), divehi (dv), esperanto (eo), basco (eu), persa (fa), filipino (tagalo) (fil), frísio (fy), irlandês (ga), gaélico escocês (gd), galego (gl), guzerate (gu), hauçá (ha), havaiano (haw), hmong (hmn), crioulo haitiano (ht), armênio (hy), igbo (ig), islandês (is), javanês (jv), georgiano (ka), cazaque (kk), khmer (km), canarês (kn), krio (kri), curdo (ku), quirguiz (ky), latim (la), luxemburguês (lb), laosiano (lo), malgaxe (mg), maori (mi), macedônio (mk), malaiala (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marati (mr), malaio (ms), maltês (mt), mianmar (birmanês) (my), nepalês (ne), nianja (chicheua) (ny), odia (oriá) (or), punjabi (pa), pashto (ps), sindi (sd), cingalês (si), samoano (sm), chona (sn), somali (so), albanês (sq), sesotho (st), sundanês (su), tâmil (ta), télugo (te), tadjique (tg), uyghur (ug), urdu (ur), usbeque (uz), xhosa (xh), Ídiche (yi), iorubá (yo), zulu (zu)

Imagen

  • Disponibilidade geral: inglês

  • Prévia: chinês (simplificado), chinês (tradicional), hindi, japonês, coreano, português, espanhol



Informações sobre modelos anteriores

Os seguintes modelos estão ativos, mas são de geração anterior. Recomendamos usar um dos modelos mais recentes sempre que possível.

Gemini modelos

  • gemini-2.0-flash-001 (e o alias atualizado automaticamente gemini-2.0-flash)
  • gemini-2.0-flash-lite-001 (e o alias atualizado automaticamente gemini-2.0-flash-lite)

Para informações sobre modelos Gemini Live API mais antigos, consulte a documentação do provedor Gemini API:

Imagen modelos

  • imagen-3.0-generate-002
  • imagen-3.0-fast-generate-001



Próximas etapas

Teste os recursos do Gemini API