Check out the latest news from Firebase at Cloud Next 2025. Learn more.

Se usó la API de Cloud Translation para traducir esta página.

Más información sobre los modelos compatibles

En el caso de las apps para dispositivos móviles y la Web, los SDK de Vertex AI in Firebase te permiten interactuar con los modelos Gemini y los modelos Imagen 3 compatibles directamente desde tu app.

Los modelos Gemini se consideran multimodales porque son capaces de procesar e incluso generar varias modalidades, como texto, código, archivos PDF, imágenes, video y audio. Se puede solicitar a los modelos Imagen 3 que generen imágenes con texto.

En la siguiente tabla, se incluye una breve descripción general de los modelos compatibles para Vertex AI in Firebase y sus nombres de modelos estables más recientes. En esta tabla, también se enumeran los modelos experimentales y de vista previa que están disponibles para crear prototipos de casos de uso.

Modelo	Entrada	Salida	Descripción
Modelos Gemini con versiones estables
Gemini 2.0 Flash `gemini-2.0-flash-001`	texto, código, PDF, imágenes, video y audio	texto, código, JSON (próximamente imágenes y audio)	Proporciona funciones y velocidad de nueva generación para una amplia variedad de tareas. (próximamente, generación multimodal)
Gemini 2.0 Flash‑Lite `gemini-2.0-flash-lite-001`	texto, código, PDF, imágenes, video y audio	texto, código, JSON	Proporciona un rendimiento rentable y de baja latencia, y admite una alta capacidad de procesamiento.
*Modelos Gemini con solo* versiones experimentales y de vista previa** (recomendado solo para casos de uso de prototipado)
Gemini 2.5 Pro `gemini-2.5-pro-preview-03-25`	texto, código, PDF, imágenes, video y audio	texto, código, JSON	Ofrece razonamiento avanzado, especialmente para la comprensión multimodal, la programación y el conocimiento del mundo.
Gemini 2.5 Flash `gemini-2.5-flash-preview-04-17`	texto, código, PDF, imágenes, video y audio	texto, código, JSON	Ofrece capacidades de resolución de problemas complejos rentables y de baja latencia, principalmente para la comprensión multimodal, la codificación y el conocimiento del mundo.
Gemini 2.0 Flash‑Live `gemini-2.0-flash-live-preview-04-09`	texto (transmisión), audio (transmisión)	texto (transmisión), audio (transmisión)	Admite la transmisión en tiempo real de baja latencia de entradas y salidas multimodales
Gemini 2.0 Flash‑Thinking `gemini-2.0-flash-thinking-exp-01-21`	texto, código, archivos PDF, imágenes	texto, código, JSON	Ofrece capacidades de razonamiento más sólidas y, además, incluye el proceso de pensamiento en las respuestas.
Modelos Imagen 3 (cuando se usan con Vertex AI in Firebase)
Imagen 3 `imagen-3.0-generate-002`	texto	imágenes	Genera imágenes realistas y de alta calidad a partir de instrucciones de texto de lenguaje natural.
Imagen 3 Fast `imagen-3.0-fast-generate-001`	texto	imágenes	Genera imágenes para el prototipado o casos de uso de baja latencia.

¿Vertex AI in Firebase admite modelos más antiguos, como los modelos Gemini 1.5 y Gemini 1.0?

Sí, Vertex AI in Firebase admite todos los modelos Gemini, incluidos los más antiguos.

Modelo	Entrada	Salida	Optimizado para
Gemini 1.5 Pro `gemini-1.5-pro-002`	texto, código, PDF, imágenes, video y audio	texto, código, JSON	Admite tareas de razonamiento complejas que requieren más inteligencia. Contexto largo de 2 millones
Gemini 1.5 Flash `gemini-1.5-flash-002`	texto, código, PDF, imágenes, video y audio	texto, código, JSON	Ofrece un rendimiento rápido y versátil en una amplia variedad de tareas.
Gemini 1.0 Pro Vision `gemini-1.0-pro-vision-001`	texto, código, PDF, imágenes, video (solo fotogramas)	texto, código	Controla el texto, las imágenes y el video para las respuestas de texto o código. No se puede usar para chatear.
Gemini 1.0 Pro `gemini-1.0-pro-002`	texto, código	texto, código	Tareas de lenguaje natural, chat de código y texto de varios turnos, y generación de código

Vertex AI in Firebase solo admite modelos Imagen 3. No es compatible con los modelos Imagen más antiguos (como Imagen 2).

En la parte inferior de esta página, puedes ver información detallada sobre los modelos más antiguos. Consulta nuestras Preguntas frecuentes sobre todos los modelos que Vertex AI in Firebase admite y no admite.

En el resto de esta página, se proporciona información detallada sobre los modelos que admite Vertex AI in Firebase:

Comparar modelos:
- Entradas y salidas compatibles
- Comparación de alto nivel de las funciones compatibles
- Especificaciones y limitaciones, por ejemplo, la cantidad máxima de tokens de entrada o la duración máxima del video de entrada
Descripción de cómo se crean versiones de los modelos, en particular, sus versiones estables, actualizadas automáticamente y preliminares
Listas de nombres de modelos disponibles para incluir en tu código durante la inicialización
Listas de los idiomas admitidos para los modelos

En la parte inferior de esta página, puedes ver información detallada sobre los modelos más antiguos.

Compara modelos

Cada modelo tiene diferentes capacidades para admitir varios casos de uso. Ten en cuenta que cada una de las tablas de esta sección describe cada modelo cuando se usa con Vertex AI in Firebase. Cada modelo puede tener funciones adicionales que no están disponibles cuando se usan nuestros SDKs.

Si no encuentras la información que buscas en las siguientes sub secciones, puedes encontrar aún más información sobre los modelos Gemini y los modelos Imagen 3 en la documentación de Google Cloud.

Entradas y salidas compatibles

Estos son los tipos de entrada y salida compatibles cuando se usa cada modelo con Vertex AI in Firebase:

	<span="notranslate">Gemini 2.5 Pro </span="notranslate">	<span="notranslate">Gemini 2.5 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate">	<span="notranslate">Pensamiento rápido de Gemini 2.0 </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">	Imagen 3 / Imagen 3 Fast
Tipos de entrada
Texto
Texto (transmisión)
Código
Documentos (PDF o texto sin formato)
Imágenes
Video
Audio
Audio (transmisión)
Tipos de salida
Texto
Texto (transmisión)
Código
Salida estructurada (como JSON)
Imágenes			próximamente
Audio			próximamente
Audio (transmisión)

Para obtener información sobre los tipos de archivos compatibles, consulta Archivos de entrada y requisitos compatibles para Gemini API in Vertex AI.

Funciones y capacidades compatibles

Estas son las funciones y capacidades compatibles cuando se usa cada modelo con Vertex AI in Firebase:

	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">
Genera texto a partir de entradas de texto o multimodal		solo transmisión
Generar imágenes (Imagen 3)	próximamente
Genera audio	próximamente	solo transmisión
Genera un resultado estructurado (como JSON).
Analizar documentos (archivos PDF o texto sin formato)
Analiza imágenes (visión)
Analizar videos (visión)
Cómo analizar audio		solo transmisión
Chat de varios turnos
Llamadas a función (herramientas)
Recuento de tokens y caracteres facturables
Instrucciones del sistema
Transmisión multimodal bidireccional

Especificaciones y limitaciones

Estas son las especificaciones y limitaciones cuando se usa cada modelo con Vertex AI in Firebase:

Propiedad	<span="notranslate">Gemini 2.5 Pro </span="notranslate">	<span="notranslate">Gemini 2.5 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate">	<span="notranslate">Pensamiento rápido de Gemini 2.0 </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">	Imagen 3 / Imagen 3 Fast
Ventana de contexto * Límite total de tokens (entrada y salida combinadas)	1,048,576 tokens	1,048,576 tokens	1,048,576 tokens	1,048,576 tokens	1,048,576 tokens	32,768 tokens	480 tokens
Límite de tokens de salida *	65,536 tokens	65,536 tokens	8,192 tokens	8,192 tokens	8,192 tokens	---	---
Fecha límite de conocimiento	Enero de 2025	Enero de 2025	Junio de 2024	Junio de 2024	Junio de 2024	Agosto de 2024	---
PDF (si se solicita)
Cantidad máxima de archivos PDF de entrada **	3,000 archivos	3,000 archivos	3,000 archivos	3,000 archivos	3,000 archivos	---	---
Cantidad máxima de páginas por archivo PDF de entrada **	1,000 páginas	1,000 páginas	1,000 páginas	1,000 páginas	1,000 páginas	---	---
Tamaño máximo por archivo PDF de entrada	50 MB	50 MB	50 MB	50 MB	50 MB	---	---
Imágenes (por solicitud)
Cantidad máxima de imágenes de entrada	3,000 imágenes	3,000 imágenes	3,000 imágenes	3,000 imágenes	3,000 imágenes	---	---
Cantidad máxima de imágenes de salida	---	---	próximamente	---	---	---	4 imágenes
Tamaño máximo por imagen de entrada codificada en base64	7 MB	7 MB	7 MB	7 MB	7 MB	---	---
Video (por solicitud)
Cantidad máxima de archivos de video de entrada	10 archivos	10 archivos	10 archivos	10 archivos	---	---	---
Es la duración máxima de todo el video de entrada (solo fotogramas).	Aproximadamente 60 minutos	Aproximadamente 60 minutos	Aproximadamente 60 minutos	Aproximadamente 60 minutos	---	---	---
Es la duración máxima de todo el video de entrada (fotogramas y audio).	45 minutos aprox.	45 minutos aprox.	45 minutos aprox.	45 minutos aprox.	---	---	---
Audio (por solicitud)
Cantidad máxima de archivos de audio de entrada	1 archivo	1 archivo	1 archivo	1 archivo	---	---	---
Cantidad máxima de archivos de audio de salida	---	---	próximamente	---	---	---	---
Es la longitud máxima de todo el audio de entrada.	Aprox. 8.4 horas	Aprox. 8.4 horas	Aprox. 8.4 horas	Aprox. 8.4 horas	---	---	---
Es la longitud máxima de todo el audio de salida.	---	---	próximamente	---	---	---	---

^{*
En todos los modelos Gemini, un token equivale a alrededor de 4 caracteres,
así que 100 tokens son entre 60 y 80 palabras en inglés. En el caso de los modelos Gemini, puedes determinar el recuento total de tokens en tus solicitudes con countTokens.}

^{**
Los archivos PDF se tratan como imágenes, por lo que una sola página de un PDF se considera una sola imagen. La cantidad de páginas permitidas en una solicitud se limita a la cantidad de imágenes que el modelo puede admitir.}

Obtén información detallada adicional

Las cuotas y los precios son diferentes para cada modelo. Los precios también dependen de las entradas y salidas.
Obtén información sobre los tipos de archivos de entrada admitidos, cómo especificar el tipo de MIME y cómo asegurarte de que tus archivos de entrada y solicitudes multimodales cumplan con los requisitos y sigan las prácticas recomendadas en Requisitos y tipos de archivos de entrada admitidos para Gemini API in Vertex AI.

Patrones de nombres y control de versiones de modelos

Los modelos se ofrecen en versiones estables, experimentales y de vista previa. Para mayor comodidad, se admiten alias sin valores de versión explícitos.

Para encontrar nombres de modelos específicos que puedes usar en tu código, consulta la sección "Nombres de modelos disponibles" más adelante en esta página.

Tipo de versión		Descripción	Patrón de nombre del modelo
Estable		Las versiones *estables* se consideran de disponibilidad general.	Los nombres de los modelos de las versiones estables se agregan con un número de versión de tres dígitos específico. Ejemplo: `gemini-2.0-flash-001` Ejemplo: `imagen-3.0-generate-002`
	Alias estable actualizado automáticamente	Los alias estables *actualizados automáticamente* siempre apuntan a la versión estable más reciente de ese modelo. Si se lanza una nueva versión estable, el alias actualizado automáticamente comienza a apuntar automáticamente a esa nueva versión estable.	Los nombres de los modelos de los alias no tienen ningún apéndice. Ejemplo: `gemini-2.0-flash`
Vista previa		Las versiones *de vista previa* tienen funciones nuevas y se consideran no estables. Las versiones preliminares siempre apuntan a la versión más reciente de ese modelo. Si se lanza una nueva versión preliminar, cualquier versión preliminar existente comenzará a apuntar automáticamente a esa versión preliminar nueva.	Los nombres de los modelos de las versiones preliminares se agregan con `-preview` junto con la fecha de lanzamiento inicial del modelo (`-MMDD`). Ejemplo: `gemini-2.5-flash-preview-04-17` (lanzado el 17 de abril de 2025)
Experimental		Las versiones *experimentales* tienen capacidades nuevas, se consideran no estables y no siguen el plan de ciclo de vida del modelo y el esquema de control de versiones estándar de Google. Obtén más información sobre los modelos experimentales.	Los nombres de los modelos de las versiones experimentales se agregan con `-exp` junto con la fecha de lanzamiento inicial del modelo (`-MMDD`). Ejemplo: `gemini-2.5-pro-exp-03-25` (lanzado el 25 de marzo de 2025)

Obtén más información sobre las versiones de modelos disponibles y su ciclo de vida (Gemini) o Imagen en la documentación de Google Cloud.

Nombres de modelos disponibles

Los nombres de los modelos son los valores explícitos que incluyes en tu código durante la inicialización del modelo.

Puedes usar el extremo publishers.models.list para enumerar todos los nombres de modelos disponibles. Ten en cuenta que esta lista incluirá todos los modelos que admite Vertex AI, pero Vertex AI in Firebase solo admite los modelos Gemini y Imagen que se describen en esta página. Además, ten en cuenta que los alias actualizados automáticamente (por ejemplo, gemini-2.0-flash) no se enumeran porque son un alias conveniente para el modelo base.

Gemini nombres de modelos

Para ver ejemplos de inicialización en tu idioma, consulta la guía de introducción.

Gemini 2.5 Pro nombres de modelos

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento inicial	Fecha de descontinuación
Versiones estables
No hay versiones estables disponibles	---	---	---	---
Alias estable actualizado automáticamente
No hay alias estables actualizados automáticamente disponibles	---	---	---	---
Versiones preliminares
`gemini-2.5-pro-preview-03-25`	Versión preliminar de Gemini 2.5 Pro	Vista previa	25-03-2025	Sin establecer
Versiones experimentales
No hay versiones experimentales disponibles	---	---	---	---

Gemini 2.5 Flash nombres de modelos

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento inicial	Fecha de descontinuación
Versiones estables
No hay versiones estables disponibles	---	---	---	---
Alias estable actualizado automáticamente
No hay alias estables actualizados automáticamente disponibles	---	---	---	---
Versiones preliminares
`gemini-2.5-flash-preview-04-17`	Versión preliminar de Gemini 2.5 Flash	Vista previa	2025-04-17	Sin establecer
Versiones experimentales
No hay versiones experimentales disponibles	---	---	---	---

Gemini 2.0 Flash nombres de modelos

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento inicial	Fecha de descontinuación
Versiones estables
`gemini-2.0-flash-001`	La versión estable más reciente de Gemini 2.0 Flash	Disponibilidad general	2025-02-05	No antes del 2026-02-05
Alias estable actualizado automáticamente
`gemini-2.0-flash`	Hace referencia a la versión estable más reciente de Flash 2.0 (actualmente, `gemini-2.0-flash-001`).	Disponibilidad general	2025-02-10	---
Versiones preliminares
No hay versiones preliminares disponibles	---	---	---	---
Versiones experimentales
No hay versiones experimentales disponibles	---	---	---	---

Gemini 2.0 Flash‑Lite nombres de modelos

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento inicial	Fecha de descontinuación
Versiones estables
`gemini-2.0-flash-lite-001`	La versión estable más reciente de Gemini 2.0 Flash‑Lite	Disponibilidad general	2025-02-25	No antes del 2026-02-25
Alias estable actualizado automáticamente
`gemini-2.0-flash-lite`	Apunta a la versión estable más reciente de Flash-Lite 2.0 (actualmente, `gemini-2.0-flash-lite-001`).	Disponibilidad general	2025-02-25	---
Versiones preliminares
No hay versiones preliminares disponibles	---	---	---	---
Versiones experimentales
No hay versiones experimentales disponibles	---	---	---	---

Gemini 2.0 Flash‑Live nombres de modelos

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento inicial	Fecha de descontinuación
Versiones estables
No hay versiones estables disponibles	---	---	---	---
Alias estable actualizado automáticamente
No hay alias estables actualizados automáticamente disponibles	---	---	---	---
Versiones preliminares
`gemini-2.0-flash-live-preview-04-09`	Versión preliminar de Gemini 2.0 Flash‑Live	Vista previa	2025-04-09	Sin establecer
Versiones experimentales
No hay versiones experimentales disponibles	---	---	---	---

Gemini 2.0 Flash‑Thinking nombres de modelos

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento inicial	Fecha de descontinuación
Versiones estables
No hay versiones estables disponibles	---	---	---	---
Alias estable actualizado automáticamente
No hay alias estables actualizados automáticamente disponibles	---	---	---	---
Versiones preliminares
No hay versiones preliminares disponibles	---	---	---	---
Versiones experimentales
`gemini-2.0-flash-thinking-exp-01-21`	Versión experimental de Gemini 2.0 Flash‑Thinking	Experimental	2025-01-21	Sin establecer

Imagen nombres de modelos

Para ver ejemplos de inicialización en tu idioma, consulta la guía para generar imágenes con Imagen.

En este momento, ninguno de los modelos Imagen 3 tiene versiones experimentales ni de vista previa disponibles.

Imagen 3 nombres de modelos

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento inicial	Fecha de descontinuación
Versiones estables
`imagen-3.0-generate-002`	La versión estable más reciente de Imagen 3	Disponibilidad general	2025-01-23	A partir del 23/01/2026
`imagen-3.0-generate-001`	Versión estable inicial de Imagen 3	Disponibilidad general	2024-07-31	A partir del 31/7/2025

Imagen 3 Fast nombres de modelos

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento inicial	Fecha de descontinuación
Versiones estables
`imagen-3.0-fast-generate-001`	Versión estable inicial de Imagen 3 Fast	Disponibilidad general	2024-07-31	A partir del 31/7/2025

Idiomas admitidos

Gemini

Todos los modelos de Gemini pueden entender y responder en los siguientes idiomas:

Árabe (ar), bengalí (bn), búlgaro (bg), chino simplificado y tradicional (zh), croata (hr), checo (cs), danés (da), neerlandés (nl), español (es), estonio (et), finlandés (fi), francés (fr), alemán (de), griego (el), hebreo (iw), hindi (hi), húngaro (hu), indonesio (id), italiano (it), japonés (ja), coreano (ko), letón (lv), lituano (lt), noruego (no), polaco (pl), portugués (pt), rumano (ro), ruso (ru), serbio (sr), eslovaco (sk), esloveno (sl), sueco (sv), tailandés (th), turco (tr), ucraniano (uk) y vietnamita (vi)
Los modelos Gemini 2.0 Flash, Gemini 1.5 Pro y Gemini 1.5 Flash pueden comprender y responder en los siguientes idiomas adicionales:

Afrikaans (af), Amharic (am), Assamese (as), Azerbaijani (az), Belarusian (be), Bosnian (bs), Catalan (ca), Cebuano (ceb), Corsican (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persian (fa), Filipino (Tagalog) (fil), Frisian (fy), Irish (ga), Scots Gaelic (gd), Galician (gl), Gujarati (gu), Hausa (ha), Hawaiian (haw), Hmong (hmn), Haitian Creole (ht), Armenian (hy), Igbo (ig), Icelandic (is), Javanese (jv), Georgian (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdish (ku), Kyrgyz (ky), Latin (la), Luxembourgish (lb), Lao (lo), Malagasy (mg), Maori (mi), Macedonian (mk), Malayalam (ml), Mongolian (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Malay (ms), Maltese (mt), Myanmar (Burmese) (my), Nepali (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoan (sm), Shona (sn), Somali (so), Albanian (sq), Sesotho (st), Sundanese (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)

Imagen

Disponibilidad general: inglés
Versión preliminar: Chino (simplificado), chino (tradicional), hindi, japonés, coreano, portugués y español

Información sobre modelos más antiguos

Vertex AI in Firebase admite todos los modelos Gemini, incluidos los más antiguos, como los modelos Gemini 1.5 y Gemini 1.0.

Vertex AI in Firebase solo admite modelos Imagen 3. No es compatible con los modelos Imagen más antiguos (como Imagen 2).

Cómo ver las entradas y salidas compatibles de modelos más antiguos

Estos son los tipos de entrada y salida cuando se usa cada modelo con Vertex AI in Firebase:

	<span="notranslate">Gemini 1.5 Pro </span="notranslate">	<span="notranslate">Gemini 1.5 Flash </span="notranslate">	<span="notranslate">Gemini 1.0 Pro Vision </span="notranslate">	<span="notranslate">Gemini 1.0 Pro </span="notranslate">
Tipos de entrada
Texto
Código
Documentos (PDF o texto sin formato)
Imágenes
Video
Audio
Audio (transmisión)
Tipos de salida
Texto
Código
Salida estructurada (como JSON)
Imágenes, video y audio

Funciones y capacidades compatibles de modelos más antiguos

Estas son las capacidades y funciones cuando se usa cada modelo con Vertex AI in Firebase:

	<span="notranslate">Gemini 1.5 Pro </span="notranslate">	<span="notranslate">Gemini 1.5 Flash </span="notranslate">	<span="notranslate">Gemini 1.0 Pro Vision </span="notranslate">	<span="notranslate">Gemini 1.0 Pro </span="notranslate">
Genera texto a partir de una entrada de solo texto
Genera texto a partir de una entrada multimodal
Generar imágenes
Genera audio
Genera un resultado estructurado (como JSON).
Analizar documentos (archivos PDF o texto sin formato)
Analiza imágenes (visión)
Analizar videos (visión)
Cómo analizar audio
Chat de varios turnos
Llamadas a función (herramientas)
Recuento de tokens y caracteres facturables
Instrucciones del sistema
API de Multimodal Live (transmisión bidireccional)

Especificaciones y limitaciones de los modelos más antiguos

Estas son las especificaciones y limitaciones cuando se usa cada modelo con Vertex AI in Firebase:

	<span="notranslate">Gemini 1.5 Pro </span="notranslate">	<span="notranslate">Gemini 1.5 Flash </span="notranslate">	<span="notranslate">Gemini 1.0 Pro Vision </span="notranslate">	<span="notranslate">Gemini 1.0 Pro </span="notranslate">
Ventana de contexto * Límite total de tokens (entrada y salida combinadas)	2,097,152 tokens	1,048,576 tokens	16,384 tokens	32,760 tokens
Límite de tokens de salida *	8,192 tokens	8,192 tokens	2,048 tokens	8,192 tokens
Fecha límite de conocimiento	Mayo de 2024	Mayo de 2024	Febrero de 2023	Febrero de 2023
PDF (si se solicita)
Cantidad máxima de archivos PDF de entrada **	3,000 archivos	3,000 archivos	16 archivos	---
Cantidad máxima de páginas por archivo PDF de entrada **	1,000 páginas	1,000 páginas	16 páginas	---
Tamaño máximo por archivo PDF de entrada	50 MB	50 MB	50 MB	---
Imágenes (por solicitud)
Cantidad máxima de imágenes de entrada	3,000 imágenes	3,000 imágenes	16 imágenes	---
Cantidad máxima de imágenes de salida	---	---	---	---
Tamaño máximo por imagen de entrada codificada en base64	7 MB	7 MB	7 MB	---
Video (por solicitud)
Cantidad máxima de archivos de video de entrada	10 archivos	10 archivos	1 archivo	---
Es la duración máxima de todo el video de entrada (solo fotogramas).	Aproximadamente 60 minutos	Aproximadamente 60 minutos	2 minutos	---
Es la duración máxima de todo el video de entrada (fotogramas y audio).	45 minutos aprox.	45 minutos aprox.	---	---
Audio (por solicitud)
Cantidad máxima de archivos de audio de entrada	1 archivo	1 archivo	---	---
Cantidad máxima de archivos de audio de salida	---	---	---	---
Es la longitud máxima de todo el audio de entrada.	Aprox. 8.4 horas	Aprox. 8.4 horas	---	---
Es la longitud máxima de todo el audio de salida.	---	---	---	---

Nombres de modelos disponibles de modelos más antiguos (incluidas las fechas de descontinuación)

Los nombres de los modelos son los valores explícitos que incluyes en tu código durante la inicialización del modelo.

Nombres de los modelos Gemini 1.5 Pro

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento inicial	Fecha de descontinuación
Versiones estables
`gemini-1.5-pro-002`	La versión estable más reciente de Gemini 1.5 Pro	Obsoleto	2024-09-24	2025-09-24
`gemini-1.5-pro-001`	Versión estable inicial de Gemini 1.5 Pro	Obsoleto	2024-05-24	2025-05-24
Alias estable actualizado automáticamente
`gemini-1.5-pro`	Hace referencia a la versión estable más reciente de 1.5 Pro (actualmente, `gemini-1.5-pro-002`).	Obsoleto	2024-09-24	2025-09-24

Gemini 1.5 Flash nombres de modelos

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento inicial	Fecha de descontinuación
Versiones estables
`gemini-1.5-flash-002`	La versión estable más reciente de Gemini 1.5 Flash	Obsoleto	2024-09-24	2025-09-24
`gemini-1.5-flash-001`	Versión estable inicial de Gemini 1.5 Flash	Obsoleto	2024-05-24	2025-05-24
Alias estable actualizado automáticamente
`gemini-1.5-flash`	Hace referencia a la versión estable más reciente de Flash 1.5 (actualmente, `gemini-1.5-flash-002`).	Obsoleto	2024-09-24	2025-09-24

Gemini 1.0 Pro Vision nombres de modelos

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento inicial	Fecha de descontinuación
Versiones estables
`gemini-1.0-pro-vision-001`	La versión estable más reciente de Gemini 1.0 Pro Vision	Obsoleto	2024-02-15	2025-04-21
Alias estable actualizado automáticamente
`gemini-1.0-pro-vision`	Hace referencia a la versión estable más reciente de 1.5 Pro Vision (actualmente, `gemini-1.5-pro-vision-001`).	Obsoleto	2024-01-04	2025-04-21

Gemini 1.0 Pro nombres de modelos

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento inicial	Fecha de descontinuación
Versiones estables
`gemini-1.0-pro-002`	La versión estable más reciente de Gemini 1.0 Pro	Obsoleto	2024-04-09	2025-04-21
`gemini-1.0-pro-001`	Versión estable de Gemini 1.0 Pro	Obsoleto	2024-02-15	2025-04-21
Alias estable actualizado automáticamente
`gemini-1.0-pro`	Apunta a la versión estable más reciente de 1.0 Pro (actualmente, `gemini-1.0-pro-002`).	Obsoleto	2024-02-15	2025-04-21

Próximos pasos

Prueba las capacidades de Gemini API

Crea conversaciones de varios turnos (chat).
Generar texto a partir de instrucciones de solo texto
Genera texto a partir de instrucciones multimodales (incluidos texto, imágenes, PDF, video y audio).
Genera resultados estructurados (como JSON) a partir de instrucciones multimodales y de texto.
Genera imágenes a partir de instrucciones de texto.
Transmite la entrada y la salida (incluido el audio) con Gemini Live API.
Usa las llamadas a función para conectar los modelos generativos a sistemas y datos externos.