Supervisar los costos, el uso y otras métricas de Gemini API es una parte importante de ejecutar una app de producción. Es importante saber cómo se ven los patrones de uso normales para la app y asegurarse de cumplir con los umbrales importantes.
Supervisa los costos
En el panel Uso y facturación de Firebase console, puedes ver los costos de tu proyecto por llamar a Vertex AI Gemini API.
Los costos que se muestran en el panel no son necesariamente específicos de las llamadas a través de los SDKs de cliente Vertex AI in Firebase. Los costos que se muestran están asociados con cualquier llamada a Vertex AI Gemini API, ya sea que se usen los SDK de cliente Vertex AI in Firebase, los SDK de servidor Vertex AI, Firebase Genkit, Firebase Extensions para Gemini API, llamadas REST, Vertex AI Studio o cualquier otro cliente de API.
También puedes obtener una estimación del tamaño del token y los caracteres facturables de tus solicitudes con la API de Count Tokens. Obtén más información sobre los límites de tokens por modelo y los precios por modelo.
Configurar las alertas
Para evitar facturas sorpresa, asegúrate de configurar alertas de presupuesto.
Ten en cuenta que las alertas de presupuesto no son límites de presupuesto. Una alerta te enviará comunicaciones cuando te acerques o superes el umbral configurado para que puedas tomar medidas en tu app o proyecto.
Supervisa el uso y otras métricas
Puedes ver las métricas de tu proyecto para cada API, como su uso, en la console de Google Cloud.
En la consola de Google Cloud, ve a cada página de la API: API de Vertex AI y API de Vertex AI in Firebase.
Página de la API de Vertex AI: Es el uso asociado con cualquier llamada a Vertex AI Gemini API, ya sea con los SDK de cliente Vertex AI in Firebase, los SDK de servidor Vertex AI, Firebase Genkit, Firebase Extensions para Gemini API, llamadas REST, Vertex AI Studio, etcétera.
Página de la API de Vertex AI in Firebase: Este es el uso específico para las llamadas que provienen de los SDKs de Vertex AI in Firebase.
Haz clic en Administrar.
Haz clic en la pestaña Métricas.
Usa los menús desplegables para ver las métricas de interés, como el tráfico por código de respuesta, los errores por método de la API, la latencia general y la latencia por método de la API.