监控 Gemini API 的费用、使用情况和其他指标是运行正式版应用的重要环节。请务必了解应用的正常使用模式,并确保其未超出重要阈值。
监控费用
在 Firebase 控制台的使用量和结算信息中心中,您可以查看项目调用 Vertex AI Gemini API 的费用。
信息中心中显示的费用不一定仅限于通过 Vertex AI in Firebase 客户端 SDK 进行的调用。显示的费用与对 Vertex AI Gemini API 的任何调用相关联,无论是使用 Vertex AI in Firebase 客户端 SDK、Vertex AI 服务器 SDK、Genkit、Gemini API 的 Firebase Extensions、REST 调用、Vertex AI Studio 还是其他 API 客户端。
您还可以使用 Count Tokens API 估算请求的令牌大小和计费字符数。详细了解每个模型的令牌限制和每个模型的价格。
设置提醒
为避免出现意外费用,请务必设置预算提醒。
请注意,预算提醒不是预算上限。当您接近或超过配置的阈值时,系统会向您发送提醒信息,以便您在应用或项目中采取行动。
监控使用情况和其他指标
您可以在 Google Cloud 控制台中查看项目中每个 API 的指标,例如其用量。
在 Google Cloud 控制台中,前往各个 API 页面:Vertex AI API 和 Vertex AI in Firebase API。
Vertex AI API 页面:这是与对 Vertex AI Gemini API 的任何调用相关联的用量,无论是使用 Vertex AI in Firebase 客户端 SDK、Vertex AI 服务器 SDK、Genkit、Gemini API 的 Firebase Extensions、REST 调用、Vertex AI Studio 等。
Vertex AI in Firebase API 页面:此用法专门适用于来自 Vertex AI in Firebase SDK 的调用。
点击管理。
点击指标标签页。
使用下拉菜单查看感兴趣的指标,例如按响应代码划分的流量、按 API 方法划分的错误、总延迟时间和按 API 方法划分的延迟时间。