Ограничения и квоты ставок

Щелкните своего поставщика API Gemini , чтобы просмотреть специфичный для этого поставщика контент и код на этой странице.


Ограничения по частоте запросов (обычно называемые квотами) регулируют количество запросов, которые вы можете сделать к API Gemini в течение заданного периода времени. Эти ограничения помогают обеспечить добросовестное использование, защитить от злоупотреблений и поддерживать производительность системы для всех пользователей.

При использовании Firebase AI Logic для отправки запросов к моделям Gemini и Imagen ограничения скорости вашего проекта зависят от выбранного вами поставщика API Gemini . Firebase AI Logic также позволяет устанавливать ограничения скорости для каждого пользователя .

Просмотреть ограничения скорости для API разработчика Gemini

Как работают ограничения по ставкам (квоты)

Лимиты ставок (квоты) измеряются по четырем параметрам:

  • Запросов в минуту (RPM)
  • Запросов в день (RPD)
  • Токенов в минуту (TPM)
  • Токенов в день (TPD)

Ваше использование оценивается по каждому лимиту, и превышение любого из них приведёт к ошибке превышения квоты 429. Например, если ваш лимит RPM равен 20, то выполнение 21 запроса в течение минуты приведёт к ошибке, даже если вы не превысили TPM или другие лимиты.

Ограничения скорости применяются на уровне проекта и распространяются на все приложения и IP-адреса, которые используют этот проект Firebase.

Ограничения различаются в зависимости от используемой модели, а некоторые ограничения применяются только к определённым моделям. Например, показатель количества изображений в минуту (IPM) рассчитывается только для моделей, способных генерировать изображения ( Imagen 3 ), но концептуально аналогичен показателю TPM.

Для экспериментальных и предварительных моделей ограничения скорости более строгие.

Запросить увеличение лимита ставки

Если вы используете «платный тариф» Gemini Developer API , вы можете запросить увеличение лимита скорости .

Установить ограничения скорости «на пользователя»

Для использования Firebase AI Logic в вашем проекте должен быть включен выбранный вами поставщик API Gemini , а также API Firebase AI Logic , который служит шлюзом между нашими клиентскими SDK и вашим поставщиком API Gemini . Этот API включается при первоначальной настройке Firebase AI Logic в вашем проекте Firebase.

Вы можете использовать ограничение (квоту) скорости доступа к API Firebase AI Logic в качестве ограничения скорости «на пользователя» для вашего приложения , особенно для функций ИИ, использующих Firebase AI Logic . Установите это ограничение так, чтобы оно было разумным для одного пользователя, обращающегося к вашим функциям ИИ, и при этом ни один пользователь не превышал лимиты вашего поставщика API Gemini (который должен быть общим для всех ваших пользователей).

Подробная информация об ограничении скорости «на пользователя»

Вот некоторые важные сведения об ограничениях скорости (квотах) API Firebase AI Logic , в частности, о количестве запросов в минуту (RPM):

  • Он основан на принципе «Генерации запросов на контент» на основе каждого пользователя в каждом регионе в минуту и не основан на модели.

  • Он применяется на уровне проекта и распространяется на все приложения и IP-адреса, которые используют этот проект Firebase.

  • Он применяется к любому вызову, который поступает из любого Firebase AI Logic SDK.

  • Ограничение скорости по умолчанию составляет 100 об/мин на пользователя.
    Обратите внимание, что вам по-прежнему необходимо учитывать ограничения вашего поставщика API Gemini (см. выше), которые имеют приоритет над API Firebase AI Logic .

Отрегулируйте ограничение скорости «на пользователя»

Чтобы настроить ограничение скорости (квоту), необходимо иметь разрешение serviceusage.quotas.update , которое по умолчанию включено в роли владельца и редактора.

Вот как изменить лимит ставки (квоту) или запросить его увеличение:

  1. В консоли Google Cloud перейдите на страницу Firebase AI Logic API .

  2. Нажмите «Управление» .

  3. Ниже на странице нажмите вкладку Квоты и системные ограничения .

  4. Отфильтруйте таблицу, чтобы отобразить интересующие вас квоты, такие как возможности (запросы на создание контента) и регион.

    Например, чтобы просмотреть квоты для каждого пользователя на создание запросов контента в любом из поддерживаемых азиатских регионов, ваш фильтр будет выглядеть примерно так: Generate content requests + Dimension:region:asia

  5. Установите флажок слева от каждой интересующей квоты.

  6. В конце строки квоты нажмите , а затем выберите Изменить квоту .

  7. В форме «Изменение квоты» выполните следующие действия:

    1. Введите увеличенную квоту в поле Новое значение .

      Эта квота применяется на уровне проекта и распространяется на все приложения и IP-адреса, которые используют этот проект Firebase.

    2. Заполните все дополнительные поля в форме и нажмите Готово .

    3. Нажмите «Отправить запрос» .