Vertex AI in Firebase için iki farklı API (her birinin kendi kotası vardır) gerekir: Vertex AI API ve Vertex AI in Firebase API.
Bu API'lerin her biri, dakika başına istek sayısı (BGBG) olarak ölçülen bir kotaya sahiptir. Özellikle "içerik oluşturma" istekleri (hem akışlı hem de akışsız) için bu kota geçerlidir. Vertex AI API'nin dakika başına giriş jetonu kotası da vardır.
Bu sayfada aşağıdakiler açıklanmaktadır:
Vertex AI API ve Vertex AI in Firebase API için kotaları anlama
Google Cloud konsolunda kotaları görüntüleme
Google Cloud dokümanlarında kotalar hakkında genel bilgi edinebilirsiniz.
Her API'nin kotalarını anlama
Her API'nin kotası biraz farklı şekilde ölçülür. Bu da API'lerin farklı amaçlar için kullanılabileceği anlamına gelir.
Vertex AI API kotalarını anlama
Vertex AI API kotaları, model başına bölge başına dakika başına "İçerik oluşturma istekleri"ni temel alır.
Bu kotalarla (özellikle dakika başına istek sayısı ve dakika başına giriş jetonu sayısı) ilgili bazı önemli ayrıntıları aşağıda bulabilirsiniz:
Bu kotalar proje düzeyinde geçerlidir ve ilgili Firebase projesini kullanan tüm uygulamalar ve IP adresleri arasında paylaşılır.
Bu politikalar, Vertex AI in Firebase istemci SDK'ları, Vertex AI sunucu SDK'ları, Firebase Genkit, Gemini Firebase Extensions, REST çağrıları, Vertex AI Studio veya diğer API istemcileri kullanılarak yapılan Vertex AI Gemini API çağrılarının tümü için geçerlidir.
Bunlar, temel model ve bu modelin tüm sürümleri, tanımlayıcıları ve ayarlanmış sürümleri için geçerlidir. Aşağıda bazı örnekler verilmiştir:
gemini-1.0-pro
vegemini-1.0-pro-001
isteklerinin her biri, temel modelin (gemini-1.0 pro
) BGBG kotası için iki istek olarak sayılır.gemini-1.0-pro-001
için bir istek vegemini-1.0-pro-001
'e dayalı bir ayarlanmış model için bir istek, temel modelin (gemini-1.0-pro
) RPM kotası için iki istek olarak sayılır.
Her model ve her bölge için varsayılan kotaları Google Cloud dokümanlarında bulabilirsiniz.
Bu API'nin kotalarını, tüm kullanıcılarınız (uygulamanızda belirli bir modele dayalı ve belirli bir bölgedeki yapay zeka özelliklerini kullananlar) için "toplam" kotalarınız olarak düşünebilirsiniz.
Bu kotaların, belirli bir modele dayalı yapay zeka özelliklerinize erişebilecek belirli bir bölgedeki toplam son kullanıcı sayısını makul bir şekilde karşılayacak kadar yüksek olması gerekir. Bunlar dakika başına kotalar olduğundan, bir bölgedeki tüm kullanıcılarınızın aynı anda aynı özellik grubunu kullanması ve bu kotaları tüketmesi olası değildir. Ancak her uygulama farklıdır. Bu nedenle, bu kotaları buna göre ayarlayın.
Vertex AI in Firebase API kotasını anlama
Vertex AI in Firebase API kotası, kullanıcı başına bölge ve dakika başına "İçerik oluşturma istekleri"ni temel alır.
Bu kotayla (özellikle dakika başına istek sayısı) ilgili bazı önemli ayrıntıları aşağıda bulabilirsiniz:
Bu sınır, proje düzeyinde geçerlidir ve ilgili Firebase projesini kullanan tüm uygulamalar ve IP adresleri için geçerlidir.
Özellikle herhangi bir Vertex AI in Firebase SDK'sı üzerinden yapılan tüm çağrılar için geçerlidir.
Varsayılan kota, kullanıcı başına 100 RPM'dir.
Vertex AI API'sinin kota sınırlarını, özellikle de bu 100 RPM'den düşükse dikkate almanız gerektiğini unutmayın.
Bu API'nin kotasını, Vertex AI in Firebase'a dayalı yapay zeka özellikleri için "kullanıcı başına" kotanız olarak düşünebilirsiniz.
Bu kotanın, Vertex AI in Firebase'e dayalı yapay zeka özelliklerine erişen tek bir kullanıcıyı makul bir şekilde barındıracak kadar yüksek olması gerekir. Bu API, Vertex AI API'sinin ağ geçidi işlevi gördüğünden, tek bir kullanıcının Vertex AI API kotanızı (tüm kullanıcılarınız tarafından paylaşılması amaçlanmıştır) tüketmesini önlemek için Vertex AI in Firebase API kotasını kullanabilirsiniz.
Her API'nin kotalarını görüntüleme
Her API'nin kotalarını Google Cloud konsolunda görüntüleyebilirsiniz.
Google Cloud konsolunda, ilgilendiğiniz API'nin sayfasına gidin: Vertex AI API veya Vertex AI in Firebase API.
Yönet'i tıklayın.
Sayfanın alt kısmında Kotalar ve Sistem Sınırları sekmesini tıklayın.
İlgilendiğiniz kotaları göstermek için tabloyu filtreleyin.
Dimension
filtresi oluşturmak için aşağıdaki örneklerdeki değerleri kopyalayıp yapıştırmak yerine filtre araçlarını kullanmanız gerektiğini unutmayın.Vertex AI API için: Özelliği (içerik oluşturma istekleri), model adını ve bölgeyi belirtin.
Örneğin, desteklenen AB bölgelerinden herhangi birinde Gemini 1.5 Flash ile içerik isteği oluşturma kotalarını görüntülemek için filtreniz şu şekilde görünür:
Generate content requests
+Dimension:base_model:gemini-1.5-flash
+Dimension:region:eu
Vertex AI in Firebase API için: Özelliği (içerik oluşturma istekleri) ve bölgeyi belirtin.
Örneğin, desteklenen Asya bölgelerinden herhangi birinde içerik isteği oluşturmayla ilgili kullanıcı başına kotaları görüntülemek için filtreniz şu şekilde görünür:
Generate content requests
+Dimension:region:asia
Vertex AI in Firebase API kotalarının belirli bir modele göre belirlenmediğini unutmayın. Ayrıca,
(default)
kota satırı Vertex AI in Firebase için geçerli değildir.
Kotayı düzenleme veya kota artışı isteme
Üretime geçmeden önce veya kota aşımı 429 hataları alıyorsanız kotanızı düzenlemeniz ya da kota artışı istemeniz gerekebilir. Her API'nin kotasını uygun şekilde ayarladığınızdan emin olun (dikkat edilmesi gereken noktalar için bu sayfanın başlarındaki Her API'nin kotalarını anlama bölümüne bakın).
Kotaları düzenlemek için serviceusage.quotas.update
iznine sahip olmanız gerekir. Bu izin, varsayılan olarak Sahip ve Düzenleyici rolüne dahildir.
Kotanızı düzenleme veya kota artışı isteme işlemini aşağıdaki şekilde yapabilirsiniz:
Her API'nin kotalarını görüntülemek için önceki alt bölümdeki talimatları uygulayın.
İlgilendiğiniz her kotanın solundaki onay kutusunu işaretleyin.
Kotanın satırının sonundaki üç noktalı menüyü tıklayın ve ardından Kotayı düzenle'yi seçin.
Kota değişiklikleri formunda aşağıdakileri yapın:
Artırılmış kotayı Yeni değer alanına girin.
Bu kota proje düzeyinde geçerlidir ve ilgili Firebase projesini kullanan tüm uygulamalar ve IP adresleri arasında paylaşılır.
Formdaki diğer alanları doldurup Bitti'yi tıklayın.
İstek gönder'i tıklayın.