Gemini 모델군은 멀티모달 이미지, 동영상, 텍스트, 이미지, 오디오, 동영상 등 다양한 형식의 사용할 수 있습니다. 예를 들어 Gemini 모델에 접시 사진을 전송할 수 있습니다. 쿠키의 레시피를 제공하도록 요청합니다.
프롬프트 | 응답 |
이 쿠키의 레시피를 알려주세요. |
**재료** - 1컵. (2 스틱) 무염 버터, 실온 - 3/4컵 정제 설탕 - 3/4컵 갈색 설탕, 팩 - 1티스푼 바닐라 추출물 - 큰 계란 2개 - 2와 1/4컵 다목적 밀가루 - 1티스푼 베이킹 소다 - 1티스푼 소금 ... |
다음을 사용하여 Gemini 모델군과 상호작용할 수 있습니다. Gemini API 제공: Vertex AI 날짜: Google Cloud 모바일 및 웹 앱의 경우 Vertex AI in Firebase Gemini API를 호출하고 앱에서 바로 Gemini 모델을 사용할 수 있습니다.
이 페이지에서는 Gemini 모델에 대해 다음 정보를 제공합니다.
다양한 Gemini의 사용 사례에 대한 대략적인 비교 여기에는 지원되는 입력 유형이 포함됩니다.
각 모델의 세부정보 비교(예: 최대 입력 토큰이나 동영상의 최대 길이입니다.
Gemini 모델의 버전 관리 방식에 대한 설명(특히) 안정화 버전, 자동 업데이트, 미리보기 버전 등 3가지 버전이 있습니다.
사용 가능한 모델 이름 목록 코드를 캡쳐하는 데 사용됩니다.
Gemini 모델에 지원되는 언어의 목록입니다.
사용 가능한 모델
Vertex AI in Firebase와 함께 다음 Gemini 모델을 사용할 수 있습니다.
Gemini 1.5 플래시
동일한 입력과 출력을 지원하는 멀티모달 모델 1.5 Pro로 분류되었지만 100만 개의 토큰이 긴 컨텍스트에서 이해됩니다. Gemini 1.5 Flash는 대용량, 비용 효율성을 위해 특별히 설계되었습니다. 애플리케이션을 실행할 수 있습니다Gemini 1.5 Pro
멀티모달 모델에서는 이미지, 오디오, 동영상 텍스트나 코드 응답을 위한 텍스트 또는 채팅 프롬프트로 작성할 수 있습니다 또한 2백만 개의 토큰으로 긴 컨텍스트 이해를 지원합니다.Gemini 1.0 Pro Vision
다중 모달 모델은 텍스트 또는 코드 응답을 위한 이미지 및 동영상 채팅에 사용할 수 없습니다.Gemini 1.0 Pro
자연어 태스크, 멀티턴을 처리하도록 설계된 모델 채팅, 코드 생성, 코드 생성을 지원합니다.
각 모델의 사용 사례 및 기능
Gemini 모델마다 다양한 사용 사례를 지원하는 다양한 기능이 있습니다. 각 유형에 관한 자세한 내용은 Google Cloud 문서를 참고하세요. Gemini 모델.
각 모델에 지원되는 입력 및 출력
Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |
---|---|---|---|---|
입력 유형 | ||||
텍스트 | ||||
코드 | ||||
이미지 | ||||
동영상 (프레임 전용) | ||||
동영상 (프레임 및 오디오) | ||||
오디오 | ||||
출력 유형 | ||||
텍스트 | ||||
코드 |
지원되는 파일 형식에 대한 자세한 내용은 다음을 참조하세요. Vertex AI Gemini API에 지원되는 입력 파일 및 요구사항
각 모델에서 지원되는 기능 및 일반 기능
Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||
---|---|---|---|---|---|
텍스트 전용 프롬프트에서 텍스트 생성 | |||||
멀티모달 프롬프트에서 텍스트 생성 | |||||
JSON 출력 (제한된 스키마 모드) (Vertex AI in Firebase SDK 지원 예정) |
|||||
멀티턴 채팅 | |||||
함수 호출 | |||||
기본 함수 호출 | |||||
병렬 함수 호출 | |||||
함수 호출 모드 | |||||
토큰 및 청구 가능 문자 계산 | |||||
시스템 안내 |
각 모델에 대한 세부정보
속성 | Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro Vision | Gemini 1.0 Pro |
---|---|---|---|---|
총 토큰 한도 (입력 및 출력 합계) * | 토큰 1,048,576개 | 토큰 2,097,152개 | 토큰 16,384개 | 토큰 32,760개 |
출력 토큰 한도 * | 토큰 8,192개 | 토큰 8,192개 | 토큰 2,048개 | 토큰 8,192개 |
요청당 최대 이미지 수 | 이미지 3,000개 | 이미지 3,000개 | 이미지 16개 | 해당 사항 없음 |
base64로 인코딩된 최대 이미지 크기 | 7 MB | 7 MB | 7 MB | 해당 사항 없음 |
최대 PDF 크기 | 30MB | 30MB | 30MB | 해당 사항 없음 |
요청당 최대 동영상 파일 수 | 동영상 파일 10개 | 동영상 파일 10개 | 동영상 파일 1개 | 해당 사항 없음 |
최대 동영상 길이 (프레임만) | 동영상 약 60분 | 동영상 약 60분 | 2분 | 해당 사항 없음 |
최대 동영상 길이 (프레임 및 오디오) | 동영상 약 45분 | 동영상 약 45분 | 해당 사항 없음 | 해당 사항 없음 |
요청당 최대 오디오 파일 수 | 오디오 파일 1개 | 오디오 파일 1개 | 해당 사항 없음 | 해당 사항 없음 |
최대 오디오 길이 | 오디오 최대 8.4시간 | 오디오 최대 8.4시간 | 해당 사항 없음 | 해당 사항 없음 |
* 모든 Gemini 모델에서 토큰은 약 4자(영문 기준)로,
즉, 100 토큰은 약 60-80개의 영어 단어입니다. 총 카운트를 확인할 수 있습니다.
요청을 통해
countTokens
여기에서 모델 및 프로덕션에 대한 보다 자세한 정보를 입력 파일:
자세히 알아보기: Google Cloud 문서의 멀티모달 모델 간 차이점
지원되는 파일 형식과 MIME 형식을 지정하는 방법 및 파일과 멀티모달 요청이 요구사항을 충족하는지 확인하고 권장사항을 Vertex AI Gemini API에 지원되는 입력 파일 및 요구사항
모델 버전 관리
Gemini 모델은 안정화 버전, 자동 업데이트 버전, 미리보기 버전으로 제공됩니다. 제공합니다
안정화 버전은 정식 버전으로 간주됩니다.
- 안정화 버전에는 모델 이름에
특정 3자리 버전 번호(예:
gemini-1.0-pro-001
- 안정화 버전에는 모델 이름에
특정 3자리 버전 번호(예:
자동 업데이트 버전은 항상 최신 안정화 버전을 가리킴 해당 모델 새로운 안정화 버전이 출시되면 자동 업데이트된 버전 자동으로 새로운 안정화 버전을 가리키기 시작합니다
- 자동 업데이트된 버전에 없는 모델 이름이 있습니다.
부속물, 예:
gemini-1.0-pro
- 자동 업데이트된 버전에 없는 모델 이름이 있습니다.
부속물, 예:
미리보기 버전은 새로운 기능을 가지며 안정적이지 않은 버전으로 간주됩니다. 미리보기 버전은 항상 최신 미리보기 버전의 해당 모델 새로운 미리보기 버전이 출시되는 경우 기존 미리보기 버전 자동으로 새 미리보기 버전을 가리키기 시작합니다
- 미리보기 버전에는 모델 이름에
및 모델의 초기 출시 버전 날짜 (-preview
) 예:-MMDD
(2024년 4월 9일 출시)gemini-1.5-pro-preview-0409
- 미리보기 버전에는 모델 이름에
자세히 알아보기: 사용 가능한 Gemini 모델 버전 및 수명 주기 자세한 내용은 Google Cloud 문서를 참조하세요.
사용 가능한 모델 이름
모델 이름은 모델 배포 중에 코드에 포함되는 명시적 값입니다. 초기화는 생성 모델을 시작합니다. 이 단계는 Gemini API)을 입력합니다. 사용 중인 언어의 초기화 예는 시작 가이드
Gemini 1.5 Flash 모델 이름
모델 이름 | 설명 | 출시 단계 | 최초 출시일 | 지원 중단 날짜 |
---|---|---|---|---|
안정화 버전 | ||||
gemini-1.5-flash-001 |
Gemini 1.5 Flash의 최신 안정화 버전 | 정식 버전 | 2024-05-24 | 2025-05-24 이전 |
자동 업데이트된 버전 | ||||
gemini-1.5-flash |
최신의 안정적인 1.5 Flash 버전을 가리킵니다. (현재 gemini-1.5-flash-001 |
정식 버전 | 2024-05-24 | --- |
버전 미리보기 | ||||
gemini-1.5-flash-preview-0514 |
Gemini 1.5 Flash의 최신 미리보기 버전 | 공개 미리보기 | 2024-05-14 | 2024-06-24 |
Gemini 1.5 Pro 모델 이름
모델 이름 | 설명 | 출시 단계 | 최초 출시일 | 지원 중단 날짜 |
---|---|---|---|---|
안정화 버전 | ||||
gemini-1.5-pro-001 |
Gemini 1.5 Pro의 최신 안정화 버전 | 정식 버전 | 2024-05-24 | 2025-05-24 이전 |
자동 업데이트된 버전 | ||||
gemini-1.5-pro |
1.5 Pro의 최신 안정화 버전을 가리킵니다. (현재 gemini-1.5-pro-001 |
정식 버전 | 2024-05-24 | --- |
버전 미리보기 | ||||
gemini-1.5-pro-preview-0514 |
Gemini 1.5 Pro의 최신 미리보기 버전 | 공개 미리보기 | 2024-05-14 | 2024-06-24 |
gemini-1.5-pro-preview-0409 |
gemini-1.5-pro-preview-0514 (최신 미리보기 버전) |
공개 미리보기 | 2024-04-09 | 2024-06-14 |
Gemini 1.0 Pro Vision 모델 이름
모델 이름 | 설명 | 출시 단계 | 최초 출시일 | 지원 중단 날짜 |
---|---|---|---|---|
안정화 버전 | ||||
gemini-1.0-pro-vision-001 |
Gemini 1.0 Pro Vision의 최신 안정화 버전 | 정식 버전 | 2024-02-15 | 2025년 2월 15일 이전 |
자동 업데이트된 버전 | ||||
gemini-1.0-pro-vision |
1.5 Pro Vision의 최신 안정화 버전을 가리킵니다. (현재 gemini-1.5-pro-vision-001 |
정식 버전 | 2024-01-04 | --- |
Gemini 1.0 Pro 모델 이름
모델 이름 | 설명 | 출시 단계 | 최초 출시일 | 지원 중단 날짜 |
---|---|---|---|---|
안정화 버전 | ||||
gemini-1.0-pro-002 |
Gemini 1.0 Pro의 최신 안정화 버전 | 정식 버전 | 2024-04-09 | 2025-04-09 이전 |
gemini-1.0-pro-001 |
Gemini 1.0 Pro의 안정화 버전 | 정식 버전 | 2024-02-15 | 2025년 2월 15일 이전 |
자동 업데이트된 버전 | ||||
gemini-1.0-pro |
1.0 Pro의 최신 안정화 버전을 가리킵니다. (현재 gemini-1.0-pro-002 |
정식 버전 | 2024-02-15 | --- |
지원 언어
모든 Gemini 모델은 다음 언어를 이해하고 응답할 수 있습니다.
한국어(ko), 아랍어(ar), 벵골어(bn), 불가리아어(bg), 중국어 간체 및 번체(zh), 크로아티아어(hr), 체코어(cs), 덴마크어(da), 네덜란드어(nl), 영어(en), 에스토니아(et), 핀란드어(fi), 프랑스어(fr), 독일어(de), 그리스어(el), 히브리어(iw), 힌디어(hi), 헝가리어(hu), 인도네시아어(id), 이탈리아어(it), 일본어(ja), 라트비아어(lv), 리투아니아어(lt), 노르웨이어(no), 폴란드어(pl), 포르투갈어(pt), 루마니아어(ro), 러시아어(ru), 세르비아어(sr), 슬로바키아어(sk), 슬로베니아어(sl), 스페인어(es), 스와힐리어(sw), 스웨덴어(sv), 태국어(th), 튀르키예어(tr), 우크라이나어(uk), 베트남어(vi)
Gemini 1.5 Pro 및 Gemini 1.5 Flash 모델은 다음 추가 언어를 이해하고 응답할 수 있습니다.
아프리칸스어(af), 암하라어(am), 아삼어(as), 아제르바이잔어(az), 벨라루스어(be), 보스니아어(bs), 카탈루냐어(ca), 세부아노(ceb), 코르시카어(co), 웨일즈어(cy), 디베히어(dv), 에스페란토(eo), 바스크어(eu), 페르시아어(fa), 필리핀어(타갈로그어)(fil), 프리지아어(fy), 아일랜드(ga), 스코틀랜드 게일어(gd), 갈리시아어(gl), 구자라트어(gu), 하우사(ha), 하와이어(haw), 몽어(hmn), 하이티어(ht), 아르메니아(hy), 이그보어(ig), 아이슬란드어(is), 자바어(jv), 조지아어(ka), 카자흐어(kk), 크메르(km), 칸나다어(kn), 크리오(kri), 쿠르드어(ku), 키르기스어(ky) 라틴어(la), 룩셈부르크어(lb), 라오어(lo), 말라가시어(mg), 마오리어(mi), 마케도니아어(mk), 말라얄람어(ml), 몽골어(mn), 메이테이어(마니푸르어)(mni-Mtei), 마라티어(mr), 말레이어(ms), 몰타어(mt), 미얀마(버마어)(my), 네팔어(ne), 니안자(치셰와)(ny), 오리디아(오리야어)(or), 펀자브어(pa), 파슈토(ps), 신디어(sd), 싱할라어(싱할라어)(si), 사모아어(sm), 쇼나(sn), 소말리어(so), 알바니아어(sq), 세소토어(st), 순다어(su), 타밀어(ta), 텔루구(te), 타지크(tg), 위구르(ug), 우르두어(ur), 우즈베크(uz), 코사어(xh), 이디시어(yi), 요루바어(yo), 줄루어(zu)
다음 단계
Gemini API의 기능 사용해 보기
- 멀티턴 대화 (채팅)를 빌드합니다.
- 다음에서 텍스트 생성 텍스트 전용 프롬프트가 있습니다.
- 다음에서 텍스트 생성 멀티모달 프롬프트 (텍스트, 이미지, PDF, 동영상, 오디오 포함)
- 함수 호출을 사용하여 연결 생성하는 방법을 알아보겠습니다