Gemini 모델 알아보기

Gemini 모델군은 멀티모달 이미지, 동영상, 텍스트, 이미지, 오디오, 동영상 등 다양한 형식의 사용할 수 있습니다. 예를 들어 Gemini 모델에 접시 사진을 전송할 수 있습니다. 쿠키의 레시피를 제공하도록 요청합니다.

프롬프트 응답

이 쿠키의 레시피를 알려주세요.

초콜릿 칩 쿠키 여러 장의 사진
**재료**
- 1컵. (2 스틱) 무염 버터, 실온
- 3/4컵 정제 설탕
- 3/4컵 갈색 설탕, 팩
- 1티스푼 바닐라 추출물
- 큰 계란 2개
- 2와 1/4컵 다목적 밀가루
- 1티스푼 베이킹 소다
- 1티스푼 소금
...

다음을 사용하여 Gemini 모델군과 상호작용할 수 있습니다. Gemini API 제공: Vertex AI 날짜: Google Cloud 모바일 및 웹 앱의 경우 Vertex AI in Firebase Gemini API를 호출하고 앱에서 바로 Gemini 모델을 사용할 수 있습니다.

이 페이지에서는 Gemini 모델에 대해 다음 정보를 제공합니다.

  • 다양한 Gemini의 사용 사례에 대한 대략적인 비교 여기에는 지원되는 입력 유형이 포함됩니다.

  • 각 모델의 세부정보 비교(예: 최대 입력 토큰이나 동영상의 최대 길이입니다.

  • Gemini 모델의 버전 관리 방식에 대한 설명(특히) 안정화 버전, 자동 업데이트, 미리보기 버전 등 3가지 버전이 있습니다.

  • 사용 가능한 모델 이름 목록 코드를 캡쳐하는 데 사용됩니다.

  • Gemini 모델에 지원되는 언어의 목록입니다.

사용 가능한 모델

Vertex AI in Firebase와 함께 다음 Gemini 모델을 사용할 수 있습니다.

  • Gemini 1.5 플래시
    동일한 입력과 출력을 지원하는 멀티모달 모델 1.5 Pro로 분류되었지만 100만 개의 토큰이 긴 컨텍스트에서 이해됩니다. Gemini 1.5 Flash는 대용량, 비용 효율성을 위해 특별히 설계되었습니다. 애플리케이션을 실행할 수 있습니다

  • Gemini 1.5 Pro
    멀티모달 모델에서는 이미지, 오디오, 동영상 텍스트나 코드 응답을 위한 텍스트 또는 채팅 프롬프트로 작성할 수 있습니다 또한 2백만 개의 토큰으로 긴 컨텍스트 이해를 지원합니다.

  • Gemini 1.0 Pro Vision
    다중 모달 모델은 텍스트 또는 코드 응답을 위한 이미지 및 동영상 채팅에 사용할 수 없습니다.

  • Gemini 1.0 Pro
    자연어 태스크, 멀티턴을 처리하도록 설계된 모델 채팅, 코드 생성, 코드 생성을 지원합니다.

코드에 포함할 모델 이름으로 이동

각 모델의 사용 사례 및 기능

Gemini 모델마다 다양한 사용 사례를 지원하는 다양한 기능이 있습니다. 각 유형에 관한 자세한 내용은 Google Cloud 문서를 참고하세요. Gemini 모델.

각 모델에 지원되는 입력 및 출력

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
입력 유형
텍스트
코드
이미지
PDF
동영상 (프레임 전용)
동영상 (프레임 및 오디오)
오디오
출력 유형
텍스트
코드

지원되는 파일 형식에 대한 자세한 내용은 다음을 참조하세요. Vertex AI Gemini API에 지원되는 입력 파일 및 요구사항

각 모델에서 지원되는 기능 및 일반 기능

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
텍스트 전용 프롬프트에서 텍스트 생성
멀티모달 프롬프트에서 텍스트 생성
JSON 출력 (제한된 스키마 모드)
(Vertex AI in Firebase SDK 지원 예정)
멀티턴 채팅
함수 호출
기본 함수 호출
병렬 함수 호출
함수 호출 모드
토큰 및 청구 가능 문자 계산
시스템 안내

각 모델에 대한 세부정보

속성 Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
총 토큰 한도 (입력 및 출력 합계) * 토큰 1,048,576개 토큰 2,097,152개 토큰 16,384개 토큰 32,760개
출력 토큰 한도 * 토큰 8,192개 토큰 8,192개 토큰 2,048개 토큰 8,192개
요청당 최대 이미지 수 이미지 3,000개 이미지 3,000개 이미지 16개 해당 사항 없음
base64로 인코딩된 최대 이미지 크기 7 MB 7 MB 7 MB 해당 사항 없음
최대 PDF 크기 30MB 30MB 30MB 해당 사항 없음
요청당 최대 동영상 파일 수 동영상 파일 10개 동영상 파일 10개 동영상 파일 1개 해당 사항 없음
최대 동영상 길이 (프레임만) 동영상 약 60분 동영상 약 60분 2분 해당 사항 없음
최대 동영상 길이 (프레임 및 오디오) 동영상 약 45분 동영상 약 45분 해당 사항 없음 해당 사항 없음
요청당 최대 오디오 파일 수 오디오 파일 1개 오디오 파일 1개 해당 사항 없음 해당 사항 없음
최대 오디오 길이 오디오 최대 8.4시간 오디오 최대 8.4시간 해당 사항 없음 해당 사항 없음

* 모든 Gemini 모델에서 토큰은 약 4자(영문 기준)로, 즉, 100 토큰은 약 60-80개의 영어 단어입니다. 총 카운트를 확인할 수 있습니다. 요청을 통해 countTokens

여기에서 모델 및 프로덕션에 대한 보다 자세한 정보를 입력 파일:

모델 버전 관리

Gemini 모델은 안정화 버전, 자동 업데이트 버전, 미리보기 버전으로 제공됩니다. 제공합니다

  • 안정화 버전은 정식 버전으로 간주됩니다.

    • 안정화 버전에는 모델 이름에 특정 3자리 버전 번호(예: gemini-1.0-pro-001
  • 자동 업데이트 버전은 항상 최신 안정화 버전을 가리킴 해당 모델 새로운 안정화 버전이 출시되면 자동 업데이트된 버전 자동으로 새로운 안정화 버전을 가리키기 시작합니다

    • 자동 업데이트된 버전에 없는 모델 이름이 있습니다. 부속물, 예: gemini-1.0-pro
  • 미리보기 버전은 새로운 기능을 가지며 안정적이지 않은 버전으로 간주됩니다. 미리보기 버전은 항상 최신 미리보기 버전의 해당 모델 새로운 미리보기 버전이 출시되는 경우 기존 미리보기 버전 자동으로 새 미리보기 버전을 가리키기 시작합니다

    • 미리보기 버전에는 모델 이름-preview 및 모델의 초기 출시 버전 날짜 (-MMDD) 예: gemini-1.5-pro-preview-0409 (2024년 4월 9일 출시)

자세히 알아보기: 사용 가능한 Gemini 모델 버전 및 수명 주기 자세한 내용은 Google Cloud 문서를 참조하세요.

사용 가능한 모델 이름

모델 이름은 모델 배포 중에 코드에 포함되는 명시적 값입니다. 초기화는 생성 모델을 시작합니다. 이 단계는 Gemini API)을 입력합니다. 사용 중인 언어의 초기화 예는 시작 가이드

Gemini 1.5 Flash 모델 이름

모델 이름 설명 출시 단계 최초 출시일 지원 중단 날짜
안정화 버전
gemini-1.5-flash-001 Gemini 1.5 Flash의 최신 안정화 버전 정식 버전 2024-05-24 2025-05-24 이전
자동 업데이트된 버전
gemini-1.5-flash 최신의 안정적인 1.5 Flash 버전을 가리킵니다.
(현재 gemini-1.5-flash-001)
정식 버전 2024-05-24 ---
버전 미리보기
gemini-1.5-flash-preview-0514 Gemini 1.5 Flash의 최신 미리보기 버전 공개 미리보기 2024-05-14 2024-06-24

Gemini 1.5 Pro 모델 이름

모델 이름 설명 출시 단계 최초 출시일 지원 중단 날짜
안정화 버전
gemini-1.5-pro-001 Gemini 1.5 Pro의 최신 안정화 버전 정식 버전 2024-05-24 2025-05-24 이전
자동 업데이트된 버전
gemini-1.5-pro 1.5 Pro의 최신 안정화 버전을 가리킵니다.
(현재 gemini-1.5-pro-001)
정식 버전 2024-05-24 ---
버전 미리보기
gemini-1.5-pro-preview-0514 Gemini 1.5 Pro의 최신 미리보기 버전 공개 미리보기 2024-05-14 2024-06-24
gemini-1.5-pro-preview-0409 gemini-1.5-pro-preview-0514을(를) 가리킵니다.
(최신 미리보기 버전)
공개 미리보기 2024-04-09 2024-06-14

Gemini 1.0 Pro Vision 모델 이름

모델 이름 설명 출시 단계 최초 출시일 지원 중단 날짜
안정화 버전
gemini-1.0-pro-vision-001 Gemini 1.0 Pro Vision의 최신 안정화 버전 정식 버전 2024-02-15 2025년 2월 15일 이전
자동 업데이트된 버전
gemini-1.0-pro-vision 1.5 Pro Vision의 최신 안정화 버전을 가리킵니다.
(현재 gemini-1.5-pro-vision-001)
정식 버전 2024-01-04 ---

Gemini 1.0 Pro 모델 이름

모델 이름 설명 출시 단계 최초 출시일 지원 중단 날짜
안정화 버전
gemini-1.0-pro-002 Gemini 1.0 Pro의 최신 안정화 버전 정식 버전 2024-04-09 2025-04-09 이전
gemini-1.0-pro-001 Gemini 1.0 Pro의 안정화 버전 정식 버전 2024-02-15 2025년 2월 15일 이전
자동 업데이트된 버전
gemini-1.0-pro 1.0 Pro의 최신 안정화 버전을 가리킵니다.
(현재 gemini-1.0-pro-002)
정식 버전 2024-02-15 ---

지원 언어

  • 모든 Gemini 모델은 다음 언어를 이해하고 응답할 수 있습니다.

    한국어(ko), 아랍어(ar), 벵골어(bn), 불가리아어(bg), 중국어 간체 및 번체(zh), 크로아티아어(hr), 체코어(cs), 덴마크어(da), 네덜란드어(nl), 영어(en), 에스토니아(et), 핀란드어(fi), 프랑스어(fr), 독일어(de), 그리스어(el), 히브리어(iw), 힌디어(hi), 헝가리어(hu), 인도네시아어(id), 이탈리아어(it), 일본어(ja), 라트비아어(lv), 리투아니아어(lt), 노르웨이어(no), 폴란드어(pl), 포르투갈어(pt), 루마니아어(ro), 러시아어(ru), 세르비아어(sr), 슬로바키아어(sk), 슬로베니아어(sl), 스페인어(es), 스와힐리어(sw), 스웨덴어(sv), 태국어(th), 튀르키예어(tr), 우크라이나어(uk), 베트남어(vi)

  • Gemini 1.5 Pro 및 Gemini 1.5 Flash 모델은 다음 추가 언어를 이해하고 응답할 수 있습니다.

    아프리칸스어(af), 암하라어(am), 아삼어(as), 아제르바이잔어(az), 벨라루스어(be), 보스니아어(bs), 카탈루냐어(ca), 세부아노(ceb), 코르시카어(co), 웨일즈어(cy), 디베히어(dv), 에스페란토(eo), 바스크어(eu), 페르시아어(fa), 필리핀어(타갈로그어)(fil), 프리지아어(fy), 아일랜드(ga), 스코틀랜드 게일어(gd), 갈리시아어(gl), 구자라트어(gu), 하우사(ha), 하와이어(haw), 몽어(hmn), 하이티어(ht), 아르메니아(hy), 이그보어(ig), 아이슬란드어(is), 자바어(jv), 조지아어(ka), 카자흐어(kk), 크메르(km), 칸나다어(kn), 크리오(kri), 쿠르드어(ku), 키르기스어(ky) 라틴어(la), 룩셈부르크어(lb), 라오어(lo), 말라가시어(mg), 마오리어(mi), 마케도니아어(mk), 말라얄람어(ml), 몽골어(mn), 메이테이어(마니푸르어)(mni-Mtei), 마라티어(mr), 말레이어(ms), 몰타어(mt), 미얀마(버마어)(my), 네팔어(ne), 니안자(치셰와)(ny), 오리디아(오리야어)(or), 펀자브어(pa), 파슈토(ps), 신디어(sd), 싱할라어(싱할라어)(si), 사모아어(sm), 쇼나(sn), 소말리어(so), 알바니아어(sq), 세소토어(st), 순다어(su), 타밀어(ta), 텔루구(te), 타지크(tg), 위구르(ug), 우르두어(ur), 우즈베크(uz), 코사어(xh), 이디시어(yi), 요루바어(yo), 줄루어(zu)

를 통해 개인정보처리방침을 정의할 수 있습니다.

다음 단계

Gemini API의 기능 사용해 보기