Gemma(언어 모델)
덤프버전 :
1. 개요[편집]
구글에서 공개한 오픈 소스 경량 대규모 언어 모델(SLLM). Gemini의 경량화 모델이다.
2. 특징[편집]
Gemma는 20억 매개변수를 가진 Gemma 2B와 70억 매개변수를 가진 Gemma 7B 두가지 모델로 제공된다.
Gemini와 같은 일반적인 대규모 언어 모델(LLM)에 비해 크기가 작아 온디바이스 AI로 사용이 가능하다.
구글이 공개한 벤치마크 데이터에 따르면 젬마는 메타의 LLaMA-2보다 평균 19점 높은 64.3점을 기록했다.
엔비디아 와의 제휴를 통해 GPU 최적화를 지원한다.
3. 평가[편집]
4. 긍정적 평가[편집]
5. 부정적 평가[편집]
- 구글에서 공개한 벤치마크 결과와는 다르게 성능이 매우 처참하다는 평이 많다. 메타의 LLaMA-2에 비해 체감 상 오히려 성능이 낮다는 의견이 대다수이다.
- 세종대왕 맥북 프로 던짐 사건이 실제로 존재한다고 대답하는 등 할루시네이션 역시 매우 심한 것으로 보인다.
6. 기타[편집]
허깅 챗에서 gemma 모델을 활성화 한 후 사용해 볼 수 있다.
이 문서의 내용 중 전체 또는 일부는 2024-03-10 22:03:38에 나무위키 Gemma(언어 모델) 문서에서 가져왔습니다.