주요 LLM

 

  • LLaMA: 페이스북이 공개(상업적 이용X)
  • MPT: Llama와 비슷하지만 상업적 이용이 가능
  • Falcon: TII에서 공개한 모델. 성능이 높음. 허깅페이스에서 다운로드 가능
  • XGen: 최대 8K 시퀀스로 학습(타 모델은 보통 2K 정도)
  • Vicuna: ShardGPT로 부터 수집된 대화로 LLaMA를 fine-tuning한 모델

 

리더보드

 

 

데이터셋

 

 

한국어 LLM