KT Embedding / Reranker 모델을 공개·상용 모델과 동일 조건에서 비교했습니다. 한국어는 MTEB-ko(KURE 8개 평가셋), 영어는 MTEB-eng 기준이며, 임베딩은 nDCG@10, 리랭커는 Hit@3로 평가했습니다.
모든 KT Embedding·Reranker 모델은 한국어와 영어를 모두 지원합니다. 아래는 비교 대상 공개·상용 모델과 함께 정리한 스펙입니다.
| 구분 | 모델 | Memory (MB) | Params | Dim | Max Tokens | 지원 언어 |
|---|
| 구분 | 모델 | Memory (MB) | Params | Max Tokens | 지원 언어 |
|---|
모델 종류와 언어를 선택하면 평균 점수 비교 차트와 평가셋별 상세 표가 함께 갱신됩니다. KT 모델은 붉은색으로 강조됩니다.
각 열의 최고값은 붉은색으로 표시됩니다. 리랭커 표의 KT-Embedding-3-1.7B 행은 재순위화 이전 임베딩 기준선입니다.
정확도는 거의 유지하면서 메모리·색인·검색 지연을 크게 줄였습니다. (H100 80GB 기준, 문서 100만 건 색인)
MTEB-Retrieval Kor/Eng 평균. 임베딩은 nDCG@10, 리랭커는 Hit@3.
모델이 점유하는 메모리(MB).
3,000건에 대한 모델 inference 시간 (batch size 1 / max length 8,192).
문서 100만 건 색인 기준 메모리(GB).
문서 100만 건 색인에 대한 랜덤 질의 20건의 검색 속도(s).
[Hardware]
NVIDIA H100 80GB HBM3, 81559 MiB
Intel(R) Xeon(R) Platinum 8480C
1.8Ti RAM
[Software]
OS: Ubuntu 24.04.1 LTS
Kernel: 5.15.0-1042-azure
Python: 3.12.3
PyTorch: 2.8.0+cu128
CUDA: 12.8
한국어는 KURE 리더보드 8개 평가셋, 영어는 MTEB-eng Retrieval 10개 평가셋을 사용했습니다.