가끔 보자, 하늘.

bge-m3 vs nomic-embed-text 본문

개발 이야기/DB, 데이터분석, AI

bge-m3 vs nomic-embed-text

가온아 2026. 6. 5. 04:35
비교 항목 BAAI bge-m3 Nomic nomic-embed-text
주력 언어 다국어 (한국어 포함 100여 개 언어 최적화) 주로 영어 (다국어도 지원하나 한국어는 상대적 열세)
모델 크기 약 567M 파라미터 (상대적으로 무겁고 느림) 약 137M 파라미터 (매우 가볍고 빠름)
임베딩 차원 1024 차원 고정 768 차원 (Matryoshka 기술로 자유롭게 축소 가능)
컨텍스트 길이 8192 토큰 8192 토큰
핵심 무기 하이브리드 검색 (Dense + Sparse + ColBERT) 압도적인 가성비, 벡터 DB 저장 공간 획기적 절약