Notice
Recent Posts
Recent Comments
Link
가끔 보자, 하늘.
bge-m3 vs nomic-embed-text 본문
| 비교 항목 | BAAI bge-m3 | Nomic nomic-embed-text |
| 주력 언어 | 다국어 (한국어 포함 100여 개 언어 최적화) | 주로 영어 (다국어도 지원하나 한국어는 상대적 열세) |
| 모델 크기 | 약 567M 파라미터 (상대적으로 무겁고 느림) | 약 137M 파라미터 (매우 가볍고 빠름) |
| 임베딩 차원 | 1024 차원 고정 | 768 차원 (Matryoshka 기술로 자유롭게 축소 가능) |
| 컨텍스트 길이 | 8192 토큰 | 8192 토큰 |
| 핵심 무기 | 하이브리드 검색 (Dense + Sparse + ColBERT) | 압도적인 가성비, 벡터 DB 저장 공간 획기적 절약 |
'개발 이야기 > DB, 데이터분석, AI' 카테고리의 다른 글
| Google Analytics 연동 절차 (0) | 2026.02.19 |
|---|---|
| DATABASE 1~3정규화를 가장 쉽게 이해하기 (0) | 2024.07.20 |
| Chat with RTX 사용기 (32) | 2024.02.19 |
| 수식없이 LLM 이해하기 (32) | 2024.02.15 |
| Elasticsearch 에서 특정 날짜 데이터 재구축이 필요할 때 (32) | 2023.12.27 |