반응형
250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- sample
- Ai
- JS
- s3
- ChatGPT
- unity
- logstash
- Git
- API
- Linux
- Python
- 유니티
- 엘라스틱서치
- build
- MySQL
- AWS
- nodejs
- Kibana
- mariadb
- JavaScript
- error
- MSSQL
- ssh
- 설정
- 영어
- 구글
- elasticsearch
- Windows
- docker
Archives
- Today
- Total
가끔 보자, 하늘.
precision_threshold 이야기 본문
DSL에서는 precision_threshold값을 적용하여 사용했는데, Kibana에서는 적용해본 적이 없다가 사용하시는 동료들이 값이 이상하다며 내용을 찾아보게 되었습니다.
Metrics에 Y-Axis의 Aggregation을 Unique Count로 지정했을때 아래와 같은 값이 출력되고 있었습니다.
이 값이 terms로 뽑을 때와 3% 정도 차이가 나고 있어 DSL에 적용한 precision_threshold 설정을 적용해 봤습니다.
Metrics 하단에 JSON input 란이 있습니다. 여기에 아래와 같이 입력하면 됩니다. precision_thredshold의 기본값은 3000이며, 최대값은 40000입니다.
아래와 같이 조정이 되지만 terms와 완전히 동일한 값이 되지는 않습니다.
hits 수는 2천만개에 terms의 결과는 16779개라 애매하네요. -_-a 최대치로 올려도 조금의 차이는 발생합니다.
가끔 정확한 수치가 필요한 경우 raw data를 모두 검색해서 별도로 지표 처리를 하면 할 수는 있지만 이런 경우는 대처하기 애매하네요.
반응형
'개발 이야기 > DB, 데이터분석, AI' 카테고리의 다른 글
Python으로 제작한 자동 번역 및 음성 파일 생성툴 (0) | 2020.09.23 |
---|---|
MSSQL RECOVERY 옵션 (0) | 2020.09.09 |
MSSQL 버전 별 암호화 지원 정리 (0) | 2020.01.30 |
MSSQL Linked Server 설정 방법 (0) | 2020.01.27 |
logstash tcp로 데이터 전송 시 손실없는 데이터 전달 흐름 설계 (0) | 2020.01.15 |