DB/ElasticSearch
index정의 json
doriver
2025. 1. 13. 11:16

settings의 analysis 속성
텍스트 데이터를 색인하고 검색할 때 텍스트를 분석하는 방식을 정의하는 부분
분석기(analyzer), 토크나이저(tokenizer), 그리고 토큰 필터(token filter) 등을 설정
settings
- analysis
- tokenizer, filter, analyzer
Analyzer( 분석기 )
텍스트를 색인 및 검색하기 위해 처리하는 논리적 단위
하나 이상의 Tokenizer와 Token Filters를 조합하여 동작
Tokenizer( 토크나이저 )
입력 텍스트를 단어(토큰)로 분리
nori_tokenizer 사용
type( nori_tokenizer ), decompound_mode( mixed ), discard_punctuation( true )
Token Filters( 토큰 필터 )
Tokenizer로 생성된 토큰을 추가로 처리
소문자 변환, 불용어 제거, 형태소 분석 등을 포함
stopwords , nori_part_of_speech, english_stemmer ...