DB/ElasticSearch

index정의 json

doriver 2025. 1. 13. 11:16

settings의 analysis 속성 

텍스트 데이터를 색인하고 검색할 때 텍스트를 분석하는 방식을 정의하는 부분
분석기(analyzer), 토크나이저(tokenizer), 그리고 토큰 필터(token filter) 등을 설정

 

settings

   - analysis

       - tokenizer, filter, analyzer

 

Analyzer( 분석기 )

텍스트를 색인 및 검색하기 위해 처리하는 논리적 단위
하나 이상의 Tokenizer와 Token Filters를 조합하여 동작

Tokenizer( 토크나이저 )

입력 텍스트를 단어(토큰)로 분리
nori_tokenizer 사용
type( nori_tokenizer ), decompound_mode( mixed ), discard_punctuation( true )

Token Filters( 토큰 필터 )

Tokenizer로 생성된 토큰을 추가로 처리
소문자 변환, 불용어 제거, 형태소 분석 등을 포함

stopwords , nori_part_of_speech, english_stemmer  ...