생성형 AI가 검색도 해준다고? GAR 기술 쉽게 정리!

GAR(Generation-Augmented Retrieval)은 생성형 AI(Generative AI)와 검색 기술을 결합하여 검색 성능을 향상시키는 새로운 방식이다. 기본의 RAG(Retrieval-Augmented Generation)와는 반대로 작동하며, 생성된 데이터를 검색에 활용하는 것이 특징이다.

[GAR 개념]

GAR은 LLM을 활용하여 사용자의 질의를 재구성하거나 확장해 더 나은 검색 결과를 얻는 기술이다.

단순히 키워드 기반 검색에 의존하지 않고, 생성 모델이 의미론적으로 강화된 질의를 만들어 검색 엔진의 성능을 높이는 데 초점을 맞추고 있다.

[GAR 동작 원리]

1. 사용자 질의 - 입력된 질문을 LLM이 분석하여 재구성)
2. 질의 확장 및 생성 - LLM이 다양한 표현이나 관련 키워드를 포함한 새로운 질의를 생성

3. 검색 수행 - 새로 생성된 질의를 가지고 검색 엔진이 문서를 탐색

4. 결과 통합 및 피드백 루프 - 검색 결과를 다시 생성 모델로 전달하여 요약하거나 추가 질의를 생성해 반복 검색 수행

[GAR 장점]

1. 질의 불완전성 극복 - 모호하거나 축약된 질의를 의미론적으로 확장하여 더 나은 결과를 제공

2. 검색 다각화 - 다양한 표현과 키워드를 통해 더 많은 관련 문서 확보

3. 비용 효율성 - 베터화(Vectorization) 없이도 기존 키워드 기반 검색 엔진의 성능 향상

4. 검색 품질 개선 - 고품질 문서를 선볇하여 최종 응답 정확도 높임

벡터화(Vectorization)는 데이터를 수치적 표현으로 변환하여 기계 학습 알고리즘이 처리할 수 있도록 만드는 과정.
텍스트, 이미지, 오디오 등 다양한 형태의 데이터를 벡터로 변환하여 효율적으로 저장, 검색, 분석할 수 있게 한다.

[RAG vs GAR]

특징	RAG (Retrieval-Augmented Generation)	GAR (Generation-Augmented Retrieval)
주요 방향	검색 결과를 생성 모델에 전달	생성 결과를 검색 과정에 활용
목적	신뢰할 수 있는 응답 생성	더 나은 검색 결과 제공
응용 분야	챗봇, Q&A 시스템	고급 검색 엔진, 기업 데이터 검색

GAR은 생성형 AI와 검색 기술의 결합으로 더욱 정교하고 효율적인 정보 탐색을 가능하게 하는 혁신적인 기술이다.

저작자표시 비영리 변경금지 (새창열림)

티스토리툴바