GAR(Generation-Augmented Retrieval)은 생성형 AI(Generative AI)와 검색 기술을 결합하여 검색 성능을 향상시키는 새로운 방식이다. 기본의 RAG(Retrieval-Augmented Generation)와는 반대로 작동하며, 생성된 데이터를 검색에 활용하는 것이 특징이다.
[GAR 개념]
GAR은 LLM을 활용하여 사용자의 질의를 재구성하거나 확장해 더 나은 검색 결과를 얻는 기술이다.
단순히 키워드 기반 검색에 의존하지 않고, 생성 모델이 의미론적으로 강화된 질의를 만들어 검색 엔진의 성능을 높이는 데 초점을 맞추고 있다.
[GAR 동작 원리]
1. 사용자 질의 - 입력된 질문을 LLM이 분석하여 재구성)
2. 질의 확장 및 생성 - LLM이 다양한 표현이나 관련 키워드를 포함한 새로운 질의를 생성
3. 검색 수행 - 새로 생성된 질의를 가지고 검색 엔진이 문서를 탐색
4. 결과 통합 및 피드백 루프 - 검색 결과를 다시 생성 모델로 전달하여 요약하거나 추가 질의를 생성해 반복 검색 수행
[GAR 장점]
1. 질의 불완전성 극복 - 모호하거나 축약된 질의를 의미론적으로 확장하여 더 나은 결과를 제공
2. 검색 다각화 - 다양한 표현과 키워드를 통해 더 많은 관련 문서 확보
3. 비용 효율성 - 베터화(Vectorization) 없이도 기존 키워드 기반 검색 엔진의 성능 향상
4. 검색 품질 개선 - 고품질 문서를 선볇하여 최종 응답 정확도 높임
벡터화(Vectorization)는 데이터를 수치적 표현으로 변환하여 기계 학습 알고리즘이 처리할 수 있도록 만드는 과정.
텍스트, 이미지, 오디오 등 다양한 형태의 데이터를 벡터로 변환하여 효율적으로 저장, 검색, 분석할 수 있게 한다.
[RAG vs GAR]
특징 | RAG (Retrieval-Augmented Generation) | GAR (Generation-Augmented Retrieval) |
주요 방향 | 검색 결과를 생성 모델에 전달 | 생성 결과를 검색 과정에 활용 |
목적 | 신뢰할 수 있는 응답 생성 | 더 나은 검색 결과 제공 |
응용 분야 | 챗봇, Q&A 시스템 | 고급 검색 엔진, 기업 데이터 검색 |
GAR은 생성형 AI와 검색 기술의 결합으로 더욱 정교하고 효율적인 정보 탐색을 가능하게 하는 혁신적인 기술이다.