RAG 모델을 한 번쯤 만들어 본 사람이라면 이런 고민을 해본 적이 있을 것이다. "모델이 답변을 만들어 내고 있긴 한데, 정확히 얼마나 잘하고 있는 걸까?""결과가 별로일 때 내 검색 단계가 문제인지, 아니면 생성 단계가 문제인지 어떻게 구분할 수 있지?" 이럴 때 단순히 사람이 직접 눈으로 확인하는 방식만으로는 한계가 있다. 데이터셋이 많아질 수록 평가 비용은 기하 급수적으로 커지고, 결국 객관성이 떨어진다. 여기서 등장한 도구가 바로 RAGAS (Retrieval-Augmented Generation Evaluation System) 이다. RAGAS는 말 그대로 RAG 과정을 자동화된 방식으로 평가할 수 있게 해주는 라이브러리다.1. RAGAS란 무엇인가?논문 : https://arxiv.o..