생성형 AI LLM 평가 방법 완전 정리 (LLMOps·RAG·추론 인프라 핵심 요약) 최근 LLM(대규모 언어 모델) 기반 서비스가 확산되면서 가장 중요한 질문이 등장했습니다. “LLM 애플리케이션을 어떻게 평가하고 운영할 것인가?” 기존 머신러닝 시스템은 정답이 명확하고 출력이 결정적이었습니다. Accuracy, Precision 같은 지표로 비교적 쉽게 …