Multi-Agent-as-Judge: Aligning LLM-Agent-Based Automated Evaluation with Multi-Dimensional Human Evaluation
Written By. Jiaju Chen, Yuxuan Lu, Xiaojie Wang, Huimin Zeng, Jing Huang, Jiri Gesi, Ying Xu, Bingsheng Yao, Dakuo Wang 1. 문제정의 현실 과제 평가의 본질적 어려움 실제 NLP 응용은 교육·의료처럼 다양한 이해관계자 관점이 동시...