Prometheus: Inducing Fine-grained Evaluation Capability in Language Models

Abstract

Evaluator LM을 훈련하기 위해 설계된 feedback collection dataset과 평가에 특화된 모델인 Prometheus 제안

[arXiv](2024/03/09 version v2, 2023/10/12 v1)

Feedback collection을 이용해 Llama-2-chat을 fine-tuning 하여 Prometheus를 얻는다.

Lory: Fully Differentiable Mixture-of-Experts for Autoregressive Language Model Pre-training (0)	2024.05.10
Soft Merging of Experts with Adaptive Routing (SMEAR) (0)	2024.05.08
Prometheus 2: An Open Source Language Model Specialized in Evaluating Other Language Models (0)	2024.05.08
Iterative Reasoning Preference Optimization (0)	2024.05.03
Better & Faster Large Language Models via Multi-token Prediction (2)	2024.05.03
Octopus v4: Graph of language models (0)	2024.05.03