GitHub 中文社区
回车: Github搜索
Shift+回车: Google搜索
论坛
排行榜
趋势
集合
主题
趋势
排行榜
#
preference-alignment
Organization
Website
Wikipedia
SimPO
@princeton-nlp
SimPO: Simple Preference Optimization with a Reference-Free Reward
alignment
large-language-models
preference-alignment
rlhf
Python
274
7 个月前