[BibTeX] [RIS]
Selective Preference Optimization via Token-Level Reward Function Estimation
Art der Publikation: Artikel in einem Konferenzbericht
Zitat: yang:2025
Publication status: Accepted
Buchtitel: Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing (EMNLP)
Jahr: 2025
Seiten: 7032–7056
URL: https://aclanthology.org/2025....
DOI: 10.18653/v1/2025.emnlp-main.359
Schlagworte:
Autoren Yang, K
Liu, Z.
Xie, Q.
Huang, J.
Min, E.
Ananiadou, S.
Hinzugefügt von: [PRT]
Gesamtbewertung: 0
Anhänge
    Notizen
      Themen