[BibTeX] [RIS]
Selective Preference Optimization via Token-Level Reward Function Estimation
Art der Publikation: beliebiger Eintrag
Zitat: yang:2024b
Jahr: 2024
Howpublished: arXiv
URL: https://arxiv.org/abs/2408.135...
Schlagworte:
Autoren Yang, K
Liu, Z.
Xie, Q.
Huang, J.
Min, E.
Ananiadou, S.
Hinzugefügt von: [PRT]
Gesamtbewertung: 0
Anhänge
    Notizen
      Themen