(Q115570683)

English

Reinforcement Learning from Human Feedback

variant of reinforcement learning

RLHF
Reinforcement learning from human feedback
reinforcement learning from human preferences

In more languages

Statements

machine learning technique

0 references

reinforcement learning

0 references

described by source

Learning to summarize with human feedback

0 references

0 references

Sitelinks

Wikipedia(11 entries)

Wikibooks(0 entries)

Wikinews(0 entries)

Wikiquote(0 entries)

Wikisource(0 entries)

Wikiversity(0 entries)

Wikivoyage(0 entries)

Wiktionary(0 entries)

Multilingual sites(0 entries)

Retrieved from "https://www.wikidata.org/w/index.php?title=Q115570683&oldid=2117523804"