| HN Mirror

Y	Hacker News new \| ask \| show \| jobs


	by stavros 1165 days ago
	Reinforcement learning through human feedback. Took me a bit of searching too.