| HN Mirror

Y	Hacker News new \| ask \| show \| jobs


	by potamic 122 days ago
	> You can do local AI inference and get Claude Opus-level performance (Kimi K2.5) over a cluster of Mac Studios with Exo.Labs Does it do distributed inference? What kinda token speeds do you get?