| HN Mirror

Y	Hacker News new \| ask \| show \| jobs

by tmikaeld 694 days ago

Solved, see:

Works very well now! 65K input tokens with 8192 output tokens is no longer an issue on my 4090. (It maxes out on 22GB/VRAM)

1 comments

Awesome! Glad to hear you got it sorted out.