Subnostr

If you wanna try llama2 70B:

How much fucking VRAM do you need to run this model?

Please Login to reply.

Dunno, but here a pure C Llama2 model that runs crazy fast on cpu