It fits, whisper.cpp uses 4 bit quantization, 13B model takes a little bit more ...

		terafo on March 13, 2023 \| parent \| context \| favorite \| on: Dalai: Automatically install, run, and play with L... It fits, whisper.cpp uses 4 bit quantization, 13B model takes a little bit more than 8gb and around 9gb ram while inferencing.