新llama.cpp llama.cpp 是一个可以让大语言模型在本地电脑运行的推理框架。 090 实用工具# AI开源工具# GGUF# https://github.com/ggml-org/llama.cpp