参考教程:
https://www.bilibili.com/video/BV1kC411n7hD
使用 unsloth,支持llama3
占用显存大概8G
使用GPT4ALL加载训练好的大模型
llama.cpp进行4bit量化, 量化后的大模型可以用CPU跑
参考教程:https://www.bilibili.com/video/BV1G7tQehEBE
MAID手机app,可以在安卓上本地跑大模型,或者调用家里台式机的ollama接口api,也可以调用收费的api
MLC这个软件也可以实现,看起来也挺好用的。https://www.bilibili.com/video/BV1QZ421N7Yt/
FASTGPT客制化大模型,AI私有化客服: https://blog.csdn.net/pythonhy/article/details/143480847