目前在开源大模型领域,Llama3 无疑是最强的!这次Meta不仅免费公布了 8B和70B两个性能强悍的大模型,400B也即将发布,这是可以和GPT-4对打的存在!今天我们就来介绍3各本地部署方法,简单易懂,非常适合新手!
1. GPT4All : 适合低配置用户,可以在CPU/GPU上跑 【点击下载】
2.LMstudio ,支持下载多模型 8B/70B 等,模型选择更多!【点击下载】
提醒:如果你不在海外,实在下载不了模型,稍后会把Llama 3 大模型上传到网盘 【点击下载】稍后更新…..
3.Ollama,支持多平台!Windows / Mac /Linux 都可以运行 【点击下载】
并在 Windows 上打开 WSL 功能
安装Docker Desktop :【点击前往】
然后本地安装webUI
(1)在CPU下运行:
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
(2)支持GPU运行:
docker run -d -p 3000:8080 --gpus=all -v ollama:/root/.ollama -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:ollama
(2.1)设置环境变量
API端口:
变量:OLLAMA_HOST
值:0.0.0.0:11434
模型存放路径:
变量:OLLAMA_MODELS
值:D:\xxxxx
安装完成通过本地地址:http://127.0.0.1:3000 进行访问