deepseek本地部署,ragflow,docker

news/2025/2/25 7:29:20

先下载ollama

1.官网下载 

deepseek-r1:14bhttps://ollama.com/library/deepseek-r1:14b

2.GitHub下载GitHub - ollama/ollama: Get up and running with Llama 3.3, DeepSeek-R1, Phi-4, Gemma 2, and other large language models.

两种方式

安装完后,cmd->ollama run deepseek-r1:14b

用于下载相应大小的模型,我这个是14b,具体可在官网挑选

deepseek-r1:14bhttps://ollama.com/library/deepseek-r1:14b

cmd输入对应指令,会进行下载,已经下载成功了,输入此指令会run,如下

可以输入ollama list查看电脑下载了什么模型

下载模型前,如果不想把模型下载到C盘,可以环境变量设置:OLLAMA_MODELS

OLLAMA_HOST,是因为在ragflow部署的是docker虚拟机(它翻译的是基于linux的win,我理解是基于win的linux系统),要访问本机,需要开这个端口

设置好了环境变量,记得重启,才生效

GitHub上下载ragflow代码解压

GitHub - infiniflow/ragflow: RAGFlow is an open-source RAG (Retrieval-Augmented Generation) engine based on deep document understanding.

找到docker文件夹,修改env文件

注释RAGFLOW_IMAGE=infiniflow/ragflow:v0.16.0-slim

取消注释RAGFLOW_IMAGE=infiniflow/ragflow:v0.16.0

此目的是为了安装全量版本的ragflow,GitHub上有说

docker文件夹下打开cmd(一定要在docker页面下输入,不然会报错),输入

docker compose -f docker-compose.yml up -d

出现如下错误context canceled,我的解决方法为科学上网

成功下载后,输入docker compose -f docker-compose.yml up -d,界面为:

打开docker,不用sign in,直接continue,skip,到如下界面,可以看到已经启动,container memory usage 为9.23GB,就是前面ollama run deepseek-r1:14b,下载的模型大小。

此时右下角会有2个图标

打开网页,输入localhost:80,打开ragflow,账号密码随便注册(因为是在本地,没限制)

登录过后,点击1.右上角头像;2.模型提供商;3.待添加的模型。

找到ollama,添加模型,deepseek是chat模型,选择chat,模型名称可以在cmd-ollama list查看

url自己本机的ip加端口(前面环境变量记得设置),然后token(随便写),确定。

如果报错,如下,模型名称不要直接粘贴从ollama上复制的ollama run deepseek-r1:14b,把ollama run去掉。我个肺雾,我一直以为是网络不通,在调ip,环境变量,防火墙(还报错,可能防火墙拦截了,直接关掉)

添加成功后,知识库,创建知识库

新增文件(上传自己的知识库),记得解析(圈起来的横三角)

点击聊天,新建助理,选择前面创建的知识库

进行问答


http://www.niftyadmin.cn/n/5865170.html

相关文章

服务器广播需要广播的服务器数量

服务器广播需要广播的服务器数量 真题目录: 点击去查看 E 卷 100分题型 题目描述 服务器连接方式包括直接相连,间接连接。 A和B直接连接,B和C直接连接,则A和C间接连接。 直接连接和间接连接都可以发送广播。 给出一个N*N数组,代表N个服务器, matrix[i][j] == 1, 则…

3D Web轻量化引擎HOOPS Communicator如何赋能航空航天制造?

在当今航空航天制造领域,精确度、效率和协作是推动行业发展的关键要素。随着数字化技术的飞速发展,3D Web可视化开发包HOOPS Communicator 为航空航天制造带来了革命性的变化。它凭借强大的功能和灵活的应用,助力企业在设计、生产、培训等各个…

Python在实际工作中的运用-CSV数据的几个处理方法

相信工作时间较长的“表哥们”一定都遇到过需要对存在固定格式的一些比较特殊的CSV文件进行处理的工作,比如CSV文本是从数据库里导出的格式文本,此时如果CSV文件中再出现个什么像身份证号码这类超过15个字符的数据时,如采用Excel直接打开保存…

html中的元素(1)

​大家好!我叫补三补四 欢迎学习讨论 ​ 常用属性 表单元素form用于创建提供用户输入的表单,常用属性 1.action:规定表单提交网址 2.method:规定提交方法是get还是post 3.enctype:规定编码方式 4.name:表…

在 Mac mini M2 上本地部署 DeepSeek-R1:14B:使用 Ollama 和 Chatbox 的完整指南

随着人工智能技术的飞速发展,本地部署大型语言模型(LLM)已成为许多技术爱好者的热门选择。本地部署不仅能够保护隐私,还能提供更灵活的使用体验。本文将详细介绍如何在 Mac mini M2(24GB 内存)上部署 DeepS…

地铁站内导航系统:基于蓝牙Beacon与AR技术的动态路径规划技术深度剖析

本文旨在分享一套地铁站内导航系统技术方案,通过蓝牙Beacon技术与AI算法的结合,解决传统导航定位不准确、路径规划不合理等问题,提升乘客出行体验,同时为地铁运营商提供数据支持与增值服务。 如需获取校地铁站内智能导航系统方案文…

BUU40 [CSCCTF 2019 Qual]FlaskLight1【SSTI】

模板: {{.__class__.__base__.__subclasses__()[80].__init__.__globals__[__builtins__].eval("__import__(os).popen(type flag.txt).read()")}} 是个空字符串,.__class__代表这个空字符串的类是什么(这里是单引号双引号都行&a…

Wireshark详解

Wireshark使用详解 1.Wireshark 简介2.下载与安装1. 下载地址2. 安装步骤(以 Windows 为例) 3. 界面与核心功能1. 主界面布局2. 常用菜单功能 4. 过滤功能详解1. 过滤类型2. 常用过滤命令 5. 过滤命令与网络结构对应6. 使用注意事项7. 案例分析 TCP 三次…