【业余玩儿AI】【文档问答】实操记录0822

2024-08-23 00:36

本文主要是介绍【业余玩儿AI】【文档问答】实操记录0822,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

电梯

  • 前文回顾
  • 继续踩坑实录
    • 从头来过,docker部署Ollama
    • 我一定是被偷听了,大数据之神把我拉出泥潭
    • 时间回到白天,模型初窥
    • 时间回到开心的链接上Ollama那一刻
  • 按捺住乱撞的小鹿,我去准备下文的剧情了

前文回顾

这里书接上文,上文说到:
目标是文档问答,先是本地部署了Marker,然后又试用了popai,最后发现了Dify,于是开始在本地部署Dify.
前天,小卡拉米我七尺咔嚓几下,Dify部署很顺利,但是链接不上本地Ollama.这种问题对于刚开始学习的小卡拉米来说实在难解.

继续踩坑实录

从头来过,docker部署Ollama

我实在是想不出问题的原因,剩下几个不多的我猜测的且都不愿意相信的原因里面,只能从里面逐个尝试.比如原来下载的Ollama是windows预览版,会不会是有bug.于是卸载了用docker重新部署.
打开Ollama官网的文档hub.docker.com/r/ollama/ollama操作,说要先安装英伟达的toolkit,不会,找到一篇[小小的太阳]前辈的文章,传送门,Sxiu~~~,按着做完了,还算比较顺利,我就不赘述了.
安装完后继续按照Ollama的doc继续下载之前的qwen2:7b.

docker exec -it ollama ollama run qwen2:7b

再重新部署Dify,参照之前的流程,这次就顺利多了,越过了低级错误.
再次来到配置Ollama的页面,激动的心,颤抖的手,输入所有参数,点击确认.
哦买尬~ 依然没连上… 后面一点进展没有,按下不表…

我一定是被偷听了,大数据之神把我拉出泥潭

昨天早上,当我晃晃悠悠的在上班的地铁上消磨我那丈二和尚摸不着头脑的莫名时刻,抖音画面刚刷过一条052D在英国大门口自由航行的新闻,我还在畅想自己啥时候能把这个问题突破让我在AI的道路上也自由航行一把,就刷到了一条Dify+Ollama(Docker)的视频,然后男主当着我的面在配置Ollama的界面上敲入了一行我闻所未闻的链接

http://host.docker.internal:11434

没见过…没见过!意味着新的可能,而且那么巧,我刚刚用docker重新部署了Ollama.你们说我是不是被偷听了…
一闭眼一睁眼,一白天过去了…
晚上回到家,又是激动的心,又是颤抖的手,输入blingbling的链接,点击确认.接下来的几秒,好消息是没有error,坏消息是没有任何反应.额…当我吸足了气准备吐槽一个问题没搞定又出新状况的时候,那个表示链接状态的小灯从灰色变成绿色,哇哈哈哈,简直是天助我也~~~~~
在此,我必须感谢一下把我救出泥潭的大哥,虽然素未谋面也不知大哥身材是否伟岸,但是在我小卡拉米的心里他是伟大的!请受小卡拉米一拜~~
介绍一下大哥,抖音账号ldfmlsys
在这里插入图片描述
去大哥的账号里面翻了翻,都是讲本地知识库部署的,哇哈哈哈,你说大数据没分析我我都不相信!感兴趣的也可以去翻翻,这大哥视频下面的点评都回复的.才关注82个人,小卡拉米我都关注1000个人,一看就是专注技术的大才!是我等小卡拉米的榜样!请容小弟再拜~~

时间回到白天,模型初窥

到这里应该也能看出我今天心情不错了,这个问题卡了我三天了,很多小卡拉米被卡3天可能都已经放弃了,而我是个意志坚定的卡拉米!
这里采用倒叙的叙事方法说一下白天的事情.
白天当然也没闲着,去了Dify官网的页面摸索了一下,感兴趣的也可以去瞅瞅:Dify官网app传送门,Sxiu~~~,在里面试了一下模型链接\上传文档到知识库\参考前辈聊天机器人新建了一个基于知识库进行问答的聊天机器人.像我这么优秀,啊不,这么爱琢磨的卡拉米还是拿捏的了的.
在这个过程里面跟着工具配置的过程,了解它工作的思路和原理,原来LLM\Rerank\Embeding的模型是这么个应用流程,对RAG和Rerank有了比较直观的感受, 过程里面虽然用到了Embeding的模型,但是还没搞明白是怎么用上的,还有传说中的向量数据库,就是所谓的知识库,虽然用了,但是对我完全透明,也有需要进一步研究的.
总而言之,要了解的东西就像吹气球一样随着体积和表面积增大接触到的未知的知识是按照很多次方的速度增加的.

时间回到开心的链接上Ollama那一刻

连上之后准备万解,开始蓄力.
基于白天的收获,开始搜索免费开源可以本地部署的各种模型.
LLM模型除了qwen2,llama3.1,发现google的gemimi收费前的免费额度也很高(了解到这个也得感谢抖音美好生活的大数据之神),这种模型多到几句说不完,不过目前qwen2我觉得就够了,基于前几天的试用,感觉qwen2比llama3.1更适合我,有个能用的先用着,整明白了再优化.
Rerank的模型,在Dify的服务接口页面上找到了jina传送门,Sxiu~~~去看了一眼,这个有意思,页面上直接显示APIKey,还有这个API剩余的token数量,意思是不嫌麻烦就可以白嫖? 直接连在我的Dify上,顺利成功.
Embeding的模型,在Ollama的lib里面直接搜,找到一个pull了380多K的模型,了解了一下的确有点货,直接pull.

ollama pull nomic-embed-text:v1.5

知识库,Dify自带且免费,先不费劲了找了.

按捺住乱撞的小鹿,我去准备下文的剧情了

.
.
.

D:\mybin>python “D:\mybin\PythonScripts\getdays.py”


Since I started self-learning AI, it has been 10 days already. Keep going!

这篇关于【业余玩儿AI】【文档问答】实操记录0822的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1097850

相关文章

MySQL INSERT语句实现当记录不存在时插入的几种方法

《MySQLINSERT语句实现当记录不存在时插入的几种方法》MySQL的INSERT语句是用于向数据库表中插入新记录的关键命令,下面:本文主要介绍MySQLINSERT语句实现当记录不存在时... 目录使用 INSERT IGNORE使用 ON DUPLICATE KEY UPDATE使用 REPLACE

Python 中的异步与同步深度解析(实践记录)

《Python中的异步与同步深度解析(实践记录)》在Python编程世界里,异步和同步的概念是理解程序执行流程和性能优化的关键,这篇文章将带你深入了解它们的差异,以及阻塞和非阻塞的特性,同时通过实际... 目录python中的异步与同步:深度解析与实践异步与同步的定义异步同步阻塞与非阻塞的概念阻塞非阻塞同步

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

Spring Boot中定时任务Cron表达式的终极指南最佳实践记录

《SpringBoot中定时任务Cron表达式的终极指南最佳实践记录》本文详细介绍了SpringBoot中定时任务的实现方法,特别是Cron表达式的使用技巧和高级用法,从基础语法到复杂场景,从快速启... 目录一、Cron表达式基础1.1 Cron表达式结构1.2 核心语法规则二、Spring Boot中定

Spring AI ectorStore的使用流程

《SpringAIectorStore的使用流程》SpringAI中的VectorStore是一种用于存储和检索高维向量数据的数据库或存储解决方案,它在AI应用中发挥着至关重要的作用,本文给大家介... 目录一、VectorStore的基本概念二、VectorStore的核心接口三、VectorStore的

Python实现合并与拆分多个PDF文档中的指定页

《Python实现合并与拆分多个PDF文档中的指定页》这篇文章主要为大家详细介绍了如何使用Python实现将多个PDF文档中的指定页合并生成新的PDF以及拆分PDF,感兴趣的小伙伴可以参考一下... 安装所需要的库pip install PyPDF2 -i https://pypi.tuna.tsingh

MySQL中实现多表查询的操作方法(配sql+实操图+案例巩固 通俗易懂版)

《MySQL中实现多表查询的操作方法(配sql+实操图+案例巩固通俗易懂版)》本文主要讲解了MySQL中的多表查询,包括子查询、笛卡尔积、自连接、多表查询的实现方法以及多列子查询等,通过实际例子和操... 目录复合查询1. 回顾查询基本操作group by 分组having1. 显示部门号为10的部门名,员

国内环境搭建私有知识问答库踩坑记录(ollama+deepseek+ragflow)

《国内环境搭建私有知识问答库踩坑记录(ollama+deepseek+ragflow)》本文给大家利用deepseek模型搭建私有知识问答库的详细步骤和遇到的问题及解决办法,感兴趣的朋友一起看看吧... 目录1. 第1步大家在安装完ollama后,需要到系统环境变量中添加两个变量2. 第3步 “在cmd中

Python批量调整Word文档中的字体、段落间距及格式

《Python批量调整Word文档中的字体、段落间距及格式》这篇文章主要为大家详细介绍了如何使用Python的docx库来批量处理Word文档,包括设置首行缩进、字体、字号、行间距、段落对齐方式等,需... 目录关键代码一级标题设置  正文设置完整代码运行结果最近关于批处理格式的问题我查了很多资料,但是都没