ChatOllama更新啦！| 基于Ollama的100%本地化多文档知识库功能上线 - 附源码解析

作者: 五里墩茶社分类: 计算机技术发布时间: 2024-03-06 08:07:24 浏览:34994 次

Sheena_Ringo:
rag做到看上去能用很简单，做好非常难，有很多trick，最好还要对向量数据库的embeding做微调，对基础llm做dpo，retrieval用小大块等，目前根本没有可以直接上线的ootb解决方案

【回复】回复 @ヨイツの狼 :请问dpo呢？
【回复】回复 @Easun :out of the box 开箱即用
やまさんです:
可笑啊，这么好的分享才这些赞，反观卖课的那是赚的盆满钵满

【回复】越专业人越少。要代码基础人更少。很多人并不感兴趣，也没有那个能力去使用。卖课是奔着套钱的，营销宣传多，这样下来自然人多。
【回复】对于没有这方面知识的人来说，显然掏两百块钱比学习更容易
AI全文总结:
## 课代表总结 ChatOllama更新视频介绍了如何在本地实现100%本地化的多文档知识库功能，基于Ollama技术，并对代码进行了详细解析，包括数据库结构的调整、API的更新以及前端文件上传功能的改进。 ## 要点 - 📝 新增多文件支持：ChatOllama现在支持创建包含多个文档的知识库，通过本地服务器与多文件关联。 - 💻 代码调整：更新了Prisma schema以支持一对多关系，API中增加了文件关联的读取和创建，前端允许选择多个文件上传。 - 🐞 问题与优化：讨论了数据处理漏洞和可能的改进点，如文档数据库注入的错误处理和向量数据库中的文件分组存储。 - 🤖 使用场景：演示了通过不同大模型（如GA、LA Two）对知识库内容的问答，强调本地交互和数据安全性。 - 🌟 未来方向：强调了数据预处理和模型识别问题，以及代码重构和持续改进的可能性。 --本消息由@AI视频总结召唤成功，召唤工具点我自取

AI头脑风暴:
夸夸：这个视频讲解的特别好，对ChatOllama进行了很详细的介绍，还提供了源码解析，非常棒！关键词：#ChatOllama# #多文档知识库# #本地化# #开源大模型# #RAG# 总结： - ChatOllama是一款流行的大模型本地化工具。 - ChatOllama支持一系列开源大模型，包括主流的聊天模型和文本嵌入模型等。 - ChatOllama的新功能--多文档知识库，适用于具有多个文档的知识体系。一、ChatOllama简介 - ChatOllama是一个流行的大模型本地化工具。 - ChatOllama支持一系列开源大模型，包括主流的聊天模型和文本嵌入模型等。 - ChatOllama可以实现100%的本地化RAG应用。二、ChatOllama的新功能--多文档知识库 - ChatOllama的多文档知识库适用于具有多个文档的知识体系。 - 多文档知识库可以帮助用户快速找到所需的信息。 - 多文档知识库可以提高用户的工作效率。三、欢迎支持 - 如果喜欢这个视频，欢迎前往BuyMeACoffee页面支持作者。 - ChatOllama的开源代码可以在GitHub上找到。 - Nomic Embedding Model的更多信息可以在Ollama官网找到。 - Powered by https://brainstorm.cool 下一代 AI 搜索引擎

fykw:
试了一个docker镜像，可以运行，但是连接不了ollama服务端，不知道是docker镜像有问题还有其他原因？

【回复】ollama默认只能本地访问要通过ip访问呢要配置去GitHub搜一下
安全嘚啵嘚啵嘚:
文档质量不高，例如是被图片化，加了水印的文档，up有没有对文档预处理优化的方法？以实现对识别的友好

【回复】要做文档结构识别再进行ocr
【回复】用过abbyy了，效果也不行
哼呢呢:
问: 1、运行chatollama需要配置啥样的显卡啊？ 2、能支持中文对话么？

【回复】ollama本体不用显卡，他的模型介绍里会告诉你需要多少内存（RAM）一般7b需要8g，70b需要64g，所以买128g内存可能更重要
【回复】[吃瓜]我在挑战50块钱显卡跑。。。
守夜岛岛主:
up主您好，我看到您是用pdf文件作为给大模型的输入。如果pdf文件里有很多文本样式（比如颜色和布局等）是否会影响大模型的识别？我是文档工程师，我们编写结构化的xml文件，使用xslt-fo生成pdf文件，请问能否让大模型直接解析xml文件？比如xml文件包含<option>pip install</option><option>conda install</option>，大模型根据标记对“option”的语义，识别到里面的内容是二选一的，从而得到正常的输出？

【回复】pdf文件里有很多文本样式（比如颜色和布局等）是否会影响大模型的识别？一般来说都是不会有影响的，因为这些内容不会被做嵌入；除非水印才会有影响
【回复】建议xml转成markdown，xml无效标签太多，会干扰大模型
bluesky99975260:
AI根据知识库回答的时候要是可以在后面附上回答的内容的出处链接就更好了

【回复】我记得fastgpt好像有这个功能。
半亩小菜园:
大佬，为何报错：Error: Failed to batch create run: 401 Unauthorized {"detail":"Need authorization header or api key"}

zabr:
‍请问大佬们，请问一下只要点击一下模型就一直报这个错怎么办呀

人工智能我是程序员 Nomic LangChain Ollama Chromadb RAG 大模型知识库 LLM

如果觉得我的文章对您有用，请随意打赏。您的支持将鼓励我继续创作！