253k star! 支持RAG知识库问答的私有化ChatGPT，无需GPU！-工具盒子

上周作者实现了一个功能超强的本地ChatGPT，收到了很多朋友的点赞和好评，今天我们在此基础上继续完善，给它加上RAG文档对话功能。 [247.2k star! 超强大的私有化ChatGPT，支持图像识别/文生图/语音输入/文本朗读，个人电脑可运行！](http://mp.weixin.qq.com/s?__biz=MzU0MzI3MzU1Ng==&mid=2247484774&idx=1&sn=4aff4a1ddf920561905947cc488cde7f&chksm=fb0ca25dcc7b2b4b14101988865f49752d5a9075c7398a4b8a37235d063802d194ee241a41af&scene=21#wechat_redirect) 我上传了一个阿里巴巴Java代码规范的pdf，以下是问答效果：![](https://img1.51tbox.com/static/2024-03-11/col/86aca3688b1d3b8b4becab8bb0c7b9ba/f36d525ec8074d07aea53594049d9dd7.jpg) 下文分为实战步骤、原理解析两部分。 **1.设置embedding模型** 重点：open-webui默认的embedding模型all-MiniLM-L6-v2只支持英文并且效果不好，我们将其改为更为强大的多语言模型intfloat/multilingual-e5-large模型，使用以下命令启动容器，与之前命令相比增加了RAG_EMBEDDING_MODEL参数。 \* ``` docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui -e RAG_EMBEDDING_MODEL=intfloat/multilingual-e5-large --restart always ghcr.io/open-webui/open-webui:main ``` ``` 更多embedding模型可从文末链接获取2.添加文档 ``` ![](https://img1.51tbox.com/static/2024-03-11/col/86aca3688b1d3b8b4becab8bb0c7b9ba/832d163088e54418a26c7a19f7f454af.jpg) 点击+添加一个文档，支持pdf、docx、txt、md等多种格式，如果文档较大需要稍等一会，等下面列表中显示出来自己添加的文档即可。 ![](https://img1.51tbox.com/static/2024-03-11/col/86aca3688b1d3b8b4becab8bb0c7b9ba/ec30644cef05425dba2a95b247dff4b4.jpg) **3.开始问答** ========== 按下图操作即可开始对文档进行问答： ![](https://img1.51tbox.com/static/2024-03-11/col/86aca3688b1d3b8b4becab8bb0c7b9ba/fd4a48dbf71a4ddf95c9ce53c3def246.jpg) **4.原理解析** ========== Open-webui项目中文档问答的源码在backend/apps/rag/main.py中，我们结合上面的操作步骤、源码和langchain-chatchat项目中的一张图，简单描述一下实现原理。 ![](https://img1.51tbox.com/static/2024-03-11/col/86aca3688b1d3b8b4becab8bb0c7b9ba/625187f474d849d8be367975d347d808.jpg) 4.1 当我们添加pdf文档时，open-webui前端调用服务端的/doc接口，对应上图的1、2、3、4、5、6步。 \* \* \* \* \* \* \* \* ``` // main.py@app.post("/doc")// 根据文件类型获取加载器,不同的文件类型对应不同的加载器loader, known_type = get_loader(file.filename, file.content_type, file_path)// 将pdf等文件解析为文本data = loader.load()// 文本切割、向量化、存储result = store_data_in_vector_db(data, collection_name) ``` 4.2 当我们针对文档提问时，主要分两次请求完成： * 前端请求/query/doc接口，服务端根据问题从向量数据库中查出相关内容原文，对应上图的8、9、10、11步。 * * * * * * ``` @app.post("/query/doc")result = collection.query( query_texts=[form_data.query], n_results=form_data.k if form_data.k else app.state.TOP_K,)return result ``` ![](https://img1.51tbox.com/static/2024-03-11/col/86aca3688b1d3b8b4becab8bb0c7b9ba/1195b25092a346c881700eb8c0f3317c.jpg) * 把问题与向量数据库查询结果一起作为prompt提交给大模型，大模型返回最终结果，对应上图的12、13、14、15步。 ![](https://img1.51tbox.com/static/2024-03-11/col/86aca3688b1d3b8b4becab8bb0c7b9ba/51357f0e74bf404e909b34797d59bcd8.jpg) prompt大概意思就是： \* ``` 请根据我提供的上下文回答问题，我的问题是：{query}，上下文是：{向量数据库查询结果} ``` **5.更多embedding模型** =================== 如果embedding模型效果不好，可访问以下链接使用更多模型: https://huggingface.co/models?library=sentence-transformers

51工具盒子

253k star! 支持RAG知识库问答的私有化ChatGPT，无需GPU！

厉飞雨

相关推荐

最新文章

猜你喜欢

快捷分类