TONG-H

(译)使用 GPT 基于个人文档建立聊天机器人的逐步教程

2.2k7WEBtranslation2023-03-272025-01-02

与 ChatGPT 聊天是有趣且丰富的,过去一段时间我一直在与它闲聊并探索新的想法。但这些都是比较随机的用例,新奇感很快就减弱,尤其是当你意识到它可以产生幻觉的时候。

我们如何以更高效的方式使用它?随着 OpenAI 最近发布的 GPT 3.5 系列 API,我们能做的事远不止是闲聊。对于企业和个人使用来说更高效的用例是 QA (问答),你用自然语言向机器人询问关于你自己的文档/数据,通过从文档中检索信息并生成回应,它可以快速的回答你 [1]。你可以用它来做客户支持,综合用户研究,你的个人知识管理等等

向机器人询问与文档有关的问题。用稳定扩散法生成的图像。

在本文中,我将探讨如何基于自己的数据创建自己的问答机器人,包括为什么有些方法不生效,以及使用 llama-index 和 GPT API 高效的创建文档问答聊天机器人的逐步引导

(如果你只想知道如何建立问答聊天机器人,你可以直接跳到“逐步创建文档问答聊天机器人”部分)

探索不同的方法

我的日常工作是产品管理,阅读用户反馈以及内部文档占据了我生活的很大一部分。当 ChatGPT 出现的时候,我马上就想到了使用它作为助手来帮助我合成用户反馈,或者找到和我现在正在做的功能相关的旧产品文档。

我首先想到的是使用我自己的数据对 GPT 模型微调(fine-tuning)来实现目标。但微调的花费不少,而且需要一个有案例的大型数据库。每次当文档发生改变时都去微调也同样不可能。更关键的是微调根本不能让模型知道文档中的所有信息,而是教给模型新技能。因此,对多文档问答来说,微调并不是一个可行的方式。

我想到的第二个方法是通过在提示中提供上下文来提示工程。比如,我可以在真实问题之前附加原始文档内容,而不是直接提问。但是 GPT 模型的注意广度是受限的,它只能接受提示中的几千字(大约 4000 个符号或者 3000 字)。我们有成千封用户反馈邮件和数百份产品文档,所以把所有内容放在提示中是不可能的。往 API 传递长字符串的成本也是比较高的, 因为定价是基于使用的符号数量。

1
我将根据下面的内容向你询问:—上下文的开始—你的文档内容—上下文的结束—我的问题是:“用户希望在 app 中看到什么特性?”

(如果你想要学习更多关于 GPT 的微调和提示工程,你可以阅读这篇文章:为个人业务量身定制的基础语言模型(如GPT)的3种方法

由于提示受限于输入符号数量,所以我有一个想法,首先使用算法搜索文档,并选择相关的摘要,然后只将这些相关的内容以及我的问题传递给 GPT。当我研究这个想法的时候,我偶然发现一个叫 gpt-index 的库(现在更名为 LlamaIndex),这个库完全符合我的想法,而且使用简单 [2]。

从文件中提取相关部分,然后将其反馈给提示。图标来自https://www.flaticon.com/

在下一节中,我将给一个分步教程关于如何使用 LlamaIndex 和 GPT 来创建一个基于个人数据的问答聊天机器人。

逐步创建文档问答聊天机器人

在本节中,我们将基于现有的文档用 LlamaIndex 和 GPT (text-davinci-003) 创建一个问答聊天机器人,这样你可以就你的文档提出问题,并从聊天机器人获得答案,全部都是使用自然语言。

前提条件

在开始之前,我们需要准备以下几件事:

  • 你的 OpenAI API Key,可以在 https://platform.openai.com/account/api-keys 中找到。
  • 你的文档的数据库,LlamaIndex 支持多种不同的数据来源,比如 Notion,Google Docs,Asana 等等 [3]。在本教程中,我们只使用一个简单的 text 文件来做示范。
  • 一个本地 Python 环境或者在线 Google Colab notebook

工作流程

这个工作流程简单易懂,只需要几个步骤:

  1. 使用 LlamaIndex 创建文档数据的索引。
  2. 使用自然语言查询索引。
  3. LlamaIndex 将检索相关部分并传递给 GPT 提示。
  4. 结合相关上下文询问 GPT,并构建反应。

LlamaIndex 所做的是将原始的文档数据转化为矢量索引,这会使查询变得非常高效。LlamaIndex 将基于查询和数据的相似性来使用这个索引去找到最相关的部分。再将检索到的信息插入到提示中发送给 GPT,这样 GPT 就有了回答问题的上下文。

设置

我们需要先安装 LlamaIndex,只需要在终端或者 Google Colab notebook 中运行以下命令。这些命令会安装 LlamaIndex 和 OpenAI。

1
!pip install llama-index!pip install openai

下一步,我们将在 python 中导入这些库,然后在一个新的 .py 文件中设置你的 OpenAI API key。

1
from llama_index import GPTSimpleVectorIndex, Document, SimpleDirectoryReaderimport osos.environ['OPENAI_API_KEY'] = 'sk-YOUR-API-KEY'

构建索引并保存

在安装以及导入了所需的库之后,我们需要去构建文档的索引。

我们可以使用 LllamaIndex 提供的 SimpleDirectoryReader 方法来加载文档,或者也可以从字符串中加载。

1
documents = SimpleDirectoryReader('your_directory').load_data()text_list = [text1, text2, ...]documents = [Document(t) for t in text_list]

LlamaIndex 也提供多种不同的数据连接器,包括 Notion,Asana,Google Drive,Obsidian 等等。你可以在 https://llamahub.ai/ 中找到可用的数据连接器。

在文档加载后,我们可以用以下方法简单的构建索引

1
index = GPTSimpleVectorIndex(documents)

如果你想要保存索引并加载它以便后续使用,你可以使用以下方法

1
index.save_to_disk('index.json')index = GPTSimpleVectorIndex.load_from_disk('index.json')

查询索引并获取响应

查询索引是很简单的

1
response = index.query("What features do users want to see in the app?")print(response)

一个响应案例

然后就可以了!你会得到打印的答案。在后台,LlamaIndex 会接受你的提示并在索引中搜索相关的语块,然后将你的提示以及相关的语块传递给 GPT。

一些关于高级使用的说明

上面的步骤仅仅展示了 LlamaIndex 和 GPT 非常简单的回答问题的入门用法。但你可以做更多。事实上,你可以配置 LlamaIndex 去使用不同的大型语言模型(LLM),使用不同类型的索引去做不同的任务,用一个新的索引来更新现有的索引等等。如果你感兴趣,可以阅读他们的文档 https://gpt-index.readthedocs.io/en/latest/index.html

结语

在这篇文章中,我们看到了如何将 GPT 与 LlamaIndex 结合起来,建立一个文档问答聊天机器人。虽然 GPT(和其他 LLM)本身就很强大,但如果我们把它与其他工具、数据或进程结合起来,它的力量就可以大大放大。

你会用一个文档问答聊天机器人做什么?

如果发现译文存在错误或其他需要改进的地方,欢迎到 掘金翻译计划 对译文进行修改并 PR,也可获得相应奖励积分。文章开头的 本文永久链接 即为本文在 GitHub 上的 MarkDown 链接。


掘金翻译计划 是一个翻译优质互联网技术文章的社区,文章来源为 掘金 上的英文分享文章。内容覆盖 AndroidiOS前端后端区块链产品设计人工智能等领域,想要查看更多优质译文请持续关注 掘金翻译计划官方微博知乎专栏