初级:知识库 Agent

知识库 Agent 是目前另外一类比较受欢迎的工具,它能将个人/企业专有数据与大模型相结合,进一步扩展大模型的知识库范围,让它与业务结合得更加紧密。

在 Agent 的配置过程中,如果在 Agent 设置页面中选择关联了“知识库”,我们就能够在规划页面中看到新增加的“知识库搜索”模块,本次案例将着重为大家介绍“知识库搜索”模块的功能设计。

基础配置

本次我们准备做一个“大预言模型助手”的 Agent,将整理好的大语言模型相关资料作为知识库,这个 Agent 将充当大语言模型方面的专家,回答我们关于大语言模型方面的提问。具体的配置如下:

画布规划

在 Agent 的画布规划中,此时会增加了一个“知识库搜索”模块,来实现借助“知识库”中上传的资料,辅助 AI 完成大模型相关问题的回复。它的具体逻辑如下:

  • 连线1:通过“用户提问”模块,获取用户输入信息,并通过“用户提问”输出

  • “知识库搜索”模块通过“信息输入”输入用户的问题,后会执行如下几个步骤:

    • 将“用户提问”进行向量化,并与“大语言模型”的知识库中,与已有的内容切片进行向量检索

    • 将搜索结果进行相似度排序,将相似度排名靠前的切片进行返回

  • 在搜索完成后,“知识库搜索”模块的 3 个输出连线分别走向了 2 个模块,逻辑如下:

    • 连线2:如果“知识库搜索”结果,没有符合条件的切片内容,将触发“确定回复”模块,回复用户“抱歉,这个问题暂时无法回复,我还需要更多的学习”

    • 连线3:如果“知识库搜索”结果,搜索到有符合条件的切片内容,将触发“智能对话”模块,并将提示词、“知识库搜索结果”(连线4)与“用户提问”(连线5)一同传给“智能对话”模块进行处理。

  • “智能对话”模块接受到以上 3 个信息输入后,后会执行如下几个步骤:

    • 将提示词、用户提问及知识库搜索结果传给天工大模型

    • 大模型进行加工处理,并回复用户

在“知识库搜索”模块中,我们可以看到“知识库相似度”“知识库单次搜索上限”这两个参数,也就是会控制知识库向量搜索的结果(最终匹配切片的数量)和返回结果(返回切片的数量),在使用过程中相关数值需要进行调整已确保知识库反馈更优的结果。

知识库相似度

控制用户提问与搜索结果之间的相似度,相似度数值越高,搜索出的匹配结果可能越少。因此对于用户问题可根据知识库内容,和用户提问的内容,思考场景。通常建议相似度调整在 0.6-0.9 左右。

单次搜索上限

当需要在知识库进行搜索时,设置最多取 x 条作为搜索结果输出。请注意,所取结果并非越多越好,受模型最大 Tokens 和知识库内容切片大小等因素的影响,具体可用数量可通过调整参数并测试,选择更合适的上限数值。

最后更新于