本文主要是介绍基于LangChain-Chatchat实现的RAG-本地知识库的问答应用[4]-高阶自定义模块,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
基于LangChain-Chatchat实现的RAG-本地知识库的问答应用[4]-高阶自定义模块
1.自定义分词器
- 在
text_splitter
文件夹下新建一个文件,文件名为您的分词器名字,比如my_splitter.py
,然后在__init__.py
中导入您的分词器,如下所示:
from .my_splitter import MySplitter
- 修改
config/kb_config.py
文件,将您的分词器名字添加到text_splitter_dict
中,如下所示:
MySplitter: {"source": "huggingface", # 选择tiktoken则使用openai的方法"tokenizer_name_or_path": "your tokenizer", #如果选择huggingface则使用huggingface的方法,部分tokenizer需要从Huggingface下载}
TEXT_SPLITTER = "MySplitter"
完成上述步骤后,就能使用自己的分词器了。
2. 自定义Age
这篇关于基于LangChain-Chatchat实现的RAG-本地知识库的问答应用[4]-高阶自定义模块的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!