【大模型实战】基于大模型的中国历史智能助手项目分享：史小白

本文主要是介绍【大模型实战】基于大模型的中国历史智能助手项目分享：史小白，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

一、简介

在当下的AI热潮中，我完成了一个基于大模型的项目——史小白 - 中国历史智能助手。

可用于帮助用户探索和学习中国历史。项目基于InternLM大模型技术，提供了多种功能，包括：

通过整合现代人工智能技术，史小白致力于为历史爱好者提供一个便捷的学习平台。

在我的B站视频【史小白 - 中国历史智能助手】中，我详细展示了项目架构、功能模块以及实际运行效果。希望通过这个视频，能够启发更多开发者利用AI技术做出有趣的项目。欢迎大家观看、一键三连~

【大模型项目】史小白——中国历史智能助手

在这个模块，系统支持多种数据格式，包括：

这些多模态、多语言的数据会通过嵌入模型（Embedding Model）进行处理，生成对应的语义向量（Semantic Vector）。这个向量代表了数据的内容及其含义，便于后续的搜索和查询。

生成的语义向量被存储到向量数据库中，供之后的数据检索使用。数据库不仅支持存储，还可以进行高效的向量化数据检索。

在这一部分，用户输入一个问题，例如“我想了解秦朝的政治制度？”。这个问题首先会被转化为一个查询向量。查询向量是通过嵌入模型处理问题文本生成的。

系统通过对比查询向量和数据库中的语义向量，找出与问题最相关的知识点。这个过程会返回一个相关性分数，用以确定哪个知识点最符合用户的查询。

根据相关性分数，系统会选择最合适的知识，并返回相关的答案，例如“秦朝的政治制度以中央集权为基础……”等。

大模型生成模块史小白（基于InternLM 2.5 7b），它在回答用户问题时使用了多个工具和方法：

Agent工具（基于LAgent）：它可以帮助系统执行联网查询和古风图片生成等任务。用户的问题如果涉及到网络查询，系统可以调用联网工具进行实时信息检索；如果用户需要生成古风图片，系统可以调用图片生成工具。
数据微调（基于Xtuner）：大模型的输出经过数据微调，确保生成的内容更加符合特定任务的需求。
任务定制（Prompt）：通过定制化的任务提示词，进一步优化和指导模型的输出。

最后，史小白将结合所有查询结果、数据微调和定制化提示词，生成用户需要的答案。