欢迎光临北京软件和信息服务业协会官方网站
优刻得上线全新版本TiDB,快速搭建国产知识库问答系统
发布日期:2025-05-09    来源:优刻得云计算    分享到:

伴随着 DeepSeek 在全球的在线推理需求增长,大语言模型数据的存储成本也水涨船高,因此需要一个外置数据库来持久化存储这些语料,而向量数据库就是其中的不二之选。

近几年,TiDB 在向量数据库方面也有所成就:

  • 2024 年 6 月,TiDB Cloud Severless 率先支持向量搜索特性;

  • 2024 年 11 月,本地部署版本 TiDB 8.4.0-DMR 发布,支持向量搜索功能;

  • 2024 年 12 月,TiDB 8.5.0-LTS 发布,提升向量距离函数性能,提升数据更新场景下向量搜索的查询性能,并新增关于构建向量索引 CPU 使用率的监控指标。

优刻得在近期上线了 TiDB v8.5.1 版本,可以结合 PingCAP 开源项目 AutoFlow 与 DeepSeek 大模型,快速搭建知识库系统,为客户提供更便捷的AI体验流程。

优刻得云上 TiDB 结合 AutoFlow 与 DeepSeek

快速构建知识库问答系统

构建智能化的知识库问答系统已成为企业和个人提升信息管理效能的关键基础设施。基于强大的智能处理能力,可以将复杂的问题细致地分解并深入分析,从而准确定位用户的核心需求,并通过多样化的呈现方式(包括文字说明、数据表格和直观图片)提供全面且易懂的回答。这类系统不仅能显著提高信息检索效率,也为用户提供了更好的决策支持。

AutoFlow 是 PingCAP 开发的一款开源工具,使用 TiDB 向量存储构建图谱知识库(GraphRAG:Knowledge Graph RAG)。它集成了 LlamaIndex 和 DSPy 框架,支持复杂的对话搜索和知识图谱编辑功能。用户只需使用简单的 JavaScript 代码片段,即可将对话搜索窗口嵌入到他们的网站中,从而显著提升用户体验。

1746755794703.jpg

图片引用自: https://tidb.net/blog/d7bdecba


环境准备


1. 在优刻得控制台新建一台带外网的快杰云主机,开放端口3000


1746755920190.jpg


2. 快杰云主机安装 git,python3,docker 以及 docker-compose-plugin 插件


1746756034869.png


3. 在优刻得控制台新建一个8.5.1版本的TiDB,并且开启TiFlash。需要与之前的主机在同一项目,同一VPC下,确保与快杰云主机网络互通


1746755932649.jpg

1746755940172.jpg


部署 AutoFlow


AutoFlow 支持本地部署,以下是使用 Docker Compose 进行部署的简要步骤。

具体细节可参考官方文档:

https://tidb.ai/docs/deploy-with-docker


或参考:

《用 Autoflow + Gitee AI 搭建本地知识库问答机器人》https://mp.weixin.qq.com/s/3SXazBxs4fN5TPgTbSOyJg


1. 在快杰云主机上克隆 AutoFlow 的代码仓库

git clone https://gitee.com/shawnyan/autoflow.git --depth=1


2. 修改配置文件,填入 TiDB 的连接信息


cd autoflow

cp .env.example .env

vi .env

# 你可以通过执行以下命令生成新的密钥

# $ python3 -c "import secrets; print(secrets.token_urlsafe(32))"


SECRET_KEY=xxxxxxx

TIDB_HOST=刚刚创建出的tidb ip

TIDB_PORT=6033

TIDB_USER=<user>

TIDB_PASSWORD=<password>

TIDB_DATABASE=tidbai_test

# 本地部署环境需要将 TIDB_SSL 设置为 false

TIDB_SSL=false



3. 连接到 TiDB 集群,并创建 tidbai_test 数据库


MySQL [(none)]> create database tidbai_test;Query OK, 0 rows affected (0.03 sec)


4. 初始化数据,并指定管理员邮箱

docker compose -f docker-compose-cn.yml run backend /bin/sh -c "alembic upgrade head"docker compose -f docker-compose-cn.yml run backend /bin/sh -c "python bootstrap.py --email admin@123.cn"


预期输出,提示了管理员的邮箱和密码:



!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!![IMPORTANT] Admin user created with email: admin@123.cn and password: xxxxxxx!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!


5. 使用内置的本地嵌入重新排序器(embedding reranker),启动知识库服务。


docker compose -f docker-compose-cn.yml --profile local-embedding-reranker up -d --force-recreate


预期输出:

[+] Running 5/5✔ Container tidb-ai-redis-1 Started✔ Container tidb-ai-local-embedding-reranker-1 Started✔ Container tidb-ai-background-1 Started✔ Container tidb-ai-backend-1 Started✔ Container tidb-ai-frontend-1 Started


6. 访问 AutoFlow 服务,登录管理员账号


打开浏览器,输入访问链接:

http://外网ip:3000



1746755967572.jpg



7. 注册并登录 Gitee AI 平台,获取 API Key 访问令牌


图片



8. 配置 AutoFlow 应用


配置 LLM 模型。选择 Gitee AI 服务商,添加 DeepSeek 模型,例如 DeepSeek-R1 模型:


1746755976598.jpg



配置local Embedding模型:

1746755983085.jpg



9. 配置知识库


1746755988751.jpg


添加数据来源,可添加文件、网页或者网站地图。


1746755995838.jpg


接下来,需要等待一段时间,应用会基于以上配置创建索引。最后,添加聊天引擎,设置用户对话界面。


1746756002544.jpg


10. 体验问答系统

1746756009471.jpg


TiDB 是国产数据库中的佼佼者,以其卓越性能、安全可靠和强大功能,赢得了广泛的赞誉和应用。优刻得基于 PingCAP 的开源 TiDB,实现了 TiDB 在公有云的产品化,快速给用户提供一键部署,灵活集群管理,接入方便的高性能数据库服务。


DeepSeek 是国产大模型的“地震级”里程碑,更是以其突破性的技术创新,大幅降低训练成本,普通用户可以使用公版卡或者国产 GPU 来替代其他高端显卡,完成项目落地,跨越式实现降本增效。通过优刻得控制台几分钟内即可极速创建 TiDB,使其与 AutoFlow 和 DeepSeek 进行深度整合,能够快速打造出一个完全自主可控的、纯国产的知识库问答系统。


你知道你的Internet Explorer是过时了吗?

为了得到我们网站最好的体验效果,我们建议您升级到最新版本的Internet Explorer或选择另一个web浏览器.一个列表最流行的web浏览器在下面可以找到.