前两天和朋友一起吃饭,朋友是个小老板,主要接一些行业项目来做,公司不大,二三十人,但是在这个行业做久了,也积累了大量的行业资料。
这些资料蕴含着大量行业知识,对于售前、竞标、客服来说都是很宝贵的,可惜的是它们都以Word,PDF等方式散落在硬盘里,不成体系,知识搜索起来很麻烦。
朋友说:“能不能建个知识库?引入AI技术,精准地搜索一下。”
我说:“没问题啊,现在RAG技术太成熟了,不少互联网大厂都有云端RAG服务,把资料传上去就行了。”
朋友摇头:“不行,这些资料也是我们公司的机密了,不能往云端传。”
我又给他介绍了另一家大厂的解决方案,从硬件到软件到应用,一应俱全,可以部署在本地。
朋友一看就拒了:“价格太高,我们小虾米玩不起啊!”
我明白了,朋友公司所需要的是一个“小而美”的知识库,最好是免费的。
我上网搜了一下,发现了这么一个演示:PandaWiki品三国。
这个品三国很有意思,它就是个小知识库,里边上传了《三国演义》和《三国志》等书籍,然后可以问一些有趣的知识类问题:
诸葛亮去世的时候是什么季节?
曹丕和曹植的关系很差吗?
从回答中可以看出,它检索了《三国演义》的相关章节,这个系统背后肯定用到了RAG技术。
它是怎么构建起来的呢?
再仔细一看,原来是个免费开源软件,叫PandaWiki,两个多月时间,已经有4500颗星星了,增长速度飞快。
PandaWiki 是一款 AI 大模型驱动的开源知识库搭建系统,可以快速构建智能化的产品文档、技术文档、FAQ、博客系统,借助大模型的力量为你提供 AI 创作、AI 问答、AI 搜索 等能力。
好家伙,简直就是为朋友公司定制的。
安装
我马上试了一下,安装配置的过程也非常简单,找一台Linux服务器,一行命令就可以安装完成。
如果你没有Linux,也可以用虚拟机。
bash -c "$(curl -fsSLk https://release.baizhi.cloud/panda-wiki/manager.sh)"
安装结束,终端就贴心地输出了可以访问的控制台URL,用户名和密码。
SUCCESS 控制台信息:SUCCESS 访问地址(内网): http://*.*.*.*:2443SUCCESS 访问地址(外网): http://*.*.*.*:2443SUCCESS 用户名: adminSUCCESS 密码: **********************
从安装的过程来看,不得不说,现在的开源系统在用户体验方面远远超过了一些巨头做的商业系统。
首次登录,PandaWiki会提示配置AI模型,毕竟这是一个AI大模型驱动的系统,为了实现RAG,肯定需要一个Embedding模型,Rerank模型。为了实现智能对话,肯定需要一个Chat模型。
我这里选择了百智云提供的相关模型:
到百智云上注册一下,拿到API Key, 就可以用了。
ps.现在注册,可以薅5块钱羊毛。
使用
配置完AI模型以后,剩下的事情就非常非常简单了,简单到我都懒得介绍了。
无非就是创建一个知识库,导入文档,然后就可以用起来了。
让我印象深刻的是,这里有着花样繁多的导入方式,可以看出PandaWiki在这方面是非常用心的:
我创建了一个历史名人知识库,上传了几个文档,测试一下:
接着追问:
效果相当不错,整个过程前后花费的时间应该不到半个小时。
总结
我之前也介绍过不少优秀的软件系统,PandaWiki第一次让我感到,在安装、配置上没啥可说的!它确实是做得太好了,把复杂性全部隐藏了起来,一行命令就把所有东西搞定了。
在后台管理上,用户面对的也就是知识库、文档、发布、导入等几个非常简单的概念,毫无障碍。
一句话:PandaWiki就是一个小而美的、AI驱动的知识库的典范。
如果你也想建一个低成本的、私有的、AI驱动的知识库,那PandaWiki是不二之选。
建议大家也试一试,支持一下这个国产开源的知识库:
https://github.com/chaitin/PandaWiki,给它点一个Star:
如果有什么问题或者建议,欢迎加入官方交流群: