厂家:InfiniFlow
简介:
RAGFlow 是一款完整的 RAG 解决方案,它允许用户上传并管理自己的文档,文档类型可以是任意类型,例如 PDF、Word、PPT、Excel、当然也包含 TXT,在完成智能解析之后,让数据以正确地格式进入到数据库,然后用户可以采用任意大模型对自己上传的文档进行提问。
主要特点:
RAGFlow 是一套基于 AI 模型的智能文档处理系统:对于用户上传的文档,它需要自动识别文档的布局,包括标题,段落,换行等等,还包含难度很大的图片和表格。对于表格来说,不仅仅要识别出文档中存在表格,还会针对表格的布局做进一步识别,包括内部每一个单元格,多行文字是否需要合并成一个单元格,等等,并且表格的内容还会结合表头信息处理,确保以合适的形式送到数据库,从而完成 RAG 针对这些细节数字的“大海捞针”。
RAGFlow 是一套包含各种不同模板的智能文档处理系统:不同行业、不同岗位所用到的文档不同,行文格式不同,对文档查阅的需求也不同。比如:会计一般最常接触到的凭证,发票,Excel报表;查询的一般都是数字,如:看一下上月十五号发生哪些凭证,总额多少?上季度资产负债表里面净资产总额多少?合同台账中下个月有哪些应付应收?
HR 平时接触最庞杂的便是候选人简历,且查询最多的是列表查询,如:人才库中985/211的3到5年的算法工程师有哪些?985 硕士以上学历的人员有哪些?赵玉田的微信号多少?香秀是哪个学校的来着?
科研工作者接触到最多的可能是就是论文了,快速阅读和理解论文,梳理论文和引文之间的关系成了他们的痛点。
优势:
RAGFlow 是一个完整的 RAG 系统,而目前开源的 RAG,大都忽视了 RAG 本身的最大优势之一:可以让 LLM 以可控的方式回答问题,或者换种说法:有理有据、消除幻觉。
RAGFlow 于 2024 年 4 月 1 日正式开源,它已经在若干家企业中得到使用。我们在持续不断完善它,近期目标包含:完善文件管理功能,使之可以像文档管理器那样工作,这样个人和企业的数据,可以被更加有效地管理并跟企业级知识库结合。RAGFlow 未来将进一步向企业级低代码工具演进,不断解锁 RAG B 端场景, 让 AI 普适化,我们一直在路上。欢迎 Star 和关注 RAGFlow!
项目信息:
项目地址:https://github.com/infiniflow/ragflow