OmniParse:清洗非结构化的数据,提升RAG质量

2024年7月4日 单位
OmniParse:清洗非结构化的数据,提升RAG质量
郝彦飞

OmniParse is a platform that ingests/parses any unstructured data into structured, actionable data optimized for GenAI (LLM) applcaitons. Whether working with documents, tables, images, videos, audio files, or web pages, OmniParse prepares your data to be clean, structured and ready for AI applications, such as RAG , fine-tuning and more.

OmniParse 是一个平台,可将任何非结构化数据提取/解析为针对 GenAI (LLM) 应用程序优化的结构化、可操作数据。无论是处理文档、表格、图像、视频、音频文件还是网页,OmniParse 都能让您的数据变得干净、结构化,并为 AI 应用做好准备,例如 RAG、微调等。


官网地址:https://docs.cognitivelab.in/

源码地址:https://github.com/adithya-s-k/omniparse