推荐 GitHub 上一个能帮你将数据清理及结构化的开源工具 OmniParse。该工具能够将各种非结构化数据转化为结构化的、可操作的数据,方便用于检索增强生成(RAG)和微调。无论是文档、表格、图像、视频、音频还是网页,都能将它们清理干净并结构化。
参考文献:
[1] GitHub:https://github.com/adithya-s-k/omniparse
[2] https://docs.cognitivelab.in/
推荐 GitHub 上一个能帮你将数据清理及结构化的开源工具 OmniParse。该工具能够将各种非结构化数据转化为结构化的、可操作的数据,方便用于检索增强生成(RAG)和微调。无论是文档、表格、图像、视频、音频还是网页,都能将它们清理干净并结构化。
参考文献:
[1] GitHub:https://github.com/adithya-s-k/omniparse
[2] https://docs.cognitivelab.in/