
一个文档解析和提取 API,支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式。
它利用了先进的 OCR 技术 和 Ollama 支持的 语言 模型来实现高精度文本转换和去除敏感 信息 。
支持离线运行、分布式任务处理、Redis 缓存、CLI 操作工具以及对图片中的表格、 数学 公式的处理。
开源地址:https:// github .com/CatchTheTornado/pdf-extract-api

一个文档解析和提取 API,支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式。
它利用了先进的 OCR 技术 和 Ollama 支持的 语言 模型来实现高精度文本转换和去除敏感 信息 。
支持离线运行、分布式任务处理、Redis 缓存、CLI 操作工具以及对图片中的表格、 数学 公式的处理。
开源地址:https:// github .com/CatchTheTornado/pdf-extract-api
1. 本站资源仅供学习和交流,须在下载后24小时内删除!
2. 本站资源不得用于非法商业用途,不得违反国家法律!
3. 本站资源链接若无法下载或失效,请联系管理员处理!
本站不制作和存储任何资源,仅供个人学习用途,版权归原著作权人所有,如涉版权问题请留言反馈!
Copyright © 2025 盘天下 | 免费精选资源分享
加载 0.3190 秒, 内存 514.84 KB , 数据库 30 次
评论列表
发表评论