
一个文档解析和提取 API,支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式。
它利用了先进的 OCR 技术 和 Ollama 支持的 语言 模型来实现高精度文本转换和去除敏感 信息 。
支持离线运行、分布式任务处理、Redis 缓存、CLI 操作工具以及对图片中的表格、 数学 公式的处理。
开源地址:htt ps :// github .com/CatchTheTornado/pdf-extract-api
本站不制作和存储任何资源,仅供个人学习用途,版权归原著作权人所有,如涉版权问题请留言反馈!

评论列表
发表评论