盘天下 | 免费精选资源分享

pdf-extract-api:高精度文档解析和提取API开源项目

编程开发 盘天下 | 网盘资源分享 2024-11-22 1209 0


pdf-extract-api:高精度文档解析和提取 API 开源项目

一个文档解析和提取 API,支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式。

它利用了先进的 OCR 技术 和 Ollama 支持的 语言 模型来实现高精度文本转换和去除敏感 信息

支持离线运行、分布式任务处理、Redis 缓存、CLI 操作工具以及对图片中的表格、 数学 公式的处理。

开源地址:https:// github .com/CatchTheTornado/pdf- extra ct-api

【新用户手机夸克APP转存可以获得1TB免费空间】

夸克网盘「电影」精选合集:https://pan.quark.cn/s/0755e002f4b6

夸克网盘「纪录片」精选合集:https://pan.quark.cn/s/8c76cd47e8be

夸克网盘「短剧」精选合集:https://pan.quark.cn/s/0f27fae4301e

夸克网盘「音乐」精选合集:https://pan.quark.cn/s/c999e39a7f49

夸克网盘「教程」精选合集:https://pan.quark.cn/s/27984fcacdad

夸克网盘「书籍」精选合集:https://pan.quark.cn/s/2532536273dd

冲上云霄

转载请注明出处,本文链接:https://www.80srz.com/pantx/13827.html

(0)
收藏 (0)

评论列表