盘天下 | 免费精选资源分享

MinerU:开源高质量数据提取工具 支持PDF/网页/多格式电子书提取

编程开发 盘天下 2024-11-13 467 0


MinerU是什么

MinerU是一款由上海 人工智能 实验室OpenDataLab 团队 开发 的开源高质量 数据 提取工具,专注于从复杂PDF文档、网页和电子书中高效提取内容。它能够将包含图片、公式和表格的多模态PDF转化为Markdown格式(如 markdown 、json),且具备高精度解析工具链,支持多种输入模型,支持自动识别乱码、转换公式为LaTex、保留文档结构,支持176种 语言 的准确识别,适用于学术、 财务法律 等领域,兼容Windows/Linux/Mac平台。

MinerU:开源高质量数据提取工具 支持PDF/网页/多格式电子书提取

MinerU:开源高质量数据提取工具 支持PDF/网页/多格式电子书提取MinerU:开源高质量数据提取工具 支持PDF/网页/多格式电子书提取

MinerU如何使用/官网

网站:https://opendatalab.com/OpenSourceTools/Extractor/PDF

GitHub:https://github.com/opendatalab/MinerU

【新用户手机夸克APP转存可以获得1TB免费空间】

夸克网盘「电影」精选合集:https://pan.quark.cn/s/0755e002f4b6

夸克网盘「纪录片」精选合集:https://pan.quark.cn/s/8c76cd47e8be

夸克网盘「短剧」精选合集:https://pan.quark.cn/s/0f27fae4301e

夸克网盘「音乐」精选合集:https://pan.quark.cn/s/c999e39a7f49

夸克网盘「教程」精选合集:https://pan.quark.cn/s/27984fcacdad

夸克网盘「书籍」精选合集:https://pan.quark.cn/s/2532536273dd

冲上云霄

转载请注明出处,本文链接:https://www.pantx.cn/6038.html

(0)
收藏 (0)

评论列表