MinerU是什么
MinerU是一款由上海 人工智能 实验室OpenDataLab 团队 开发 的开源高质量 数据 提取工具,专注于从复杂PDF文档、网页和 电子书 中高效提取内容。它能够将包含图片、公式和表格的多模态PDF转化为Markdown格式(如 markdown 、json),且具备高精度解析工具链,支持多种输入模型,支持自动识别乱码、转换公式为LaTex、保留文档结构,支持176种 语言 的准确识别,适用于学术、 财务 、 法律 等领域,兼容Windows/Linux/Mac平台。
MinerU如何使用/官网
网站:https://opendatalab.com/OpenSourceTools/Extractor/PDF
GitHub:https://github.com/opendatalab/MinerU
评论列表
发表评论