MinerU0.14.1

MinerU0.14.1

MinerU官方破解版下载安装v0.14.1-MinerU官方正版下载2026

更新于 2026-06-11 18:04
852.12MB
4.0 分
资源说明

MinerU是一款十分优秀的智能数据提取软件,软件功能强大,操作简单易用,提供70多种语言,专注于PDF文档的高效解析,能够快速处理复杂的多模态 PDF 文档,如图片、表格、公式和脚注等,支持Markdown、content.json 和 listlayout.json 等多种输出格式,满足用户的使用需求,感兴趣的小伙伴赶快下载使用吧!

MinerU软件功能

1、删除页眉、页脚、脚注、页码等元素,保证语义连贯。

2、按照人类阅读顺序输出文本,适用于单栏、多栏和复杂排版。

3、保留原始文档的结构,包括标题、段落、列表等。

4、提取图像、图片说明、表格、表格标题和脚注。

MinerU0.14.1

5、自动识别文档中的公式并将其转换为LaTeX格式。

6、自动识别文档中的表格并将其转换为HTML格式。

7、自动检测扫描的PDF和失真的PDF,并启用OCR功能。

8、OCR支持109种语言的检测和识别。

MinerU0.14.1

9、支持多种输出格式,如多模态和NLP的Markdown、按阅读顺序排序的JSON、信息丰富的中间格式等。

10、支持多种可视化结果,包括布局可视化、跨度可视化等,便于高效确认输出效果和质量检查。

11、支持纯CPU环境,支持GPU(CUDA)/NPU(CANN)/MPS加速。

12、兼容Windows、Linux和Mac平台。

MinerU软件安装步骤

1、在本站下载软件安装包,点击我同意继续安装;

MinerU0.14.1

2、选择安装选项,点击下一步;

MinerU0.14.1

3、自定义选择安装位置,点击安装。

MinerU0.14.1

MinerU软件更新日志

2025/11/04 2.6.4 发布

为pdf渲染图片增加超时配置,默认为300秒,可通过环境变量MINERU_PDF_RENDER_TIMEOUT进行配置,防止部分异常pdf文件导致渲染过程长时间阻塞。

为onnx模型增加cpu线程数配置选项,默认为系统cpu核心数,可通过环境变量MINERU_INTRA_OP_NUM_THREADS和MINERU_INTER_OP_NUM_THREADS进行配置,以减少高并发场景下的对cpu资源的抢占冲突。

2025/10/31 2.6.3 发布

增加新后端vlm-mlx-engine支持,在Apple Silicon设备上支持使用MLX加速MinerU2.5模型推理,相比vlm-transformers后端,vlm-mlx-engine后端速度提升100%~200%。

bug修复: #3849 #3859

2025/10/24 2.6.2 发布

pipline后端优化

增加对中文公式的实验性支持,可通过配置环境变量export MINERU_FORMULA_CH_SUPPORT=1开启。该功能可能会导致MFR速率略微下降、部分长公式识别失败等问题,建议仅在需要解析中文公式的场景下开启。如需关闭该功能,可将环境变量设置为0。

OCR速度大幅提升200%~300%,感谢 @cjsdurj 提供的优化方案

OCR模型优化拉丁文识别的准度和广度,并更新西里尔文(cyrillic)、阿拉伯文(arabic)、天城文(devanagari)、泰卢固语(te)、泰米尔语(ta)语系至ppocr-v5版本,精度相比上代模型提升40%以上

vlm后端优化

table_caption、table_footnote匹配逻辑优化,提升页内多张连续表场景下的表格标题和脚注的匹配准确率和阅读顺序合理性

优化使用vllm后端时高并发时的cpu资源占用,降低服务端压力

适配vllm0.11.0版本

通用优化

跨页表格合并效果优化,新增跨页续表合并支持,提升在多列合并场景下的表格合并效果

为表格合并功能增加环境变量配置选项MINERU_TABLE_MERGE_ENABLE,表格合并功能默认开启,可通过设置该变量为0来关闭表格合并功能

2025/09/26 2.5.4 发布

MinerU2.5技术报告现已发布,欢迎阅读全面了解其模型架构、训练策略、数据工程和评测结果。

修复部分pdf文件被识别成ai文件导致无法解析的问题

2025/09/20 2.5.3 发布

依赖版本范围调整,使得Turing及更早架构显卡可以使用vLLM加速推理MinerU2.5模型。

pipeline后端对torch 2.8.0的一些兼容性修复。

降低vLLM异步后端默认的并发数,降低服务端压力以避免高压导致的链接关闭问题。

更多兼容性相关内容详见公告