MinerU 系列教程 第四篇本篇教程作为模块二:核心篇 - 架构与引擎的首课,将深入剖析 MinerU 最核心的架构设计 —— 四大后端体系。你将理解每种后端的设计定位、适用场景,以及它们如何通过统一的 Middle JSON 中间格式和 Magic Model 转换层实现"异构输出,标准化消费"的架构目标。学习目标完成本课学习后,你将能够:理解 MinerU 四大后端(Pipeline / VLM / Hybrid / Office)的设计定位与技术路线差异掌握后端选择的决策矩阵,能根据精度、速度、显存、场景需求做出合理选择理解 Middle JSON 统一中间格式的设计动机与数据结构理解 Magic Model 转换层如何将异构模型输出标准化为统一的块结构熟悉mineru/backend/目录的代码组织方式和各后端的入口函数一、为什么需要多后端架构?文档解析不是一个"一刀切"的问题。不同的文档类型、不同的硬件环境、不同的精度需求,都需要不同的技术路线。MinerU 通过多后端架构,将"做什么"(解析文档、生成结构化输出)与"怎么做"(用哪种模型、哪种推理方式)解耦:用户需求 后端选择 │