Test Markdownit对比MinerU
摘要
Test Markdownit对比MinerU
基础用法(无大模型)
- 优点:
- 各种文件格式都能转成markdown
- 速度快,不到1s一张10页的论文pdf就被转换完成
- 缺点:无法OCR、处理图片,无法处理公式
- 举例
1 | |

使用大语言模型进行图像描述
- 仓库的readme举例描述如下
1 | |
- 实际运行不了;需要改成如下,并添加自己的秘钥;
- 由于我没买过openAI的API,所以换成了Gemini进行尝试,结果运行出错,调查仓库issue发现此软件未对OpenAI之外的模型进行兼容处理;尽管使用OpenAI的API,也不能OCR;参考如下
- https://github.com/microsoft/markitdown/issues/255
- https://github.com/microsoft/markitdown/issues/256
- https://github.com/microsoft/markitdown/issues/232
1 | |
Markitdown与MinerU对比
- 不同
- Markitdown无OCR功能、无法处理图片、无法处理公式
- Markitdown速度快,不到1s一张10页的论文pdf就被转换完成;而MinerU需要7s左右(在GPU加速下)
- 共同点
- Markitdown、MinerU都能将各种文件格式转成markdown,包括PDF、图片、word、excel、ppt等
Test Markdownit对比MinerU
https://tolsz.site/2025/01/13/Markitdown/