🐼 pdf

👇 6 个项目

PDFMathTranslate

24.6k Python AGPL-3.0

PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/MCP/Docker/Zotero

1 11 个月前 2 个月前

MinerU

40.8k Python AGPL-3.0

A high-quality tool for convert PDF to Markdown and JSON.一站式开源高质量数据提取工具,将PDF转换成Markdown和JSON格式。

1 1 年前 14 天前

OCRmyPDF

30.5k Python MPL-2.0

OCRmyPDF adds an OCR text layer to scanned PDF files, allowing them to be searched

1 11 年前 14 天前

kkFileView

13.1k Java

Universal File Online Preview Project based on Spring-Boot

1 7 年前 12 天前

paperless-ngx

29.9k Python GPL-3.0

A community-supported supercharged document management system: scan, index and archive all your documents

1 3 年前 6 天前

markitdown

70.5k Python MIT

Python tool for converting files and office documents to Markdown.

1 9 个月前 5 天前