MinerU MinerU

MinerU wurde von opendatalab vor 1 Jahr(en) erstellt und zuletzt vor 23 Tag(en) aktualisiert.

A high-quality tool for convert PDF to Markdown and JSON.一站式开源高质量数据提取工具,将PDF转换成Markdown和JSON格式。
Python 127.10MB AGPL-3.0 Github
Stars
30.9k
Fork
2.5k
Watch
153
Open Issues
150

kkFileView

12.7k Java

Universal File Online Preview Project based on Spring-Boot

1 vor 7 Jahr(en) vor 5 Tag(en)

OpenBB

36.6k Python NOASSERTION

Investment Research for Everyone, Everywhere.

1 vor 4 Jahr(en) vor 2 Monat(en)

markitdown

55.7k Python MIT

Python tool for converting files and office documents to Markdown.

1 vor 5 Monat(en) vor 6 Tag(en)

OCRmyPDF

27.9k Python MPL-2.0

OCRmyPDF adds an OCR text layer to scanned PDF files, allowing them to be searched

1 vor 11 Jahr(en) vor 15 Tag(en)

browser-use

58.5k Python MIT

Make websites accessible for AI agents

1 vor 6 Monat(en) vor 9 Tag(en)

instructor

10.4k Python MIT

structured outputs for llms

1 vor 1 Jahr(en) vor 1 Tag(en)

kokoro-onnx

1.9k Python MIT

TTS with kokoro and onnx runtime

1 vor 4 Monat(en) vor 18 Tag(en)

Jobs_Applier_AI_Agent_AIHawk

28.1k Python AGPL-3.0

AIHawk aims to easy job hunt process by automating the job application process. Utilizing artificial intelligence, it enables users to apply for multiple jobs in a tailored way.

1 vor 9 Monat(en) vor 2 Tag(en)

MoneyPrinterTurbo

19.9k Python MIT

利用AI大模型,一键生成高清短视频 Generate short videos with one click using AI LLM.

1 vor 1 Jahr(en) vor 3 Monat(en)

tensorflow

189.8k C++ Apache-2.0

An Open Source Machine Learning Framework for Everyone

1 vor 9 Jahr(en) vor 5 Tag(en)

PDFMathTranslate

13.3k Python AGPL-3.0

PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/Docker

1 vor 8 Monat(en) vor 4 Monat(en)

LLMs-from-scratch

44.3k Jupyter Notebook NOASSERTION

Implement a ChatGPT-like LLM in PyTorch from scratch, step by step

1 vor 1 Jahr(en) vor 23 Tag(en)

ChatTTS

36k Python AGPL-3.0

A generative speech model for daily dialogue.

1 vor 11 Monat(en) vor 7 Tag(en)

dify

87.8k TypeScript NOASSERTION

Dify is an open-source LLM app development platform. Dify's intuitive interface combines AI workflow, RAG pipeline, agent capabilities, model management, observability features and more, letting you quickly go from prototype to production.

1 vor 2 Jahr(en) vor 1 Monat(en)

cheerio

29.4k TypeScript MIT

The fast, flexible, and elegant library for parsing and manipulating HTML and XML.

1 vor 13 Jahr(en) vor 15 Tag(en)

paperless-ngx

26.7k Python GPL-3.0

A community-supported supercharged version of paperless: scan, index and archive all your physical documents

1 vor 3 Jahr(en) vor 15 Tag(en)

MinerU

30.9k Python AGPL-3.0

A high-quality tool for convert PDF to Markdown and JSON.一站式开源高质量数据提取工具,将PDF转换成Markdown和JSON格式。

1 vor 1 Jahr(en) vor 23 Tag(en)

yt-dlp

104.9k Python Unlicense

A feature-rich command-line audio/video downloader

1 vor 4 Jahr(en) vor 1 Monat(en)

fastapi

83.7k Python MIT

FastAPI framework, high performance, easy to learn, fast to code, ready for production

1 vor 6 Jahr(en) vor 15 Tag(en)