🐼 parser

👇 2 Elemente

cheerio

29.1k TypeScript MIT

The fast, flexible, and elegant library for parsing and manipulating HTML and XML.

1 vor 13 Jahr(en) vor 15 Tag(en)

MinerU

27.5k Python AGPL-3.0

A high-quality tool for convert PDF to Markdown and JSON.一站式开源高质量数据提取工具,将PDF转换成Markdown和JSON格式。

1 vor 1 Jahr(en) vor 7 Tag(en)