🐼 parser

👇 2 Elemente

cheerio

29.5k TypeScript MIT

The fast, flexible, and elegant library for parsing and manipulating HTML and XML.

1 vor 13 Jahr(en) vor 1 Monat(en)

MinerU

34.9k Python AGPL-3.0

A high-quality tool for convert PDF to Markdown and JSON.一站式开源高质量数据提取工具,将PDF转换成Markdown和JSON格式。

1 vor 1 Jahr(en) vor 14 Tag(en)