Show HN: HTML to Markdown with CSS selector & XPath annotations for LLM Scraper
Category: devtools
Tags: web-scraping, html-to-markdown, llm-tools
Score: 7.0/10 (Innovation: 7, Technical: 6, Documentation: 8, Utility: 7)
Scrapedown converte HTML para Markdown anotado com seletores CSS e XPath, projetado especificamente para facilitar a raspagem de dados assistida por LLMs. É interessante porque combina a legibilidade do Markdown com a estrutura do DOM, permitindo que LLMs gerem código de raspagem reutilizável e preciso em uma única passagem.
Target audience: data engineers, backend devs
Repository: https://github.com/lightfeed/scrapedown · TypeScript · MIT · 7 stars
View on Hacker News