Не просто ещё одна Python-библиотека для парсинга страниц. Это — адаптивная экосистема, которая не ломается от первого же апдейта сайта и умеет самостоятельно находить ваши данные, даже если структура DOM поменялась.
Scrapling — это:
pip install scrapling
from scrapling.fetchers import StealthyFetcher
page = StealthyFetcher.fetch("https://example.com", headless=True)
titles = page.css(".post-title", adaptive=True).getall()
print(titles)
🪄 Адаптивные селекторы
Scrapling может обучить ваш парсер тому, как выглядят нужные элементы, и повторно находить их, даже если сайт их перемещает или перестраивает.
🕸 Обход анти-ботов и динамики
Умеет обходить защиту сайтов (например, Cloudflare Turnstile) из коробки, а также загружать страницы через полноценный браузер (Playwright).
⚡️ Spider-фреймворк с паузами/возобновлением
Может работать как полноценный краулер с:
* параллельными сессиями
* автоматической ротацией прокси
* возможностью паузы и продолжения
* статистикой в реальном времени — и всё это без тонны кода.
#python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52👍21❤10
Если ты хоть раз сталкивался с антибот-системами или жёсткими проверками сайтов, то знаешь: обычных прокси или квн* будет маловато.
Здесь нужны настоящие инструменты антидетекта, которые маскируют твои действия под человека.
В этом репозитории собраны лучшие ресурсы:
Must-have подборка для ресёрча, тестирования и повышения приватности.
Сохраняй, чтобы не потерять
#soft #github #pentest
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍35🔥12❤7