Записки админа
12.6K subscribers
631 photos
28 videos
221 files
2.39K links
Пишу о Linux и администрировании серверов.

Связаться с автором: @servers

Заметки в браузере: https://sysadmin.pm/

Буст канала: https://tttttt.me/sysadminnotes?boost
Download Telegram
Иногда, при написании скриптов, встаёт необходимость обработать какую-то HTML страницу, убрать из неё лишний код и т. п. Для этого, можно использовать sed, например, так:

$ sed -e :a -e 's/<[^>]*>//g;/</N;//ba' index.html

Но способ далеко не самый удобный. Гораздо удобнее во многих случаях сделать вот так:

$ lynx --dump index.html

Либо сразу обратиться к сайту:

$ lynx --dump sysadmin.pm

И получить при этом, только контент, уже очищенный от всего лишнего.

#будничное #sed #lynx