Иногда, при написании скриптов, встаёт необходимость обработать какую-то HTML страницу, убрать из неё лишний код и т. п. Для этого, можно использовать sed, например, так:
Но способ далеко не самый удобный. Гораздо удобнее во многих случаях сделать вот так:
Либо сразу обратиться к сайту:
И получить при этом, только контент, уже очищенный от всего лишнего.
#будничное #sed #lynx
$ sed -e :a -e 's/<[^>]*>//g;/</N;//ba' index.html
Но способ далеко не самый удобный. Гораздо удобнее во многих случаях сделать вот так:
$ lynx --dump index.html
Либо сразу обратиться к сайту:
$ lynx --dump sysadmin.pm
И получить при этом, только контент, уже очищенный от всего лишнего.
#будничное #sed #lynx