BeautifulSoup: Упражнение 20 с решением
Напишите программу Python для создания дерева синтаксического анализа Beautiful Soup в красиво отформатированную строку Unicode с отдельной строкой для каждого тега HTML/XML и строка.
Пример решения:
Код Python:
from bs4 import BeautifulSoupstr1 = " Какой-то плохой HTML-код
" print ("Исходная строка:") print ( str1) soup = BeautifulSoup (" Какой-то плохой HTML-код
", "xml") print (" nСтрока в формате Unicode:") print ( soup.prettify ())
Пример вывода:
Исходная строка:Какой-то плохой HTML-код
Форматированная строка Unicode: xml version = "1.0" encoding = "utf-8"?>Некоторые плохие HTML-коды
Редактор кода Python: