使用BeautifulSoup库可以轻松地清除打印和换行符。
首先,您需要导入BeautifulSoup库和要处理的HTML代码。
from bs4 import BeautifulSoup
html = """
这是一个示例文本。
这是另一个示例文本。
"""
接下来,您可以使用BeautifulSoup库来解析HTML代码,并使用.get_text()
方法来获取清除打印和换行的文本。
soup = BeautifulSoup(html, 'html.parser')
text = soup.get_text()
print(text)
输出结果将是:
这是一个示例文本。
这是另一个示例文本。
请注意,.get_text()
方法将返回所有文本内容,包括在标签中的文本内容。
如果您只想清除打印和换行符,可以使用.stripped_strings
属性。
for string in soup.stripped_strings:
print(string)
输出结果将是:
这是一个示例文本。
这是另一个示例文本。
这种方法将只返回实际的文本内容,而不包括打印和换行符。