可以通过使用 pandas 库来解决这个问题。以下是示例代码:
import pandas as pd
from bs4 import BeautifulSoup
html_text = '''
Name
Age
John
35
Jane
40
'''
soup = BeautifulSoup(html_text, "html.parser")
table = soup.find('table')
# 创建一个空的 dataframe
df = pd.DataFrame(columns=['Name', 'Age'])
# 解析表格内容,并将数据插入到 dataframe 中
for row in table.find_all('tr')[1:]:
columns = row.find_all('td')
name = columns[0].get_text()
age = columns[1].get_text()
df = df.append({"Name": name, "Age": age}, ignore_index=True)
# 将 dataframe 写入 CSV 文件
df.to_csv('output.csv', index=False)
以上代码中,我们使用 Beautifulsoup 库来解析 HTML 表格,然后使用 pandas 库中的 DataFrame 来保存数据。最后,我们将 DataFrame 写入 CSV 文件中。这种方法确保了所有单元格都不会返回空值。