python beautifulsoup或csv编码问题

Python BeautifulSoup or CSV encoding issue with &nbsp

我在寻找将HTML表转换为csv格式的方法,并遇到了以下几点,这看起来很有希望(因为我也在尝试学习python)https://stackoverflow.com/a/16697784/838253

不幸的是,它对我的样本不起作用,我遇到了错误

1
UnicodeEncodeError: 'ascii' codec can't encode character u'\xa0' in position 753: ordinal not in range(128)

这似乎是BeautifulSoupstripped_strings把不间断空间 转换成u'\xa0'的结果。这看起来像完全正常的Unicode(尽管将多个 转换为单个'u'xa0'似乎有点过时)

错误似乎来自csv模块。为什么这个不能处理标准的Unicode,处理它的最佳方法是什么?


在python 2.7中,csv模块不支持unicode,请参见文档开头的注释。

您可以使用示例中的UnicodeWriter来用unicode编写csv数据。