python中爬取网页保存文件字符编码问题导致报错解决方案
UnicodeEncodeError: 'gbk' codec can't encode character '\xe7' in position 53: illegal multibyte sequ
爆出这种错误的话可以尝试以下方法
python将字符串写入文件报错
UnicodeEncodeError: 'gbk' codec can't encode character '\xe7' in position 53: illegal multibyte sequence
网上没有找到相对应的原因,仔细观察了一下要存入的数据,发现有Chopin Frédéric François这样的英文字符,所以需要用到codecs模块
解决办法:
import codecs
打开文件时用
fp = codesc.open('x.txt','w','utf-8')
问题解决