u00e9专题

Python爬虫遇到法语é变成\u00e9

用Python爬虫过程中,尤其是爬取国外网站时候会发现出现一些\u00e9,\u00e8这种 查看原网页发现是一些法文,如é,à,ù等 其实都是不同编码包含内容不同的问题 一般我们用Python存储数据到文件时候是先编码为其他的编码集,比如gbk,或者常用的utf-8 在这儿我们需要的是它原始信息,所以需要数据原始信息,这儿就要提到unicode-escape编码集 unicod