Python爬虫爬取网页时,网页中的 “ ” 变成了 “?” 因为在爬虫爬取网页时,爬取到的html中 会被编码成 \x20,即不间断空白符全角空格符 会被编码成 \u3000 在使用UTF-8编码查看时,就会产生乱码,从而将某些所谓的 空格 变为 ? 使用replace方法将其替换成正常空格即可: html = html.replace(n'\x20', ' ').replace(n'\u3000', ' ')