python 写入csv文件中文乱码
时间: 2025-01-11 10:53:33 浏览: 58
### 解决Python写入CSV文件时出现中文乱码的方法
当使用Python编写程序向CSV文件中写入含有中文字符的数据时,可能会遇到乱码问题。这通常是因为文件的编码格式与Python使用的默认编码格式不匹配所致[^3]。
为了防止这种情况发生,在打开文件时指定正确的编码参数至关重要。对于包含中文字符的情况,推荐使用`utf-8-sig`作为编码方式,而不是简单的`utf-8`。这是因为UTF-8签名(BOM)能够帮助某些应用程序识别文件的实际编码格式[^5]。
下面是一个具体的例子,展示了如何通过设置合适的编码选项来避免乱码:
```python
import csv
data = [['城市', '人口'], ['北京', '2170万'], ['上海', '2424万']]
with open('cities_population.csv', 'w', newline='', encoding='utf-8-sig') as file:
writer = csv.writer(file)
for row in data:
writer.writerow(row)
```
上述代码片段创建了一个名为`cities_population.csv`的新文件,并将给定的城市及其对应的人口数以表格形式存入其中。这里特别注意到了`open()`函数中的`encoding='utf-8-sig'`参数,它确保了即使是在那些可能无法自动检测到无BOM UTF-8编码的应用程序里也能正确显示汉字。
此外,如果已经存在一个带有乱码问题的老版本CSV文件,则可以通过重新读取并再次保存的方式来修正其编码错误。具体做法如下所示:
```python
# 修复已有的带乱码的csv文件
old_file_path = "problematic_data.csv"
new_file_path = "fixed_encoding_data.csv"
with open(old_file_path, 'r', encoding='latin1') as old_file,\
open(new_file_path, 'w', newline='', encoding='utf-8-sig') as new_file:
reader = csv.reader(old_file)
writer = csv.writer(new_file)
for line in reader:
writer.writerow(line)
```
这段脚本首先尝试用一种较为宽松的方式(`latin1`)读取原始有问题的CSV文档,然后再将其内容按照新的编码标准重定向至另一个新建立的目标文件内。这样做不仅解决了现有数据中存在的乱码现象,同时也为后续操作提供了更加友好的环境。
阅读全文
相关推荐

















