资讯专栏INFORMATION COLUMN

python 解决读取文件时格式不支持的总结

Donne / 1004人阅读

摘要:解决方法如下查看文件的编码格式编辑器进入命令模式,执行,查看文件的编码格式在程序中把文件读取时的格式设置为该编码格式,即能正确读取文件。总结在文件顶部添加,只是设置当前文件支持中文的输入,并不能真正解决读取的文件的编码格式不支持的问题。

目前在做的项目中,有一个列表用到的数据没有找到能直接满足需求的数据,给到我的文件里面是一张sql表,需要自己从sql表中,洗出自己需要的数据,于是想到了Python.

在使用python读取文件的时候,报了下面的错误:
UnicodeDecodeError: "utf8" codec can"t decode byte 0xb1 in position 0: invalid start byte.

网上一开始查到帖子说是编码格式不对,需要在python 文件的顶上添加 # codeing= utf-8,以支持中文编码,由于给到的sql 文件中,确实含有中文,于是就加上了上面的utf-8的支持,满怀希望的执行Python程序,结果还是报了同样的错。

经过一番查找,找到了真正的解决方法,就是文件的编码格式不对,需要在文件读取的时候设置正确的编码格式,或者直接修改文件的编码格式为程序默认支持的格式。解决方法如下:

1、查看文件的编码格式: vim/vi编辑器(进入esc命令模式),执行set fileencoding,查看文件的编码格式,在Python程序中把文件读取时的格式设置为该编码格式,即能正确读取文件。
2、更改文件的编码格式:vim/vi编辑器(进入esc命令模式),执行命令,set fileencoding=utf-8,然后回车,此时我们将文件的格式改成了utf-8格式的了,使用utf-8读取,就能正确的读出文件。

总结

1、在Python文件顶部添加 `#encoding=utf-8`,只是设置当前Python文件支持中文的输入,并不能真正解决读取的文件的编码格式不支持的问题。
2、遇到读取的文件格式不支持的情况,正确的的做法还是,查看文件真正的编码格式,在程序读取的文件的时候,设置正确的编码格式;或者修改文件的编码格式为我们程序支持的格式。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/42074.html

相关文章

  • mac中python读取csv文件编码报错问题解决

    摘要:之前在写一个简单的分班程序的时候,使用如下命令行读取文件出现了报错含义为程序由于文件编码问题无法读取文件。该行声明了该程序读取文件的编码格式为。如仍报错,可使用方法二解决。第二种使用命令,修改后文件出现乱码。 注:该文章基于mac环境。 之前在写一个简单的分班程序的时候,使用如下命令行读取csv文件, with open(city.csv) as f: lines = f.re...

    paulli3 评论0 收藏0
  • Python入门-基本语法1

    摘要:根据有效范围作用域分为全局变量和局部变量。类型以开头标识类型以开头标识类型以进制的字节码表示,实际上是一个字节串,回应了它的另一个名字。 < 返回索引页 基本语法 Hello World 代码注释 关键字 数据类型 变量、常量 变量 变量赋值 变量命名 变量的作用域 常量 字符串与编码 字符转义 字符编码 字符串操作 运算符与表达式 运算符 表达式 ...

    ingood 评论0 收藏0
  • Python数据分析 - numpy

    摘要:前言以下简称是数据分析必不可少的第三方库,的出现一定程度上解决了运算性能不佳的问题,同时提供了更加精确的数据类型。因此,理解的数据类型对数据分析十分有帮助。一维数据由对等关系的有序或无序数据构成,采用线性方式组织,可以用数组表示。 前言 NUMPY(以下简称NP)是Python数据分析必不可少的第三方库,np的出现一定程度上解决了Python运算性能不佳的问题,同时提供了更加精确的数据...

    CHENGKANG 评论0 收藏0
  • 媲美Pandas?告诉你PythonDatatable包到底怎么用!

    摘要:帧的基础属性下面来介绍中的一些基础属性,这与中的一些功能类似。下面来看看如何在和中,通过对分组来得到列的均值分组分组代表什么在中,代表,它提供一种简单的方式来引用当前正在操作的帧。 showImg(https://segmentfault.com/img/remote/1460000019598242);作者 | Parul Pandey 【导读】工具包 datatable 的功能特征...

    KitorinZero 评论0 收藏0
  • Hadoop Raid-实战经验总结

    摘要:如何在不降低数据可靠性的基础上,进一步降低存储空间成本,成为腾讯大数据迫切需要解决的问题。如下图所示,对于每一个原始文件,都会在目标目录生成一个对应的检验文件,造成元数据量。 分布式文件系统用于解决海量数据存储的问题,腾讯大数据采用HDFS(Hadoop分布式文件系统)作为数据存储的基础设施,并在其上构建如Hive、HBase、Spark等计算服务。HDFS块存储采用三副本策略来保证数据可靠...

    lolomaco 评论0 收藏0

发表评论

0条评论

Donne

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<