开发者社区> 问答> 正文

怎么利用python读文件

怎么利用python读文件

展开
收起
云计算小粉 2018-05-10 20:11:02 2311 0
2 条回答
写回答
取消 提交回答
  • image.png

    2019-11-27 17:17:27
    赞同 展开评论 打赏
  • 互联网小站长、java程序员、运营爱好者,关心开源与喜欢的一切,喜欢总结写攻略,对产品设计有点兴趣......

    1、读取txt数据

    In [1]: import pandas as pd

    In [2]: mydata_txt = pd.read_csv('C:\test_code.txt',sep = 't',encoding = 'utf-8')

    对于中文的文本文件常容易因为编码的问题而读取失败,解决办法有两种情况:

    1)当原始文件txt或csv的数据不是uft8格式时,需要另存为utf8格式编码;

    2)如果原始的数据文件就是uft8格式,为了正常读入,需要将read_csv函数的参数encoding设置为utf-8

    将原始数据另存为utf8格式的数据,重新读入txt数据

    In [3]: mydata_txt = pd.read_csv('C:\test.txt',sep = 't',encoding = 'utf-8')

    In [4]: mydata_txt

    很顺利,txt文本文件数据就这样进入了Python的口袋里了。

    2、读取csv数据

    csv文本文件是非常常用的一种数据存储格式,而且其存储量要比Excel电子表格大很多,下面我们就来看看如何利用Python读取csv格式的数据文件:

    In [5]: mydata_csv = pd.read_csv('C:\test.csv',sep = ',',encoding = 'utf-8')

    In [6]: mydata_csv

    如果你善于总结的话,你会发现,txt文件和csv文件均可以通过pandas模块中的read_csv函数进行读取。该函数有20多个参数,类似于R中的read.table函数,如果需要查看具体的参数详情,可以查看帮助文档:help(pandas.read_csv)。

    二、读取电子表格文件

    这里所说的电子表格就是Excel表格,可以是xls的电子表格,也可以是xlsx的电子表格。在日常工作中,很多数据都是存放在Excel电子表格中的,如果我们需要使用Python对其进行分析或处理的话,第一步就是如何读取Excel数据。下面我们来看看如果读取Excel数据集:

    In [7]: mydata_excel = pd.read_excel('C:\test.xlsx',sep = 't',encoding = 'utf-8')

    In [8]: mydata_excel

    三、读取统计软件生成的数据文件

    1、读取SAS数据集

    SAS数据集的读取可以使用pandas模块中的read_sas函数,我们不妨试试该函数读取SAS数据集。下图是使用SAS打开的数据集,如果你的电脑中没有安装SAS,那你也可以通过Python实现数据的读取。

    In [1]: import pandas as pd

    In [2]: mydata_sas = pd.read_sas('G:\class.sas7bdat',encoding='utf8')

    2、读取SPSS数据集

    关于读取SPSS数据文件,需要为您的Python安装savReaderWriter模块,该模块可以到如下链接进行下载并安装:https://pypi.python.org/pypi/savReaderWriter/3.4.2

    安装savReaderWriter模块

    可以通过该命令进行savReaderWriter模块的安装:python setup.py install

    下图是SPSS数据在SPSS中打开的样子:

    In [1]: import savReaderWriter

    In [2]: mydata_spss = savReaderWriter.SavReader('employee_data.sav')

    In [3]: mydata_spss

    2019-07-17 22:24:55
    赞同 展开评论 打赏
问答分类:
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
From Python Scikit-Learn to Sc 立即下载
Data Pre-Processing in Python: 立即下载
双剑合璧-Python和大数据计算平台的结合 立即下载