《R数据可视化手册》——1.3 加载分隔符式的文本文件

简介:

本节书摘来异步社区《R数据可视化手册》一书中的第1章,第1.3节,作者:【美】Winston Chang,更多章节内容可以访问云栖社区“异步社区”公众号查看。

1.3 加载分隔符式的文本文件

问题
如何加载一个分隔符式的文本文件中的数据?

方法
加载逗号分隔组(CSV)数据的最常用方法是:

data <-read.csv("datafile.csv")```
讨论
由于数据文件有许多不同的格式,为了加载它们,提供了很多对应的选项。如果一个数据集首行没有列名:

data <-read.csv("datafile.csv", header=FALSE)`
得到的数据框的列名将是V1、V2等,你可能想要重命名列:

#手动为列名赋值
names(data) <-c("Column1","Column2","Column3")```
还可以用sep参数来设置分隔符号。如果是空格分隔,使用sep=" ";如果是制表符分隔,使用\t。

data <-read.csv("datafile.csv", sep="t")`
默认情况下,数据集中的字符串(string)会被视为因子(factor)处理。假设下面是你的数据文件,然后,你用read.csv()来读取:

"First","Last","Sex","Number"
"Currer","Bell","F",2
"Dr.","Seuss","M",49
"","Student",NA,21```
得到的数据框将会把First、Last等存储为因子,尽管此时将它们视为字符串(或使用R中的术语,字符:character)更为合理。为了区别这一点,可以设置stringsAsFactors=FALSE。如果有些列应该被处理为因子格式,你可以再逐个转换:

data <-read.csv("datafile.csv", stringsAsFactors=FALSE)

转换为因子

data$Sex <-factor(data$Sex)

str(data)

'data.frame': 3 obs. of 4 variables:
$ First : chr "Currer" "Dr." ""
$ Last : chr "Bell" "Seuss" "Student"
$ Sex : Factor w/ 2 levels "F","M": 1 2 NA
$ Number: int 2 49 21`
或者,你可以在加载的时候不做设置(字符串自动转换为因子),加载之后再对需要的列进行因子到字符的转换。

另见
read.csv()是对read.table()一个便捷的封装函数。如果需要更多的输入控制,参见?read.table。

相关文章
|
2月前
|
iOS开发 MacOS Python
Python编程-macOS系统数学符号快捷键录入并生成csv文件转换为excel文件
Python编程-macOS系统数学符号快捷键录入并生成csv文件转换为excel文件
32 0
|
7月前
|
人工智能 数据可视化 定位技术
【工具使用】QGIS导入csv文件进行数据可视化
【工具使用】QGIS导入csv文件进行数据可视化
236 0
|
7月前
|
存储 数据挖掘 数据库
【办公自动化】使用Python一键往Word文档的表格中填写数据
【办公自动化】使用Python一键往Word文档的表格中填写数据
329 1
|
7月前
|
机器学习/深度学习 定位技术 数据格式
Python对大量表格文件加以数据截取、逐行求差、跨文件合并等处理的方法
Python对大量表格文件加以数据截取、逐行求差、跨文件合并等处理的方法
136 1
|
7月前
|
机器学习/深度学习 数据可视化 数据挖掘
【办公自动化】使用Python一键提取PDF中的表格到Excel
【办公自动化】使用Python一键提取PDF中的表格到Excel
325 0
|
缓存 BI Linux
《Linux操作系统编程》第九章 数据查找和筛选工具 : 了解流编辑器sed和报表生成器awk的简单使用
《Linux操作系统编程》第九章 数据查找和筛选工具 : 了解流编辑器sed和报表生成器awk的简单使用
85 0
|
数据可视化 定位技术 API
python数据可视化开发(4):获取对应地址的pdf文档并分类保存到本地文件夹
python数据可视化开发(4):获取对应地址的pdf文档并分类保存到本地文件夹
124 0
|
存储 自然语言处理 数据可视化
python读取PDF文件并做词云可视化
python读取PDF文件并做词云可视化
416 0
python读取PDF文件并做词云可视化
|
BI 数据安全/隐私保护
Excel实用技巧
Excel到底有多好,不在于它本身,而取决于用它的人。或许你并不需要用Excel画出逆天的图画,但如果说职场如战场的话,Excel绝对是你制胜的核武器。下面这些Excel实用技巧,可以让你摆脱原地踏步的基本操作,向表哥表姐之路更进一步。
1435 0
Excel实用技巧
|
存储 数据可视化 Python
Python3——处理.CSV文件格式的数据并用matplotlib可视化
处理CSV文件格式的数据 highs_lows.py import csv from matplotlib import pyplot as plt from datetime import datetime #读取CSV文件数据 filename='sitka_weather_2014.
2916 0