R使用笔记(3)数据导入

学习三种常用导入数据方法

使用键盘输入

R中有一个函数edit()可以自动调用一个允许手动输入数据的编辑器,如

1
2
3
data <- data.frame(age=numeric(0))
data <- edit(data) #之后便会弹出编辑框

从带分隔符的文本中导入数据

使用read.table()从带分隔符的文件中导入数据,并将其保存为一个数据框

mydataframe <- read.table(file, option)

函数read.table()的选项
选项描述
header文件在第一行是否包含变量名的逻辑性变量
sepsep=“”表示用空格分隔数据,sep=“,”表示用逗号分隔,sep=“/t”表示用制表符分隔数据
row.names,col.names用于指定行名列名,header=FALSE时变量会被命名为V1、V2···
na.strings选择用于表示缺失字符向量,na.strings=c(“-9”,“?”)把-9和?全部转换为NA
skip读取数据时跳过行的数目
colClasses指定以何种格式读取数据的列

导入Excel数据

读取Excel文件最好的方式是将其在Excel中导出为一个csv文件,并用read.table()函数将其导入到R中。另外还可以用xlsx()配合xlsxjars,rJava包,不过比较麻烦(还要安装Java),还是转化成为csv文件吧,方便!

高级导入方法

前面介绍的是初级阶段的数据导入,高级阶段的包括导入XML数据、网页数据、SPSS数据、Stata数据等等,限于篇幅,这里就不一一赘述了。

特别要推荐的一款软件:Stat/Transfer,它是一款可以在34种数据格式之间作转换的独立应用程序。