-
x <- data.frame(v1=1:5, v2=6:10, v3=11:15) x$v3[c(2,4)] <- NA #给第三列,第二和第四行的数据赋值为空 x[(x$v1<4 & x$v2>=8),] x[which(x$v1>2),] x[x$v1>2]#以上两行等价 subset(x,x$v1>2)查看全部
-
2.4列表 --可以包含不同类型的对象 创建列表 l<-list("a",2,10L,3+4i,TRUE) 给列表的元素命名 l2<-list(a=1,b=2,c=3) 创建元素个数大于1,l3<-list(c(1,2,3),c(4,5,6,7)) x<-matrix(1:6,nrow=2,ncol=3) dimnames(x)<-list(c("a","b"),c("c","d","2"))查看全部
-
JJ女魔学习小组查看全部
-
小结内容查看全部
-
向量查看全部
-
class() 类型查看全部
-
数据结构查看全部
-
第3章 操纵数据:构建子集(subsetting)
3-1基本方法
原始数据(raw dataset)——预处理后的数据(clean dataset)
基本方法:
[]:提取一个或多个类型相同的元素
[[]]:从列表或数据框中提取元素
$:按名字从列表或数据框中提取元素
补充:R语言的数组下表是从1开始而不是0开始
例:x<-1:10 x[1] (拿到x的第1个元素) x[1:5] (拿到x的前5个元素) x[x>5] (拿大于5的元素)
x[x>5&x<7] x[x<3|x>7]
y<-1:4
names(y)<-c("a","b","c","d") y[2] y["b"](都是拿到y的第2个元素)
查看全部 -
因子(factor)—分类数据/有序 vs. 无序
—整数向量 + 标签(label)优于整数向量
x <- factor(c("female","female","male"),levels(“male”,"female")) #可以构建因子,并且可以通过levels设立基线因子t
table(x) #得出x因子的分布表
unclass(x) #将x因子转化为值标签
查看全部 -
x <- 1 #‘<-’是R语言中的赋值符号
[1] #表示它后面接着的元素是x第一个元素
1 #x中存储的内容是1
class(x)#用于查看变量x的类型
x <- 3L#在数字后面加入大写L定义整型
x <- "" #定义字符串
x <- TRUE #定义逻辑型(真、假) 注意在定义时需要大写
x <- a+bi #定义复数类型
查看全部 -
得到向量中非缺失值的元素:x[!is.na(x)],!代表取反
选取两个向量(x,y)中对应位置都不是缺失值的元素:用complete.cases()函数给z赋值,得到逻辑向量,然后用x[z]和y[z]得到最终结果
看数据集长什么样用head()函数,数据集中每一行叫做一次记录,每一列叫做一个变量,通常会选择在所有变量中都没有缺失值的记录,这时可用complete.cases(数据集)函数给z(任一字母)赋值
查看全部 -
因子是用来处理分类数据(有序、无序两种)的,有序指的是可以比大小的,无序则相反,如性别即是无序的。
因子=整数向量+标签(可对整数向量进行描述),常用于线性模型lm()和一般线性模型glm()
创建因子用factor(),可通过levels(相当于标签)设定谁是基线水平(第一个元素),levels是因子的一个属性
对当前因子进行整体性了解用table(),去掉属性看因子的内容用unclass()
查看全部 -
# Vector
#需要新建一个文件然后保存,这样的话代码就能够被重复利用
x <- vector("character", length = 10)
#定义一个长度为10的字符型向量x
x1 <- 1:4
#把1-4的值赋给向量x
x2 <- c(1,2,3,4)
#直接给向量x赋值
x3 <- c(TRUE, 10, "a")
#向量内包含不同类型的元素,强制转换成同一类元素类型,如右所示本例转为了字符型。
as.numeric(x3)#同理可强制转换成别的类型
#可进行强制转换,但是可能会引入缺失值:"NA",上面代码运行后命令台的显示结果是:
#> as.numeric(x3) //把向量x3强制转换为数值型
#[1] NA 10 NA (用缺失值代替不知道该如果转换的元素值)
#Warning message:
#NAs introduced by coercion
查看全部 -
lapply函数可以处理循环列表中的没一个元素,但是返回了是一个列表
注意,如果传入lapply函数的不是一个列表,那么他将进行强制转换为列表
slapply函数返回结果是一个数值型的
mean函数是求平均的
服从均匀分布的随机数
runif(n, min = 0, max = 1)
生成一个长度为10的向量,向量中的每个值服从0~1区间上的均匀分布,那么可以这样写
查看全部 -
Sys.data()获取的时间格式为Data
data()获取的时间格式为字符
weekdays(data)判断日期是星期几
months(data)判断月份是几月
quarters(data)判断是这一年的第几个季度
julian(data)返回距离1970-01-01过去了多少天
查看全部
举报