为了账号安全,请及时绑定邮箱和手机立即绑定

R语言基础

  • 数据框子集: $:按名字从列表或数据框中提取元素 x <- data.frame(v1=1:5,v2=6:10,v3=11:15) 给v3中的第二、四数据赋值: x$v3[c(2,4)] <- NA which:给出哪些条件为真,返回向量中元素值为真的下标 which(x$v1>2) subset(母集,构建子集的条件) subset(x,x$v1>2))
    查看全部
    1 采集 收起 来源:数据框的子集

    2018-03-22

  • 数据结构之 因子(Factor) - 分类数据:有序(可以比较) vs 无序(无法比较) - 整数向量+标签(label) eg: Male =1 Female =2 常用于lm() & glm() - x <- factor(c("female","female","male",“male","female")) y <- factor(content,levels=(基线水平,其他水平)) table(x) 了解现有因子水平
    查看全部
  • 构建子集的基本方法 > x<-1:10 > x[1] [1] 1 > #第几个元素 > > x[1:5] [1] 1 2 3 4 5 > #前5个元素 > > x[x>5] [1] 6 7 8 9 10 > #大于5的元素 > > x>5 [1] FALSE FALSE FALSE FALSE FALSE TRUE TRUE TRUE TRUE TRUE > x[x>5 & x<7] [1] 6 > x[x>3 | x>7] [1] 4 5 6 7 8 9 10 > y<-1:4 > names(y)<-c("a","b","c","d") > y a b c d 1 2 3 4 > y[2] b 2 > y["b"] b 2 > #使用名字来查找数据
    查看全部
    1 采集 收起 来源:基本方法

    2018-03-22

  • unclass去掉因子属性
    查看全部
  • table用于了解因子整体情况
    查看全部
  • 因子leves创建,第一个为基线水平
    查看全部
  • 不能比较大小——无序 可以比较——有序
    查看全部
  • # subsetting List x <- list(id=1:4,height=170,gender="male") x[1] #名字和内容 x[[1]] #内容 x[["id"]] x$id # $只能引用名字不能引用变量 x[c(1,3)] # subsetting nested element of a List X <- list(a = list(1,2,3,4),b = c("Monday","Tuesday")) X[[1]][[2]] #子列表中的内容 X[[1]][2] #子列表中的元素 X[[c(1,2)]] #partial matching 不完全匹配 l <- list(asdfghj=1:10) l[["a",exact=FALSE]]
    查看全部
    1 采集 收起 来源:列表的子集

    2018-03-22

  • y <- factor(c("female","female","male","male","female"),levels = c("male","female")) table(y) unclass(y) class(unclass(y))
    查看全部
  • x <- factor(c("female", "female", "male", "male"), levels = c( "male", "female")) 人为设定因子水平,前者为基线水平
    查看全部
  • dim是检验维度xtabs (Freq~Class)+Ages,data=Titanic)这是交叉列表 ftable()和上面差不多,但是表格比较扁平化
    查看全部
    1 采集 收起 来源:总结数据信息

    2017-07-27

  • 从矩阵当中取数,并且返回的是一个向量,如果想要返回的是一个矩阵,必须添加参数drop=false
    查看全部
    1 采集 收起 来源:矩阵的子集

    2017-07-25

  • mapply:lapply的多远版本 mapply(函数/函数名,数据,函数相关的参数) #相当于多次运行这个函数 list(rep(1,4),rep(2,3),rep(3,2),rep(4,1))可简化为mapply(rep,1:4,4:1) 函数: 函数名 <- function(参数列表){ 函数体 } ------------------------------ #lapply的多元版本 #mapply(参数) #mapply(函数/函数名,数据, 函数相关的参数) a<-list(rep(1,4), rep(2,3), rep(3,2),rep(4,1)) b<-mapply(rep,1:4,4:1) #等价于上面的list,rep是函数,1:4表示数据来源于这几个数,最后一个4:1表示要重复多少次 s <- function(n, mean ,std){ rnorm(n, mean, std) } #n表示从正态分布中取数的个数,mean表示均值,std表示标准差 s(4,0,1) #从s中抽取4个均值为0,标准差为1的数值 #调用函数s,生成1到5四个元素,其中均值是5到1,标准差是2 mapply(s, 1:5,5:1,2) 第二个表示个数,第三个表示均值,第四个表示标准差 list(s(1,5,2),s(2,4,2),s(3,3,2),s(4,2,2),s(5,1,2)) #这个list的效果跟mapply函数一样 得到的结果就是第一个为均值为5,标准差为2,的一个数值; 第二个就是均值为4,标准差为2,的2个数值 以此类推
    查看全部
  • 经简单实验,默认的基线水平并不是根据数据个数,而是由字母顺序决定的。 如:xx和zz 默认的levels是xx排在前面
    查看全部
  • 数据结构属性
    查看全部

举报

0/150
提交
取消
课程须知
本课程需要学员提前掌握 安装好R和Rstudio
老师告诉你能学到什么?
1、R语言的数据结构 2、构建数据子集 3、重要函数的使用

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!