为了账号安全,请及时绑定邮箱和手机立即绑定

R语言基础

  • x <- data.frame(v1=1:5, v2=6:10, v3=11:15) x$v3[c(2,4)] <- NA #给第三列,第二和第四行的数据赋值为空 x[(x$v1<4 & x$v2>=8),] x[which(x$v1>2),] x[x$v1>2]#以上两行等价 subset(x,x$v1>2)
    查看全部
    1 采集 收起 来源:数据框的子集

    2018-03-22

  • 2.4列表 --可以包含不同类型的对象 创建列表 l<-list("a",2,10L,3+4i,TRUE) 给列表的元素命名 l2<-list(a=1,b=2,c=3) 创建元素个数大于1,l3<-list(c(1,2,3),c(4,5,6,7)) x<-matrix(1:6,nrow=2,ncol=3) dimnames(x)<-list(c("a","b"),c("c","d","2"))
    查看全部
  • JJ女魔学习小组
    查看全部
  • 小结内容
    查看全部
    1 采集 收起 来源:小结

    2015-12-28

  • 向量
    查看全部
  • class() 类型
    查看全部
  • 数据结构
    查看全部
  • 第3章 操纵数据:构建子集(subsetting)

    3-1基本方法

    原始数据(raw dataset)——预处理后的数据(clean dataset)

    基本方法:

    1. []:提取一个或多个类型相同的元素

    2. [[]]:从列表或数据框中提取元素

    3. $:按名字从列表或数据框中提取元素

    补充:R语言的数组下表是从1开始而不是0开始

    例:x<-1:10    x[1] (拿到x的第1个元素)  x[1:5] (拿到x的前5个元素)   x[x>5] (拿大于5的元素)

    x[x>5&x<7]      x[x<3|x>7]

    y<-1:4

    names(y)<-c("a","b","c","d")   y[2]   y["b"](都是拿到y的第2个元素)

    查看全部
    1 采集 收起 来源:基本方法

    2021-09-24

  • 因子(factor)—分类数据/有序 vs. 无序

                           —整数向量 + 标签(label)优于整数向量

    x <- factor(c("female","female","male"),levels(“male”,"female"))                                 #可以构建因子,并且可以通过levels设立基线因子t

    table(x)  #得出x因子的分布表

    unclass(x) #将x因子转化为值标签

    查看全部
  • x <- 1   #‘<-’是R语言中的赋值符号

    [1]        #表示它后面接着的元素是x第一个元素

     1         #x中存储的内容是1

    class(x)#用于查看变量x的类型

    x <- 3L#在数字后面加入大写L定义整型

    x <- "" #定义字符串

    x <- TRUE #定义逻辑型(真、假)  注意在定义时需要大写

    x <- a+bi  #定义复数类型

    查看全部
  • 得到向量中非缺失值的元素:x[!is.na(x)],!代表取反

    选取两个向量(x,y)中对应位置都不是缺失值的元素:用complete.cases()函数给z赋值,得到逻辑向量,然后用x[z]和y[z]得到最终结果

    看数据集长什么样用head()函数,数据集中每一行叫做一次记录,每一列叫做一个变量,通常会选择在所有变量中都没有缺失值的记录,这时可用complete.cases(数据集)函数给z(任一字母)赋值

    查看全部
    1 采集 收起 来源:处理缺失值

    2019-08-09

  • 因子是用来处理分类数据(有序、无序两种)的,有序指的是可以比大小的,无序则相反,如性别即是无序的。

    因子=整数向量+标签(可对整数向量进行描述),常用于线性模型lm()和一般线性模型glm()

    创建因子用factor(),可通过levels(相当于标签)设定谁是基线水平(第一个元素),levels是因子的一个属性

    对当前因子进行整体性了解用table(),去掉属性看因子的内容用unclass()


    查看全部
  • # Vector

    #需要新建一个文件然后保存,这样的话代码就能够被重复利用

    x <- vector("character", length = 10)

    #定义一个长度为10的字符型向量x

    x1 <- 1:4

    #把1-4的值赋给向量x

    x2 <- c(1,2,3,4)

    #直接给向量x赋值

    x3 <- c(TRUE, 10, "a")

    #向量内包含不同类型的元素,强制转换成同一类元素类型,如右所示本例转为了字符型。


    as.numeric(x3)#同理可强制转换成别的类型

    #可进行强制转换,但是可能会引入缺失值:"NA",上面代码运行后命令台的显示结果是:

    #> as.numeric(x3) //把向量x3强制转换为数值型

    #[1] NA 10 NA (用缺失值代替不知道该如果转换的元素值)

    #Warning message:

    #NAs introduced by coercion


    查看全部
  • lapply函数可以处理循环列表中的没一个元素,但是返回了是一个列表

    注意,如果传入lapply函数的不是一个列表,那么他将进行强制转换为列表

    slapply函数返回结果是一个数值型的

    mean函数是求平均的

    服从均匀分布的随机数

    runif(n, min = 0, max = 1)

    生成一个长度为10的向量,向量中的每个值服从0~1区间上的均匀分布,那么可以这样写

    查看全部
  • Sys.data()获取的时间格式为Data

    data()获取的时间格式为字符

    weekdays(data)判断日期是星期几

    months(data)判断月份是几月

    quarters(data)判断是这一年的第几个季度

    julian(data)返回距离1970-01-01过去了多少天

    查看全部

举报

0/150
提交
取消
课程须知
本课程需要学员提前掌握 安装好R和Rstudio
老师告诉你能学到什么?
1、R语言的数据结构 2、构建数据子集 3、重要函数的使用

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!