为了账号安全,请及时绑定邮箱和手机立即绑定

R语言基础

  • rstudio设置为中文后会不认识jan,只认识中文的一月 > x5 <- "一月 1,2015 02:01" > x6 <- strptime(x5,"%B %d,%Y %H:%M") > x6 [1] "2015-01-01 02:01:00 CST" #正确 > x5 <- "Jan 1,2015 02:01" > x7 <- strptime(x5,"%B %d,%Y %H:%M") > x7 [1] NA #错误
    查看全部
  • R数据结构

    2.矩阵(matrix):向量+维度属性(整数向量:nrow, ncol)

    2.1 创建矩阵:

            方法一: x <- matrix(nrow=3, ncol=2) #创建一个3行2列矩阵,元素为NA。该函数创建矩阵时先列后行。

                            x <- matrix(1 : 6, nrow=3, ncol=2) #按列填充元素

            方法二: y <- 1 : 6  #生成一个向量

                           dim(y) <- c(2, 3) #指定行数与列数

    其他:dim(matrix):查看矩阵matrix的行数与列数

    attributes(matrix):查看矩阵matrix有哪些属性

    2.2 拼接矩阵

    y1 <- 1 : 6
    dim(y1) <- c(2 : 3)
    y2 <- matrix(1:6, nrow =2, ncol=3)
    
    rbind(y1, y2) #按行拼接
    cbind(y1, y2) #按列拼接

    3.数组:与矩阵类似,但维度可以大于2

    创建数组:x <- array(1:24, dim=c(4, 6)) #参数1填充元素,参数2指定维度

                    y <- array(1:24, dim=c(2, 3, 4))

    查看全部
  • 2.5 factor(因子) --分类数据/有序 vs 无序 --整数向量+标签(label) 创建因子 x<-factor(c("female","female","male","male","female")) y<-factor(c("female","female","male","male","female"),levels = c("male","female")) table(x) unclass(x) class(unclass(x))
    查看全部
  • 向量(vector):只能包含同一类型的对象

    创建向量的方法:1. 定义 x <- vector(数据类型,数据长度)

                               2. x1 <- 1:4   #创建整型向量1-4

                               3. x3 <- c(向量的元素)  # 例如构建向量x3<-c(1,2)

    #对于向量中元素类型不同的情况,R语言中会自动强制转化

     例如x3 <- c(TRUE,10,"a") 会转换为("TRUE","10","a")

     as.numeric(x)   #将x转换为数值型向量

     as.logical(x)      #将x转换为逻辑向量

     as.character(x)  #将x转换为字符型向量

    names(x1) <- c("a","b","c")  #给向量x1进行命名,“a”为第一个向量元    

                                                  素的名字,依次类推

    查看全部
  • 列表(list): 1.列表与向量的差别:列表可以同时包含不同类型的对象 2. l <- list("a", 2, 10L, 3+4i, TRUE)#建立列表 l2 <- list(a=1 ,b=2 ,c=3)#为列表元素命名 l3 <- list(c(1,2,3),c(4,5,6,7))#列表元素可以是向量,创建元素个数大于1 x <- matrix(1:6, nrow=2, ncol=3) dimnames(x) <- list(c("a","b"),c("c","d","e"))#为矩阵维度(行、列)命名
    查看全部
  • 1.R对象基本数据类型:

    (1)字符(character):"time";

    (2)数值(numeric):2, 2.3;

    (3)整数(integer): 2L;

    (4)复数(complex):1+2i;

    (5)逻辑(logical):TRUE, FALSE

    查看类型:class(variable)

    R区分大小写,字母相同大小写不同的变量名是不同的变量名。

    2.R对象属性

    (1)名称(name)

    (2)维度(dimensions: matrix, array)

    (3)类型(class)

    (4)长度(length)

    查看全部
  • 因子factor:用来处理分类数据的。可以理解为整数向量+标签(label)(优于整数向量,每个数字有自己具体的含义)。常用于线性模型。 分类数据可分为有序与无序。 创建因子: ①因子名字 <- factor(c()) #在c中依次因子包含的内容female,male,female,male... ②因子名字 <- factor(c(),levels=c()) #可通过levels设定基线水平 查看因子:table(因子名字) 去掉标签:unclass(因子名字)
    查看全部
  • 七、总结数据信息 #默认前六行或者后六行 head(airquality, 10)#查看前10行 tail(airquality, 10)#查看后10行 summary(airquality)#总结,数据分布整体把握 str(airquality)#以简洁方式对数据总结 table(airquality$Month)#对列进行频数统计 table(airquality$Ozone, useNA = "ifany")#将Ozone中NA的数值统计出来 any(is.na(airquality$Ozone))#判断是否有缺失值,true是有缺失值 sum(is.na(airquality$Ozone))#统计缺失值数量 all(airquality$Month < 12)#查看是不是所有的月份都小于12 #将Titanic强制转换为数据框 t <- as.data.frame(Titanic) x <- xtabs(Freq ~ Class + Age, data = t)#按照Class和Age生成交叉表 ftable(x)#扁平化显示 object.size(airquality)#查看对象大小 print(object.size(airquality),units="Kb")#按照kb显示大小
    查看全部
    3 采集 收起 来源:总结数据信息

    2018-03-22

  • #split #根据因子或者因子列表将向量或其他对象分组 #通常与lapply一起使用 #参数格式:split(向量/列表/数据框,因子/因子列表) x <- c(rnorm(5), runif(5),rnorm(5,1)) f <- gl(3,5) x f split(x,f) lapply(split(x,f), mean) lapply(split(x,f), sum) head(airquality) split(airquality,airquality$Month)#按照month分组查看 s <- split(airquality,airquality$Month) s table(airquality$Month)#查看每个Month下包含的记录数 # 求平均值 lapply(s, function(x) colMeans(x[,c("Ozone","Wind","Temp")])) #简化显示结果 sapply(s, function(x) colMeans(x[,c("Ozone","Wind","Temp")])) #处理缺失值 sapply(s, function(x) colMeans(x[,c("Ozone","Wind","Temp")],na.rm = T))
    查看全部
    2 采集 收起 来源:R语言函数 split

    2018-03-22

  • 数据框:1.存储表格数据 2.视为各元素长度相同的列表(元素类型可以不同)

    df <- data.frame(id=c(1,2,3,4),name=c("a","b","c"))#建立数据框

    nrow(df)  #查看df的行数

    ncol(df)    #查看df的列数

    对于相同类型的数据的数据框可以直接转换为矩阵

    data.matrix(df2)   #其中df2中元素类型相同

    查看全部
  • 列表:

    1、l<-list("a",2,10L,3+4i,TRUE) #列表可以包含各种类型的数据

    2、l2<-list(a = 1,b= 2,c = 3)#给列表的元素命名

    3、l3<-list(c(1,2,3),c(4,5,6)) #列表中每个元素的内容个数>1

    4、x<-matrix(1:6,nrow = 2,ncol = 3) dimnames(x) <- list(c("a","b"),c("c","d","e"))#矩阵的维度只能用列表来引入??

    5、列表和向量都可以包含不同类型的数据,但是列表中的元素可以是向量。


    查看全部
  • #排序

    x<-data.frame(v1=1:5,v2=c(10,7,9,6,8),v3=11:15,v4=c(1,1,2,2,1))
    x
    sort(x$v2,decreasing = TRUE)#对数据框v2进行降序排列
    sort(x$v3)#对数据框v3进行升序排列
    order(x$v2)#返回的不是内容本身,而是内容对应的下标排序
    x[order(x$v2),]#行顺序按照order方式排列
    x[order(x$v4,x$v3),]#先排序v4,再排序v3,v4的排序结果更强
    x[order(x$v4,x$v3,decreasing = TRUE),]#先排序v4,再排序v3,v4的排序结果更强


    查看全部
  • #split函数

    #根据因子或因子列表将向量或其它对分组
    #与lapply联用
    x <- c(rnorm(5), runif(5),rnorm(5,1))  
    f<-gl(3,5)
    split(x,f)#f因子中的水平1,2,3
    lapply(split(x,f),mean)#对列表中得每一个元素求平均值
    s<-split(airquality,airquality$Month)#$符号代表选择Month
    table(airquality$Month)
    lapply(s,function(x)colMeans(x[,c("Ozone","Wind","Temp")]))#s其实是一个数据框;计算平均值时,未将缺失值排除,故得出一些缺失值结果
    sapply(s,function(x)colMeans(x[,c("Ozone","Wind","Temp")],na.rm = TRUE))#使用na.rm=TRUE排除缺失值并求平均值,sapply对lapply结果进行了化简


    查看全部
    2 采集 收起 来源:R语言函数 split

    2018-10-11

  • 缺失值:

    NA和NaN NaN一般表示数字的缺失值,NA可以表示的缺失值类型更广,所以NaN属于NA,NA不属于NaN。 

    NA有类型属性:integer NA,character NA等 

    判断向量中是否有缺失值:is.na(向量名),is.nan(向量名),如果是缺失值返回TRUE,如果不是返回FALSE


    查看全部
  • 控制台的命令是一次的,如果想重复使用,就要新建文件,而且文件里的执行需要选择语句才可以执行,不像命令里的语句,直接按回车键。 注意:vector(类型,length=)函数里面是要同一类型的对象。length表示参数值的个数
    查看全部
首页上一页1234567下一页尾页

举报

0/150
提交
取消
课程须知
本课程需要学员提前掌握 安装好R和Rstudio
老师告诉你能学到什么?
1、R语言的数据结构 2、构建数据子集 3、重要函数的使用

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!