Presto实战与演练_学习笔记

首页免费课 Presto实战与演练笔记

Presto实战与演练

                
                叁金
            JAVA开发工程师

                    查看讲师更多课程 
                    叁金讲师的其他课程
                
玩转热门框架 用企业级思维 开发通用够硬的大数据平台
实战·初级·485

                                                                                                                                    ￥448.00
                                            
多层次构建企业级大数据平台， 成就全能型大数据开发
实战·高级·153

                                                                                                                                    ￥599.00
                                            
ChatGPT入门实战课 AI提效大数据开发平台建设
实战·初级·260

                                                                                                                                    ￥168.00
                                            
Calcite数据管理与SQL优化实战
初级·1309
免费课程
                                
Hadoop基础及演练
初级·52355
免费课程
                                
                难度中级
            
                时长 3小时 0分
            
                学习人数
            
综合评分9.67
                            8人评价
                        查看评价
                                9.0
                                内容实用
                            
                                10.0
                                简洁易懂
                            
                                10.0
                                逻辑清晰

最热最新

sqrtqiezi 07:52
//TODO
- 如何设计支持多种数据源的数据抽取方案
- 如何构建数据采集的元数据信息
- 如何通过元数据信息建立数据的血缘关系
查看全部

0 采集收起来源：常用数据采集框架介绍
2020-05-22
gongwanyi 03:46

常见数据采集框架
1）Apache Flume：分布式、可靠的、高可用的日志收集系统，支持多种数据来源，
配置灵活。
2）Gobblin:用来整合各种数据源的通用型ETL框架，理论上各种数据都可以在这里
“一站式”解决整个ETL整个过程
3）DataX:阿里开源的异构数据源同步工具，致力于实现关系数据库、HDFS、Hive、
HBase、FTP等异构数据源的稳定数据同步。

查看全部

0 采集收起来源：常用数据采集框架介绍
2020-04-14
gongwanyi 01:19

流程示意图：

查看全部

0 采集收起来源：常用数据采集框架介绍
2020-04-14
gongwanyi 07:32

OLTP&OLAP区别

查看全部

0 采集收起来源：Hive简介
2020-04-13
慕瓜0579600 06:32

sqoop import --connect jdbc:mysql://localhost:3306/sqooptest
--username root --password imooc@mysql --table testtable
--driver com.mysql.jdbc.Driver --split-by id
--num-mappers 1
--target-dir /testtable

sqoop export --connect jdbc:mysql://localhost:3306/sqooptest
--username root --password imooc@mysql --table testtable
--export-dir /testtable

查看全部

0 采集收起来源：Sqoop导入导出命令练习(HDFS)
2020-03-05
慕瓜0579600

sqoop import：rdbms表中的每一行都被视为hdfs中的记录
sqoop export：读取并按照指定分隔符解析数据插入到rdbms
sqoop job：将sqoop导入导出流程保存成job，方便下次执行

查看全部

0 采集收起来源：Sqoop简介
2020-03-05

慕瓜0579600

create external table table2(
id int,name string,interest array<string>,
score map<string,string>)
row format delimited fields terminated by ','
collection items terminated by '-'
map keys terminated by ':' location '/testtable';

desc formatted table2;

创建分区表

create external table table2(
id int,name string,interest array<string>,
score map<string,string>)
partitioned by (year int)
row format delimited fields terminated by ','
collection items terminated by '-'
map keys terminated by ':' stored as textfile;

load data local inpath 'root/testdata.txt' into table
table3 partition(year=2018);

show partitions tables;

alter table table3 add partition(year=2019) 
location '/testtable';

show partitions table3;

alter table table3 drop partition(year=2019);

查看全部

1 采集收起来源：Hive外部表及分区表操作

2020-03-05

慕瓜0579600

create table table1(
id int,name string,
interest array<string>,
score map<string,string>)
row format delimited fields terminated by ','
collection items terminated by '-'
map keys terminated by ':' stored as textfile;

load data local inpath '/root/testdata.txt' overwrite into
table table1;

查看全部

0 采集收起来源：Hive内部表操作

2020-03-05

qq_慕函数2172331 00:10

1234564899

查看全部

0 采集收起来源：SQL on Hadoop简介
2019-11-21
lowenest 06:57

数据采集系统需求 ·数据源管理与状态监控 ·定时、实时、全量、增量等多模式的数据采集及任务监控 ·元数据管理、数据补采及数据归档

查看全部

0 采集收起来源：常用数据采集框架介绍
2020-09-11
lowenest 03:56

常用数据采集框架 ·Apache Flume：分布式、可靠的、高可用的日志收集系统，支持多种数据来源，配置灵活 ·Gobblin：用来整合各种数据源的通用型ETL框架，理论上各种数据都可以在这里“一站式”解决ETL整个过程 ·DataX：阿里开源的异构数据源同步工具，致力于实现关系数据库、HDFS、Hive、HBase、FTP等异构数据源的稳定数据同步

查看全部

0 采集收起来源：常用数据采集框架介绍
2020-09-11
lowenest 01:30

数据采集框架图

查看全部

0 采集收起来源：常用数据采集框架介绍
2019-07-16
lowenest 05:16

Sqoop 常用命令
·Sqoop Import:RDBMS表中每一行都被视为HDFS中的记录·Sqoop Export：读取并按照指定分隔符解析数据插入到RDBMS
·SqoopJob：将Sqoop导入导出流程保存成Job，方便下次执行

查看全部

0 采集收起来源：Sqoop简介
2019-07-16
lowenest 10:14

列式存储优点
·查询时只需要读取查询所涉及的列，降低IO消耗，同时保存每一列统计信息，实现部分谓词下推
·每列数据类型一致，可针对不同的数据类型采用其高效的压缩算法·列式存储格式假设数据不会发生改变，支持分片、流式读取，更好的适应分布式文件存储的特性

查看全部

0 采集收起来源：列式存储格式介绍
2019-07-16
lowenest 02:29

数据仓库
·数据仓库是将多个数据源的数据经过ETL处理之后，按照一定的主题集成起来提供决策支持和联机分析应用的结构化数据环境
·ETL:Extract（抽取）、Transform（转换）、Load（加载）

查看全部

0 采集收起来源：Hive简介
2019-07-16

0/150

提交

取消

开始学习

课程须知: 本课程是对Presto的介绍与实战，课程的项目开发基于Python Flask框架，但对于Flask框架应用无过多介绍，需要同学有一定的了解，因Python代码本身相对简单，亦可边看代码边学。

老师告诉你能学到什么？: 1、Hive的基本概念与基础操作 2、Sqoop的基础操作和Gobblin的设计方案 3、Presto的架构及代码操作

微信扫码，参与3人拼团

热搜

最近搜索清空

Presto实战与演练