大数据入门教程

带你掌握大数据核心技能,从此轻松入门大数据

大数据入门实战课程

导学视频
Michael_PK

全栈工程师

八年互联网公司一线研发经验,担任大数据架构师。 主要从事基于Spark/Flink为核心打造的大数据公有云、私有云数据平台产品的研发。 改造过Hadoop、Spark等框架的源码为云平台提供更高的执行性能。 集群规模过万,有丰富的大数据项目实战经验以及授课经验(授课数千小时,深受学员好评)。

了解讲师
新手入门大数据 Hadoop基础与电商行为日志分析

只要有Java基础,就可入门大数据,掌握Hadoop开发的核心技能
涵盖HDFS 、YARN 、MapReduce的搭建及框架的应用
第一时间收获企业大数据的真技术,了解Hadoop 3.x 的新特性

... 已有2221同学加入学习
加购物车 立即学习

大数据相关文章

手记文章

TiKV 高性能追踪的实现解析

本文为 PingCAP Observability 团队研发工程师钟镇炽在 Rust China Conf 2020 大会上所做演讲 《高性能 Rust tracing 库设计》的详细文本,介绍了对性能要求非常苛刻的分布式 KV 数据库 TiKV 如何以不到 5% 的性能影响实现所有请求的耗时追踪。 背景 系统的可观测性 (Observability) 通常由三个维度组成:日志 (Logging)、指标 (Metrics) 和追踪 (Tracing),它们之间的关系如下: 日志:离散的错误信息和状态信息。 指标:记录和呈现可聚合的数据。 追踪:单个请求

浏览2456推荐2
手记文章

基于 AWS 的一站式分布式数据库测试体系,简单易上手|TiDB Hackathon 2020 优秀项目分享

近日,由 TiDB 社区主办,专属于全球开发者与技术爱好者的顶级挑战赛事——TiDB Hackathon 2020 比赛圆满落幕。今年是 TiDB Hackathon 第四次举办,参赛队伍规模创历届之最,共有 45 支来自全球各地的队伍报名,首次实现全球联动。经过 2 天时间的极限挑战, 大赛涌现出不少令人激动的项目。为了让更多朋友了解这些参赛团队背后的故事, 我们将开启 TiDB Hackathon 2020 优秀项目分享系列。 Ti-Improve 作为截止报名前 1 小时才临时组建的团队,4 位同学周强、方祝和、赵

浏览495推荐0
手记文章

TiDB 5.0 RC Release Notes

TiDB 5.0.0-rc 版本是 5.0 版本的前序版本。在 5.0 版本中,我们专注于帮助企业基于 TiDB 数据库快速构建应用程序,使企业在构建过程中无需担心数据库的性能、性能抖动、安全、高可用、容灾、SQL 语句的性能问题排查等问题。 在 TiDB 5.0 版本中,你可以获得以下关键特性: 开启聚簇索引功能,提升数据库的性能。例如:TPC-C tpmC 测试下的性能提升了 39%。 开启异步提交事务功能,降低写入数据的延迟。例如:Sysbench oltp-insert 测试中延迟降低了 37.3%。 通过提升优化

浏览1197推荐0
手记文章

云原生数据库设计新思路

本文作者为 PingCAP 联合创始人兼 CTO 黄东旭,将分享分布式数据库的发展趋势以及云原生数据库设计的新思路。 在讲新的思路之前,先为过去没有关注过数据库技术的朋友们做一个简单的历史回顾,接下来会谈谈未来的数据库领域,在云原生数据库设计方面的新趋势和前沿思考。首先来看看一些主流数据库的设计模式。 常见的分布式数据库流派 分布式数据库的发展历程,我按照年代进行了分类,到目前为止分成了四代。第一代是基于简单的分库分表或者中间件来做 Data Sharding 和 水平扩展。第

浏览871推荐0
手记文章

TiKV + Flink = 最佳人气流批一体库|TiDB Hackathon 2020 优秀项目分享

近日,由 TiDB 社区主办,专属于全球开发者与技术爱好者的顶级挑战赛事——TiDB Hackathon 2020 比赛圆满落幕。今年是 TiDB Hackathon 第四次举办,参赛队伍规模创历届之最,共有 45 支来自全球各地的队伍报名,首次实现全球联动。经过 2 天时间的极限挑战, 大赛涌现出不少令人激动的项目。为了让更多小伙伴了解这些参赛团队背后的故事, 我们开启了 TiDB Hackathon 2020 优秀项目分享系列,本篇文章将介绍 TiFlink 团队赛前幕后的精彩故事。 Flink 是一个低延迟、高吞吐

浏览914推荐0
手记文章

陆金所金融核心场景数据库的去 O 之路

作者介绍:万霁春,陆金所数据架构 DBA 团队经理。 金融行业该如何在线替换金融核心场景数据库?在 TUG 陆金所企业行活动中,来自陆金所的数据架构 DBA 团队经理万霁春老师分享了陆金所的去 O 之路,以下内容整理自当天活动分享实录。 陆金所全站去 O  成果 陆金所全站去 O 项目从 2018 年中开始,整个项目迁移过程中没有做任何的服务降级,在不影响线上业务的情况下,把全站 100% 的数据库从 Oracle 无缝迁移到开源和国产数据库上,其中包括:MySQL、 TiDB 及其他开源数

浏览537推荐0
手记文章

「我的工作是制造混沌」,我与 Chaos Mesh® 的故事

作者:殷成文,Maintainer of Chaos Mesh 这段时间北京真是冷得可怕,朋友圈晒出各种零下 20 度的照片,在这样一个寒冷的时候,总是想给自己找点温暖的事情去做。这几天闲时就回顾起自己从实习到现在这段时间的经历,前不久是 Chaos Mesh 开源一周年(2020.12.31),于是就将自己与 Chaos Mesh 一起成长的点滴整理出来和大家分享。 一方面为了庆祝,另一方面也希望能够在这个寒冷的冬天给大家带来点温暖。 与 PingCAP 结缘 开始 Chaos Mesh 故事之前,先说点自己和 PingCAP

浏览774推荐0
手记文章

TiDB 常⻅架构应⽤场景

作者介绍:黄潇 , TUG 北京区 Leader ,TUG 2020 年度 MOA。 如今分布式数据库百花齐放,在做数据库架构选型时应该从哪些方面进行考虑?在 TUG 陆金所企业行活动上, TUG 北京区 Leader 黄潇分享了 TiDB 的常见架构应用场景,以下内容整理自当天活动分享实录。 本文主要分为以下三部分: 当今分布式数据库产品呈现百花⻬放的状态 在这种场景下数据库架构选型的一些思考 TiDB 常⻅应⽤场景 分布式数据库产品百花⻬放 从墨天轮发布的国产数据库流行度排行榜中可以看到,T

浏览614推荐0

大数据相关问答

相关猿问

excel 宏编写是属于什么?语法有谁有教程吗?

最赞的回答

<...图片...>属于excel vba

相关猿问

json解析 python

最赞的回答

<...code...>

相关猿问

网站的图片资源如何快速访问

最赞的回答

采用中间件压缩机制啊

相关猿问

大数据的意义何在

最赞的回答

相关猿问

大数据,云计算

最赞的回答

大数据可以理解为从各个来源产生的PB甚至EB级别以上的数据,这些数据假如用单机进行处理,那么尽管算法优化的很好,那么运算起来这个时间也是非常大的,所以目前有两种处理方式:第一种是使用超级计算机,高配置,高性能,多核心的大型计算机这样可以提高运算速度但是成本很高,一般企业是很难实现的;第二种就是利用多个计算机搭建一个集群,将数据分块分层进行分布式的处理,这样的话PB级的数据被多个节点分散的进行计算,发挥网络的计算调度,能将处理速度提高很多倍,并且集群有很高的容错性,一台节点故障并不影响集群的运行,所以甚至可以使用廉价的台式机部署,发挥出高可用性,当处理出现瓶颈的时候,增加几个集群节点可以有效的解...

相关猿问

数据分析需要学哪些语言呢?

最赞的回答

Python 比较好,科学计算,数学,大数据,爬虫都还可以,如果一点代码都没学过,就学Python

相关猿问

为什么慕课网没有关于易语言的课程?

最赞的回答

个人看法,可能易语言目前还不是主流,存在很多问题,因为计算机硬件和编程语言都是老外发明的,所以对于编程语言的简洁性,用英语最合适不过,如果未来中国有了自己研发的芯片等核心技术,那么中文编程应该会成为主流吧。。。

相关猿问

慕课为什么没有网络类的课程

最赞的回答

linux 网络管理

相关猿问

在做软件测试的时候,用到Python的测试软件有些什么,求大神解答

最赞的回答

selenium2自动化基于Python语言的测试实战

大数据技术与实践训练营

一站式学习,入门大数据领域,搞定大数据开发技术;把握行业红利,赢得更多的工作机会!

查看详情

高效求职全攻略

巧过经验关丨面试杀手锏丨求职通关技

查看详情

掌握核心算法 挑战寒冬高薪

从基础出发,强化算法知识,飞速提升学习效率!

查看详情