为了账号安全,请及时绑定邮箱和手机立即绑定

大数据

通过2-3-4树理解红黑树 原创

前言 红黑树是数据结构中比较复杂的一种,最近与它交集颇多,于是花了一周的空闲时间跟它死磕,终于弄明白并实现了红黑树。写文总结一下,希望能给试图理解红黑树的同学一些灵感,也让我能记得更深刻。 在研究红黑树时吃了不少苦头,原因有二: 红黑树的插入和删除非常复杂,很多人并没有理解或完全实现,或实现了的没有任何注释,让人很难参考; 网络上红黑树的理解方式较为单一,一般是 双黑、caseN法,而插入和删除的...

3407浏览 5推荐 0评论

使用PostgreSQL进行中文全文检索 原创

前言 PostgreSQL 被称为是“最高级的开源数据库”,它的数据类型非常丰富,用它来解决一些比较偏门的需求非常适合。 前些天将 POI 点关键词查询的功能迁到了 PgSQL,总算对前文 空间索引 - 各数据库空间索引使用报告 有了一个交代。 由于 PgSQL 国内的资料较少,迁移过程踩了不少坑,这里总结记录一下,帮助后来的同学能顺利使用 PgSQL。而且目前在灰度测试刚...

129浏览 1推荐 0评论

大数据基础--Linux入门

Linux学习 一、Linux系统安装 1、虚拟机 (1)VMware是一个虚拟PC的软件,可在现有的操作系统上虚拟出一个新的硬件环境,以此来实现在一台机器上真正同时运行两个独立的操作系统。 (2)VMware主要特点: 不需要分区或重新开机就能在同一台PC上使用两种以上的操作系统; 本机系统可以和虚拟机系统网络通信; 可设定并随时修改虚拟机操作系统的硬件环境。 (3)建议的VMware配置 CP...

450浏览 7推荐 2评论

hadoop-1.2.1的安装问题

1.修改文件内容:出现隐藏文件:.swp、.swo等,导致修改不了 解决方法:rm - f 文件名;删除隐藏文件 2.启动hadoop时,出现文件无法创建 解决方法:chown -R millet:millet hadoop-1.2.1/;添加权限 3.localhost: ssh: connect to host localhost port 22: Connection refused 解决方...

134浏览 2推荐 0评论

搜索:ElasticSearch OR MySQL? 原创

背景 我们开发一般的企业级Web应用,其实从本质上来说,都是对数据的增删查改进行各个维度的包装。所以说,不管你的程序如何开发,基本上,都离不开数据本身。那么,在开发企业级应用的过程中,很多同学一定遇到过这样的困惑,当完成了应用程序的基本增删查改功能之后,用户会经常吐槽当下的查询功能并不能满足自己的查询需求。这是因为,通常情况下,我们基于传统的数据库进行开发,都是需要预先去进行各种方面的考虑,然后再...

18313浏览 28推荐 4评论

AliOS Things异步事件框架Yloop

Yloop概要 Yloop是AliOS Things的异步事件框架。Yloop借鉴了,libuv及嵌入式业界常见的event loop,综合考虑使用复杂性,性能,及footprint,实现了一个适合于MCU的事件调度机制。 Yloop上下文 每个Yloop实例(aos_loop_t)与特定的任务上下文绑定,AliOS Things的程序入口application_start所在的上下文与系统的主Y...

126浏览 1推荐 0评论

大数据:Hadoop新手入门 原创

大数据:Hadoop入门 一:什么是大数据 1. 什么是大数据: (1.)大数据是指在一定时间内无法用常规软件对其内容进行抓取,管理和处理的数据集合,简而言之就是数据量非常大,大到无法用常规工具进行处理,如关系型数据库,数据仓库等。这里“大”是一个什么量级呢?如在阿里巴巴每天处理数据达到20PB(即20971520GB). 2.大数据的特点: (1.)体量巨大。按目前的发展...

1417浏览 6推荐 0评论

MaxCompute复杂数据分布的查询优化实践

摘要: 2017年中国大数据技术大会于12月7-9日在北京新云南皇冠假日酒店隆重举行, 大会就大数据时代社会各行业的智能化进程和行业实践展开深入讨论。 在12月8日的“大数据分析与生态系统”分论坛上,来自阿里巴巴计算平台事业部的高级技术专家少杰,以“MaxCompute 复杂数据分布的查询优化实践”为题,为现场来宾分享了阿里云MaxCompute最新...

182浏览 1推荐 0评论

太原,这是我曾经和现在居住的城市,记录一个前端仔的三年。 原创

前言 这篇文章写给准备踏入互联网的萌新,写给从培训出来之后回到二三线城市的童鞋,也写给在太原切图三年的自己,致敬这三年,致敬太原。 接下来,正文从这开始~ 2011年,太原火车站前交通混乱不堪,此时我误打误撞进了编程培训班,一学就是两年。 2013年,培训班毕业出来,从太原火车站,踏上了去杭州求职的绿皮火车。 2014年,我离开了工作一年的杭州。 2015年,我已回来太原coding一年,火车站已...

899浏览 15推荐 7评论

分布式监控系统Zabbix3.2跳坑指南 原创

zabbix是什么在此就不多作介绍了,可以参考之前的文章 零代码如何打造自己的实时监控预警系统 ,这篇主要介绍安装及注意事项。 主要分为服务端和客户端安装,客户端又分为Linux、Windows。 服务端安装环境 CentOS6.8 Zabbix3.2 Mysql5.6 Apache PHP56w 环境准备 关闭selinux setenforce 0 进入mysql,创建zabbix用户并授权 ...

1066浏览 17推荐 3评论

hadoop-1.2.1安装遇到过的问题(个人)

网上关于hadoop安装的教程很多,按照教程说明一步步安装问题不大。 我碰到的问题主要是jdk的不适配,一开始是下载的jdk是arm框架下的压缩包,解压开是乱码。然后换,但第二次还是出错,因为我在oracle官网没找到jdk7.0的下载链接,图方便找了最新9.0的,安装jdk是没有半点问题的,但配置完hadoop后,start-all.sh之后只能出现显示后台java程序只有jps和tasktra...

185浏览 1推荐 0评论

Hadoop入门教程之HDFS架构 原创

为什么要用Hadoop? 1.源码开源 2.社区活跃,参与者很多 3.涉及到分布式存储和计算的方方面面: Flume进行数据采集 Spark/MR/Hive等进行数据处理 HDFS/HBase进行数据存储 4.已经得到企业界的验证 Hadoop相关网址: Hadoop: hadoop.apache.org Hive: hive.apache.org Spark: spark.apache.org ...

1869浏览 11推荐 1评论

Hadoop入门教程之分布式计算框架MapReduce 原创

说明 这个技术在如今,有一定的使用场景,但是使用场景已经不多,仅当做了解就可以了。因为现在的Spark比MapReduce强太多了,所以学习的重心应当放在Spark上面。 什么是MapReduce? 源自于Google的MapReduce论文 实际上HBase也是源自于Google的论文 发表于2004年12月,Hadoop MapReduce是Google MapReduce的克隆版 MapRe...

425浏览 5推荐 0评论

使用jsoup和httpClient爬取慕课网的课程信息 原创

最近人工智能,大数据,机器学习可谓火的一塌糊涂,不懂点AI出门都不好意思和别人打招呼,而人工智能的基础是海量的数据,而爬虫是获取互联网数据的一把利器,最近正好在学习爬虫,就用jsoup+httpClient写了一个爬取慕课网java课程信息的爬虫,希望能帮助到有需要的小伙伴。 什么是jsoup 根据百度百科 jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。...

684浏览 9推荐 2评论

分布式唯一ID极简教程

一,题记 所有的业务系统,都有生成ID的需求,如订单id,商品id,文章ID等。这个ID会是数据库中的唯一主键,在它上面会建立聚集索引! 阅读本文,建议大家已经掌握了扎实的互联网技术,可参考:互联网技术清单 ID生成的核心需求有两点: 全局唯一 趋势有序 二,为什么要全局唯一? 著名的例子就是身份证号码,身份证号码确实是对人唯一的,然而一个人是可以办理多个身份证的,例如你身份证丢了,又重新补办了一...

535浏览 5推荐 1评论
首页上一页1234567下一页尾页

热门手记

意见反馈 常见问题 APP下载
官方微信