为了账号安全,请及时绑定邮箱和手机立即绑定

常用的大数据分析软件有哪些?

/ 猿问

常用的大数据分析软件有哪些?

哔哔one 2019-02-07 11:07:37

常用的大数据分析软件有哪些?


查看完整描述

2 回答

?
慕函数4003404

MongoDB是最受欢迎的大数据数据库,因为它适用于管理经常变化的数据:非结构化数据,大数据常常是非结构化数据

查看完整回答
反对 回复 2019-03-09
?
慕运维1137616

1. Cloudera
实际上是增加了一些额外服务的Hadoop,你会需要它,因为大数据不容易搞。Cloudera的服务团队不仅可以帮助你构建大数据集群,还可以帮助培训你的员工,更好地访问数据。
2. MongoDB
MongoDB是最受欢迎的大数据数据库,因为它适用于管理经常变化的数据:非结构化数据,大数据常常是非结构化数据。
3. Talend
作为一家提供广泛解决方案的公司,Talend的产品围绕其集成平台而建,该平台集大数据、云、应用程序、实时数据集成、数据准备和主数据管理于一体。

图1:Talend大数据集成平台包括数据质量和治理功能
二、大数据工具:数据清理
在你真正处理数据以获取洞察力之前,需要清理和转换数据,转换成可远程搜索的内容。大数据集往往是非结构化、无组织的,因此需要某种清理或转换。
当下,数据可能来自任何地方:移动、物联网和社交媒体,数据清理显得更为必要。并非所有这些数据都可以轻松“清理”以获得洞察力,因此优秀的数据清理工具极其重要。实际上,在未来几年,预计经过有效清理的数据会是可接受的大数据系统与真正出色的大数据系统之间的竞争优势。
4. OpenRefine
OpenRefine是一款易于使用的开源工具,通过删除重复项、空白字段及??其他错误来清理凌乱的数据。它是开源的,但有一个相当大的社区可提供帮助。
5. DataCleaner
与OpenRefine一样,DataCleaner可将半结构化数据集转换成数据可视化工具可以读取的干净可读的数据集。该公司还提供数据仓库和数据管理服务。
6. 微软Excel
说真的,Excel有其用途。你可以从各种数据源导入数据。Excel在手动数据输入和复制/粘贴操作方面特别有用。它能消除重复项,查找和替换内容,检查拼写,还有用于转换数据的许多公式。但Excel很快陷入困境,不适合庞大数据集。
三、大数据工具:数据挖掘
一旦数据经过清理和准备,你可以通过数据挖掘开始搜索数据了。这时你执行这个实际的过程:发现数据、做出决定和进行预测。
数据挖掘是大数据流程的真正核心。数据挖掘解决方案通常底层很复杂,但竭力提供 一种外观漂亮、对用户友好的用户界面,说起来容易做起来难。数据挖掘工具面临的另一个挑战是:它们确实需要人来编制查询,所以数据挖掘工具的好坏取决于使用它的专业人员。
7. RapidMiner
Rapi



查看完整回答
反对 回复 2019-03-09
  • 2 回答
  • 0 关注
  • 230 浏览
我要回答

添加回答

回复

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信