当前标签: Hadoop
万亿数据下Hadoop的核心竞争力
1.前言 在大数据时代,Hadoop有着得天独厚的优势。然而,每个企业的技术储备和需求特点不同,他们希望从海量的客户数据中挖掘真正的商业价值,像Google、Facebook、Twitter等这样的企业更是Hadoop的最早获益者。那么,今天我们就来聊一聊,万亿数据下Hadoop的核心竞争力。 2.什么是Had...
2019-06-17 09:19
阅读(181)
大数据框架认知Hadoop的五大误区
ApacheHadoop助力企业应对他们最艰难的挑战之一——利用海量数据创造价值。用户普遍部署Hadoop框架,是因为它能够帮助企业从各种不同类型的大数据中获得价值。独立分析机构ForresterResearch公司发布的《Forrester浪潮大数据Hadoop解决方案》(2014年一季度版)报告显示,Hadoo...
2019-06-11 22:00
阅读(175)
【Hadoop】开发插件安装
前言 Eclipse 是一个开放源代码的、基于 Java 的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是Eclipse 附带了一个标准的插件集,包括 Java 开发工具(Java Development Tools,JDT)。 Eclipse的插件机制是轻型软...
2019-06-11 20:33
阅读(222)
【Hadoop】Shell基本操作
主要内容: 1.学习在开启、关闭Hadoop 2.学习在Hadoop中创建、修改、查看、删除文件夹及文件 3.学习改变文件的权限及文件的拥有者 4.学习使用shell命令提交job任务 5.Hadoop安全模式的进入与退出 1.打开终端模拟器,切换到/apps/hadoop/sbin目录下,启动Hadoo...
2019-06-11 20:24
阅读(200)
要研究大数据,你必须得知道Hadoop
工欲善其事,必先利其器。像大数据这种多维度、高复杂度的东西,必须要有良好的平台来支撑。 Hadoop是什么? Hadoop是一种分析和处理大数据的软件平台,是Appach的一个用Java语言所实现的开源软件的加框,在大量计算机组成的集群当中实现了对于海量的数据进行的分布式计算。 Hadoop的框架最核心的设计...
2019-06-10 21:59
阅读(164)
Hadoop架构概述
<>HDFS架构概述 HDFS(Hadoop Distributed File System)的架构概述 * NameNode(nn):存储文件的元数据,如文件名、文件目录结构、文件属性(生成时间、副本数、文件权限),以及每个文件的块列表和块所在的DataNode等。 * DataNode(dn):在本...
2019-06-06 14:47
阅读(195)
Hadoop集群运维
<>Hadoop集群运维 <>场景1:namenode节点故障,active namenode节点状态切换?如何恢复? <>1.1 Hadoop HA 的namenode状态切换 * 模拟线上环境测试,namenode进程down掉一个后,active和standby状态名称节点切换正常。 namen...
2019-06-06 12:15
阅读(232)
概念普及-云计算 大数据 Hadoop BI
普及一些高大上的概念 <>一、云计算 云计算的概念最早是 2006 年由 Google 提出的。 <>1、云计算定义 * 云计算是一种可以通过网络方便地接入共享资源池,按需获取计算资源的服务模型。 * 资源包括:网络、服务器、存储、应用、服务等 * 共享资源池中的资源可以通过较少的管理代价和简单...
2019-05-21 20:46
阅读(170)