《Hadoop实战第2版》——1.6节Hadoop数据管理

  • 时间:
  • 浏览:0
  • 来源:uu快3和值_uu快3app_计划师

1.6.1 HDFS的数据管理

HDFS是分布式计算的存储基石,Hadoop分布式文件系统和其他分布式文件系统有就说类式的特征:

对于整个集群有单一的命名空间;

具有数据一致性,都适合一次写入多次读取的模型,客户端在文件这样被成功创建完后 是无法看到文件所处的;

文件会被分割成多个文件块,每个文件块被分配存储到数据节点上,因此会根据配置由克隆qq好友好友文件块来保证数据的安全性。

通过前面的介绍和图1-3时需看出,HDFS通过另三个重要的角色来进行文件系统的管理:NameNode、DataNode和Client。NameNode可

1.6 Hadoop数据管理

前面重点介绍了Hadoop及其体系特征与计算模型MapReduce,现在始于英文介绍Hadoop的数据管理,主要包括Hadoop的分布式文件系统HDFS、分布式数据库HBase和数据仓库工具Hive。