CGFT大數據原理中Hadoop的內容有哪些?《大數據原理及應用》作為基礎學科中的一門關鍵學科,學員們要充分理解其中的內容,這樣才能夠更深刻的進行學習。
Hadoop是Apache軟件基金會旗下的一個開源分布式計算平臺,為用戶提供了系統(tǒng)底層細節(jié)透明的分布式基礎架構。Hadoop是基于Java語言開發(fā)的,具有很好的跨平臺特性,并可以部署在廉價的計算機集群中。Hadoop的核心是分布式文件系統(tǒng)和MapRaduce。
Hadoop是一個能夠對大量數據進行分布式處理的軟件框架,并且是以一種可靠、高效、可伸縮的方式進行處理的,具有高可靠性、高效性、高擴展性、高容錯性、成本低、運行在Linux平臺上,同時具有支持多種編程語言的特點。
Hadoop 的項目結構
經過多年的發(fā)展,Hadoop項目不斷完善和成熟,目前已經包含多個子項目。除核心的HDFS和MapReduce以外,Hadoop項目還包括Common、Avro、Zookeeper,HBase、E Chukwa、Pig等子項目,它們提供了互補性服務或在核心層上提供了更高層的服務。