CGFT大數(shù)據(jù)原理中Hadoop的內(nèi)容有哪些?《大數(shù)據(jù)原理及應(yīng)用》作為基礎(chǔ)學科中的一門關(guān)鍵學科,學員們要充分理解其中的內(nèi)容,這樣才能夠更深刻的進行學習。

Hadoop是Apache軟件基金會旗下的一個開源分布式計算平臺,為用戶提供了系統(tǒng)底層細節(jié)透明的分布式基礎(chǔ)架構(gòu)。Hadoop是基于Java語言開發(fā)的,具有很好的跨平臺特性,并可以部署在廉價的計算機集群中。Hadoop的核心是分布式文件系統(tǒng)和MapRaduce。

CGFT

Hadoop是一個能夠?qū)Υ罅繑?shù)據(jù)進行分布式處理的軟件框架,并且是以一種可靠、高效、可伸縮的方式進行處理的,具有高可靠性、高效性、高擴展性、高容錯性、成本低、運行在Linux平臺上,同時具有支持多種編程語言的特點。

Hadoop 的項目結(jié)構(gòu)

經(jīng)過多年的發(fā)展,Hadoop項目不斷完善和成熟,目前已經(jīng)包含多個子項目。除核心的HDFS和MapReduce以外,Hadoop項目還包括Common、Avro、Zookeeper,HBase、E Chukwa、Pig等子項目,它們提供了互補性服務(wù)或在核心層上提供了更高層的服務(wù)。