CGFT大數(shù)據(jù)原理中HBase與傳統(tǒng)關系數(shù)據(jù)庫的對比?

CGFT大數(shù)據(jù)原理中HBase與傳統(tǒng)關系數(shù)據(jù)庫的對比?關系數(shù)據(jù)庫從20世紀70年代發(fā)展到今天,已經(jīng)是一種*成熟穩(wěn)定的數(shù)據(jù)庫管理系統(tǒng),通常具備的功能包括面向磁盤的存儲和索引結構、多線程訪問、基于鎖的同步訪間機制、基于日志記錄的恢復機制和事務機制等。

HBase與傳統(tǒng)的關系數(shù)據(jù)庫的區(qū)別主要體現(xiàn)在以下幾個方面。

數(shù)據(jù)類型。

關系數(shù)據(jù)庫采用關系模型,具有豐富的數(shù)據(jù)類型和存儲方式,HBase則采用了更加簡單的數(shù)據(jù)模型,它把數(shù)據(jù)存儲為未經(jīng)解釋的字符串,用戶可以把不同格式的結構化數(shù)據(jù)和非結構化數(shù)據(jù)都序列化成字符率,保存到HBase中,用戶需要自己編寫程序把字將半解析成不同的數(shù)據(jù)類型。

存儲模式。

關系數(shù)據(jù)庫是基于行模式存儲的,元組或行會被連續(xù)地存儲在磁盤頁中。在讀取數(shù)據(jù)時、需要順序掃描每個元組、然后、從中篩選出查詢所需要的屬性。如果每個元組只有少量屬性的值對于查詢是有用的、那么基于行模式存儲就會浪費許多做做空間和內(nèi)存管寬。

數(shù)據(jù)索引。

關系數(shù)據(jù)庫通??梢葬槍Σ煌袠嫿◤碗s的多個索引,以提高數(shù)據(jù)訪問性能與關系數(shù)據(jù)庫不同的是,HBase只有一個索引——行鍵,通過巧妙的設計,HBase中的所有請問方法,或者通過行鍵訪問,或者通過行鍵掃描,從而使得整個系統(tǒng)不會慢下來,由于HBase位于Hadoop框架之上,因此,可以使用Hadoop MapReduce來快速,高效地生成索引表。

數(shù)據(jù)維護。

在關系數(shù)據(jù)庫中,更新操作會用*的當前值去替換記錄中原來的舊值,舊信被覆蓋后就不會存在。

可伸縮性。

關系數(shù)據(jù)庫很難實現(xiàn)橫向擴展,縱向擴展的空間電比較有限,相反,HBase和BigTable這些分布式數(shù)據(jù)庫就是為了實現(xiàn)靈活的水平擴展面開發(fā)的,能夠輕易地通過在集群中增加或者減少硬件數(shù)量來實現(xiàn)性能的伸縮。