CGFT大數(shù)據(jù),HBase與傳統(tǒng)關(guān)系數(shù)據(jù)庫的對比分析

CGFT大數(shù)據(jù)中,HBase與傳統(tǒng)關(guān)系數(shù)據(jù)庫是緊密相連的。下文是對兩者的對比分析介紹,一起看看吧!

關(guān)系數(shù)據(jù)庫發(fā)展到今天,已經(jīng)是一種成熟穩(wěn)定的數(shù)據(jù)庫管理系統(tǒng),通常具備的功能包括面向磁盤的存儲(chǔ)和索引結(jié)構(gòu)、多線程訪問、基于鎖的同步訪問機(jī)制、基于日志記錄的恢復(fù)機(jī)制和事務(wù)機(jī)制等。

HBase與傳統(tǒng)的關(guān)系數(shù)據(jù)庫的區(qū)別主要體現(xiàn)在以下幾個(gè)方面:

1. 數(shù)據(jù)類型

關(guān)系數(shù)據(jù)庫采用關(guān)系模型,具有豐富的數(shù)據(jù)類型和存儲(chǔ)方式,HBase則采用了更加簡單的數(shù)據(jù)模型。

2. 數(shù)據(jù)操作

關(guān)系數(shù)據(jù)庫中包含了豐富的操作,如插入、刪除、更新、查詢等,其中會(huì)涉及復(fù)雜的多表連接,通常是借助于多個(gè)表之間的主外鍵關(guān)聯(lián)來實(shí)現(xiàn)的。

3. 存儲(chǔ)模式

關(guān)系數(shù)據(jù)庫是基于行模式存儲(chǔ)的,元祖或行會(huì)被連續(xù)地存儲(chǔ)在磁盤頁中。在去讀數(shù)據(jù)時(shí),需要順序掃描每個(gè)元祖,然后,曹總篩選出查詢所需要的屬性。

特許全球金融科技師CGFT一級(jí)

4. 數(shù)據(jù)索引

關(guān)系數(shù)據(jù)庫通??梢葬槍Σ煌袠?gòu)建復(fù)雜的多個(gè)索引,以提高數(shù)據(jù)訪問性能。與關(guān)系數(shù)據(jù)庫不同的是,HBase只有一個(gè)索引---行鍵,通過巧妙的設(shè)計(jì),HBase中的所有方位方法,或者通過行鍵訪問,或者通過行鍵掃描,從而使得整個(gè)系統(tǒng)不會(huì)慢下來。

5. 數(shù)據(jù)維護(hù)

在關(guān)系數(shù)據(jù)庫中,更新操作會(huì)用zui新的當(dāng)前值去替換記錄中原來的舊值,舊值被覆蓋后就不會(huì)存在。而在HBase中執(zhí)行更新操作時(shí),并不會(huì)刪除數(shù)據(jù)舊的版本,而是生成一個(gè)新的版本,舊有的版本仍然保留。

6. 可伸縮性

關(guān)系數(shù)據(jù)庫很難實(shí)現(xiàn)橫向擴(kuò)展,縱向擴(kuò)展的空間也比較有限,相反,HBase和bigtable這些分布式數(shù)據(jù)庫就是為了實(shí)現(xiàn)靈活的水平擴(kuò)展而開發(fā)的,能夠輕易地通過在冀全中增加或者減少硬件數(shù)量來實(shí)現(xiàn)性能的伸縮。

但是,相對于關(guān)系數(shù)據(jù)庫來說,HBase也有自身的局限性,如HBase不支持事務(wù),因此,無法實(shí)現(xiàn)跨行的原子性。