0人評分過此書
似乎所有人嘴邊都掛著「大數據」這個詞。圍繞大數據這個主題開展的討論幾乎已經完全壓倒了傳統數據倉庫的風頭。某些大數據狂熱者甚至大膽預測,在不久的將來,所有企業數據都將由一個基於Apache Hadoop的系統託管,企業數據倉庫(EDW)終將消亡。無論如何,傳統數據倉庫架構仍在不斷發展演化,這一點不容置疑。一年來,我一直在撰寫相關的文章和部落格,但它真的會消亡嗎?我認為機率很小。實際上,儘管所有人都在討論某種技術或者架構可能會勝過另一種技術或架構,但IBM有著不同的觀點。在IBM,他們更傾向於從「Hadoop與數據倉庫密切結合」這個角度來探討問題,兩者可以說是天作之合。
本書透過簡單而完整的示例,論述了在Hadoop平台上設計和實現數據倉庫的方法。將傳統數據倉庫建模與SQL開發的簡單性與大數據技術相結合,快速、高效地建立可擴展的數據倉庫及其應用系統。
本書共13章,主要內容包括數據倉庫、Hadoop及其生態圈的相關概念,使用Sqoop從關係資料庫全量或增量抽取數據,使用Hive進行數據轉換和裝載處理,使用Oozie調度作業週期性執行,使用Impala進行快速聯機數據分析,使用Hue將數據可視化,以及數據倉庫中的漸變維(SCD)、代理鍵、角色扮演維度、層次維度、退化維度、無事實的事實表、遲到的事實、累積的度量等常見問題在Hadoop上的處理等。
本書適合資料庫管理員、大數據技術人員、Hadoop技術人員、數據倉庫技術人員,也適合高等院校和培訓學校相關專業的師生教學參考。
本書透過簡單而完整的示例,論述了在Hadoop平台上設計和實現數據倉庫的方法。將傳統數據倉庫建模與SQL開發的簡單性與大數據技術相結合,快速、高效地建立可擴展的數據倉庫及其應用系統。
本書共13章,主要內容包括數據倉庫、Hadoop及其生態圈的相關概念,使用Sqoop從關係資料庫全量或增量抽取數據,使用Hive進行數據轉換和裝載處理,使用Oozie調度作業週期性執行,使用Impala進行快速聯機數據分析,使用Hue將數據可視化,以及數據倉庫中的漸變維(SCD)、代理鍵、角色扮演維度、層次維度、退化維度、無事實的事實表、遲到的事實、累積的度量等常見問題在Hadoop上的處理等。
本書適合資料庫管理員、大數據技術人員、Hadoop技術人員、數據倉庫技術人員,也適合高等院校和培訓學校相關專業的師生教學參考。
- 出版地 : 臺灣
- 語言 : 繁體中文
評分與評論
請登入後再留言與評分