企業(yè)數(shù)據(jù)湖

企業(yè)數(shù)據(jù)湖
出版時間:2018-12
開本:16
ISBN:9787111615538
1家庭擁有
0條書評筆記
在小花生App為孩子
建立免費(fèi)電子書房
寫書評

圖書介紹

本書分為三個主要部分。*部分介紹了數(shù)據(jù)湖的概念、企業(yè)中數(shù)據(jù)湖泊的重要性,以及Lambda架構(gòu)的*新進(jìn)展。第二部分將深入研究使用Lambda架構(gòu)構(gòu)建數(shù)據(jù)湖的主要組件,介紹了一些流行的大數(shù)據(jù)技術(shù),如Apache Hadoop、Spark、Sqoop、Flume和彈性搜索。第三部分以實際操作的方式展示如何實現(xiàn)一個企業(yè)數(shù)據(jù)湖,并介紹了幾個實際的用例,而且展示了如何將其他外圍組件添加到湖中以提高效率。在本書的*后,讀者將能夠選擇正確的大數(shù)據(jù)技術(shù),使用lambda架構(gòu)模式來構(gòu)建企業(yè)數(shù)據(jù)湖。
通過閱讀本書,你將:
·使用大數(shù)據(jù)技術(shù)構(gòu)建企業(yè)級數(shù)據(jù)湖。
·掌握Lambda架構(gòu)的精髓,以及如何在企業(yè)內(nèi)使用它。
·學(xué)習(xí)與Apache Sqoop及其功能相關(guān)的技術(shù)細(xì)節(jié)。
·Kafka與Hadoop組件集成,用于獲取企業(yè)數(shù)據(jù)。
·使用Flume進(jìn)行流式數(shù)據(jù)處理。
·理解Flink與流式數(shù)據(jù)處理的關(guān)系。
·Hadoop生態(tài)圈組件的協(xié)同使用,以及它們能帶來的好處。
·使用Elastic Stack構(gòu)建快速、流式、高吞吐應(yīng)用。
·確保數(shù)據(jù)攝取處理在不同數(shù)據(jù)格式配置時的一致性。

所屬書單

還沒有花友書評,開始
誰家擁有這本書(來自小花生App)
8歲
4年前 放入書房