Python數(shù)據(jù)分析與大數(shù)據(jù)處理從入門到精通 機(jī)器學(xué)習(xí)線性代數(shù)

Python數(shù)據(jù)分析與大數(shù)據(jù)處理從入門到精通 機(jī)器學(xué)習(xí)線性代數(shù)
作者: 朱春旭 著
出版時間:2019-10
頁數(shù):464
字?jǐn)?shù):718000
開本:16
ISBN:9787301307656
1家庭擁有
0條書評筆記
在小花生App為孩子
建立免費電子書房
寫書評

圖書介紹

《Python數(shù)據(jù)分析與大數(shù)據(jù)處理從入門到精通》主要講解數(shù)據(jù)分析與大數(shù)據(jù)處理所需的技術(shù)、基礎(chǔ)設(shè)施、核心概念、實施流程。從編程語言準(zhǔn)備、數(shù)據(jù)采集與清洗、數(shù)據(jù)分析與可視化,到大型數(shù)據(jù)的分布式存儲與分布式計算,貫穿了整個大數(shù)據(jù)項目開發(fā)流程。本書輕理論、重實踐,目的是讓讀者快速上手。1篇首先介紹了Python的基本語法、面向?qū)ο箝_發(fā)、模塊化設(shè)計等,掌握Python的編程方式。然后介紹了多線程、多進(jìn)程及其相互間的通信,讓讀者對分布式程序有個基本的認(rèn)識。第2篇介紹了網(wǎng)絡(luò)數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)存儲等技術(shù)。第3篇介紹了Python常用的數(shù)據(jù)分析工具,擴(kuò)展了更多的數(shù)據(jù)清洗、插值方法,為最終的數(shù)據(jù)可視化奠定基礎(chǔ)。第4篇是大數(shù)據(jù)分析的重點。首先介紹了Hadoop的框架原理、調(diào)度原理,MapReduce原理與編程模型、環(huán)境搭建,接著介紹了Spark框架原理、環(huán)境搭建方式,以及如何與Hive等第三方工具進(jìn)行交互,還介紹了新的結(jié)構(gòu)化流式處理技術(shù)。第5篇通過三個項目實例,綜合介紹了如何分析網(wǎng)頁、如何搭建分布式爬蟲、如何應(yīng)對常見的反爬蟲、如何設(shè)計數(shù)據(jù)模型、如何設(shè)計架構(gòu)模型、如何在實踐中綜合運用前四篇涉及的技術(shù)。本書既適合非計算機(jī)專業(yè)的編程“小白”,也適合剛畢業(yè)或即將畢業(yè)走向工作崗位的廣大畢業(yè)生,以及已經(jīng)有編程經(jīng)驗,但想轉(zhuǎn)行做大數(shù)據(jù)分析的專業(yè)人士。同時,還可以作為廣大職業(yè)院校、電腦培訓(xùn)班的教學(xué)參考用書。
還沒有花友書評,開始
誰家擁有這本書(來自小花生App)
16歲
4年前 放入書房