作者針對大數(shù)據(jù)問題,分析如何進(jìn)行大數(shù)據(jù)的導(dǎo)入,如何使用大數(shù)據(jù)工具進(jìn)行快速的數(shù)據(jù)預(yù)處理,以及如何構(gòu)建數(shù)據(jù)倉庫。詳細(xì)講解了Kettle工具的使用、數(shù)據(jù)集成、Kettle作業(yè)項設(shè)計等。
本書是一本系統(tǒng)介紹大數(shù)據(jù)可視化技術(shù)的圖書。書中首先闡述了大數(shù)據(jù)的可視化技術(shù)的基本概念以及相關(guān)的基礎(chǔ)理論知識,然后采用理論與實踐相結(jié)合的方式,針對實際應(yīng)用中的各種不同類型的數(shù)據(jù),包括時間數(shù)據(jù),比例數(shù)據(jù),關(guān)系數(shù)據(jù),文本數(shù)據(jù),復(fù)雜數(shù)據(jù),介紹相應(yīng)的可視化理論和操作方法,最后,介紹了數(shù)據(jù)可視化在各個領(lǐng)域中的應(yīng)用。 本書實例豐富,
本書詳細(xì)討論大數(shù)據(jù)管理技術(shù)的各個分支及其實現(xiàn)技術(shù),包括大數(shù)據(jù)建模技術(shù)、大數(shù)據(jù)存儲和索引技術(shù)、大數(shù)據(jù)查詢處理技術(shù)、大數(shù)據(jù)事務(wù)處理技術(shù)和大數(shù)據(jù)總線技術(shù),并在此基礎(chǔ)上,對大數(shù)據(jù)應(yīng)用系統(tǒng)進(jìn)行了全面分析。本書面向大數(shù)據(jù)應(yīng)用的開發(fā)人員、大數(shù)據(jù)管理系統(tǒng)的開發(fā)人員以及大數(shù)據(jù)管理技術(shù)的研究人員,也適用于高等院校相關(guān)專業(yè)師生學(xué)習(xí)。
全書共分為五大部分,*部分介紹了實時數(shù)據(jù)流和聚類方法的背景,包括實時數(shù)據(jù)流的特點、進(jìn)行數(shù)據(jù)分析的技術(shù)以及研究現(xiàn)狀。第二部分詳細(xì)講解了聚類方法中的簡單聚類,包括基于衰減窗口與剪枝維度樹的數(shù)據(jù)流聚類和實時數(shù)據(jù)流動態(tài)模式發(fā)現(xiàn)與跟蹤方法,以及相關(guān)實驗證明等內(nèi)容。第三部分詳細(xì)闡述了增量聚類技術(shù),包括什么是增量聚類、網(wǎng)格劃分策略,
《大數(shù)據(jù)技術(shù)及其背景下的數(shù)據(jù)挖掘研究》圍繞大數(shù)據(jù)背景下的數(shù)據(jù)挖掘及應(yīng)用問題,從大數(shù)據(jù)挖掘的基本概念入手,系統(tǒng)地闡述了大數(shù)據(jù)的基礎(chǔ)理論、大數(shù)據(jù)處理架構(gòu)Hadoop以及大數(shù)據(jù)存儲與管理研究;由淺入深地論述了數(shù)據(jù)挖掘的基礎(chǔ)理論、大數(shù)據(jù)挖掘技術(shù)研究、數(shù)據(jù)挖掘的藝術(shù),并結(jié)合實踐,闡述了數(shù)據(jù)挖掘的應(yīng)用!洞髷(shù)據(jù)技術(shù)及其背景下的數(shù)據(jù)
決策問題中存在大量的冗余信息,而且很多信息都具有不確定性,面對這些雜亂無章的海量數(shù)據(jù),決策者需花費大量時間分析,以至于可能錯失決策良機(jī),因此研究具有不確定性的決策問題中冗余信息約簡是決策者亟待解決的關(guān)鍵問題。目前軟集合方法能夠較好地處理不確定決策問題,但軟集合約簡方法目前還不完善,致使對海量數(shù)據(jù)很難做出決策。本書主要以
隨著計算機(jī)和互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展和廣泛普及,互聯(lián)網(wǎng)已經(jīng)成為人類獲取知識的最大平臺。在爬取了Web網(wǎng)頁語料后,需要通過數(shù)據(jù)預(yù)處理和數(shù)據(jù)分析來獲取數(shù)據(jù)的價值,從而造福人類,推動社會發(fā)展。本書主要是Web大數(shù)據(jù)預(yù)處理和數(shù)據(jù)分析的實戰(zhàn)指南,內(nèi)容包括三部分:基礎(chǔ)知識、基于Python的數(shù)據(jù)預(yù)處理、基于Python的數(shù)據(jù)分析
本書從多個數(shù)據(jù)項目實例出發(fā),介紹爬蟲、反爬蟲的各種案例,使讀者了解到數(shù)據(jù)抓取和分析的完整過程。書中案例的難度由淺入深,以作者原創(chuàng)的代碼為主,不借助現(xiàn)成的框架,強(qiáng)調(diào)在數(shù)據(jù)采集過程中的發(fā)散思維,總結(jié)攻克反爬蟲的思維模式,實現(xiàn)以低成本的方式得到想要的數(shù)據(jù)的愿望。最后,用一個“愛飛狗”的例子,為讀者展示如何從0到1地開發(fā)一個大
本書的主要內(nèi)容是非線性自抗擾控制的設(shè)計與理論分析.自抗擾控制是一項在線估計并補(bǔ)償不確定性因素的控制技術(shù),由三個主要部分構(gòu)成,分別是跟蹤微分器、擴(kuò)張狀態(tài)觀測器以及基于前兩者的反饋控制器.本書較為詳細(xì)地論述了非線性跟蹤微分器、非線性擴(kuò)張狀態(tài)觀測器的設(shè)計與收斂性,以及基于跟蹤微分器與擴(kuò)張狀態(tài)觀測器的不確定性因素補(bǔ)償控制器——
《數(shù)控技術(shù)》堅持“理論先進(jìn),注重實踐,操作性強(qiáng),學(xué)以致用”的原則精選內(nèi)容,較全面、深入淺出地介紹了數(shù)控技術(shù)的相關(guān)知識。全書共分8章,前言、數(shù)控技術(shù)概述、數(shù)控加工的工藝分析與程序編制、自動編程基礎(chǔ)、數(shù)控系統(tǒng)的插補(bǔ)原理、計算機(jī)數(shù)控裝置、數(shù)控機(jī)床的伺服系統(tǒng)、數(shù)控機(jī)床的位置檢測裝置、數(shù)控機(jī)床的PLC控制。教材內(nèi)容面向工程實際,