本書介紹基于Python語言的網(wǎng)絡數(shù)據(jù)采集技術的相關知識,并為采集網(wǎng)絡中的各種數(shù)據(jù)類型提供全面指導。第1章重點介紹Scrapy框架及配置方法;第2~6章重點介紹網(wǎng)絡數(shù)據(jù)采集的基本原理,包括如何利用Python從網(wǎng)絡服務器請求信息,如何對服務器的響應進行基本處理,以及如何通過自動化的手段與網(wǎng)站進行交互;第7、8章介紹登錄
本書為大數(shù)據(jù)時代下的產(chǎn)物,由淺入深地介紹大數(shù)據(jù)及其相關知識,在大數(shù)據(jù)的背景下著重介紹ETL數(shù)據(jù)處理技術,同時引入數(shù)據(jù)清洗的知識,理論與實際相結合,突出所長。在理論上,本書突出重點與難點,較為系統(tǒng)地介紹大數(shù)據(jù)的各項基本技術。在實踐操作上,本書貼近生活,切實理解,緊跟實驗進行,并從中萃取精華。同時本書還介紹ETL技術的主流
本書以常見的數(shù)據(jù)分析與大數(shù)據(jù)應用方法為主線,按照數(shù)據(jù)采集、數(shù)據(jù)存儲與管理、數(shù)據(jù)預處理、數(shù)據(jù)分析與挖掘的邏輯關系分析大數(shù)據(jù)時代應如何采用量化方法分析經(jīng)濟問題。本書在定性分析的基礎上,采用大量的實例和軟件操作插圖來直觀地解釋大數(shù)據(jù)分析方法的原理和應用,為讀者提供“一站式”服務。同時,通過對線性回歸、邏輯回歸等計量方法,主成
本書分為5篇,包括11章和3個附錄。大數(shù)據(jù)基礎篇包括第1章(緒論);大數(shù)據(jù)存儲篇包括第2~3章(HDFS分布式文件系統(tǒng)、NoSQL及其HBase分布式數(shù)據(jù)庫系統(tǒng));大數(shù)據(jù)計算篇包括第4~7章(MapReduce分布式計算、大數(shù)據(jù)的Spark內存計算、大數(shù)據(jù)的流計算、大數(shù)據(jù)的圖計算);大數(shù)據(jù)管理、查詢分析及可視篇包括第8
本書主要根據(jù)作者近幾年在清華大學面向研究生和本科生開設的數(shù)據(jù)挖掘:方法與應用課程的教學實踐與積累,參考近幾年國外著名大學相關課程的教學體系編寫而成。本書系統(tǒng)地介紹數(shù)據(jù)挖掘的基本概念和基本原理方法;結合一些典型的應用實例展示用數(shù)據(jù)挖掘的思維方法求解問題的一般性模式與思路。本書可作為有一定數(shù)據(jù)結構、數(shù)據(jù)庫和程序設計基礎的研
本書將為大家全面而深入地介紹Hadoop、Spark和NoSQL平臺的構建,深入淺出地講解Hadoop、Spark和NoSQL的基礎知識、架構方案與實戰(zhàn)技巧等。通過閱讀本書,讀者可以對大數(shù)據(jù)平臺架構有一個明確、清晰的認識,掌握Hadoop、Spark、NoSQL平臺的使用技巧,從而搭建一個安全可靠的大數(shù)據(jù)集群平臺,來滿
本書共12章,內容包括:什么是大數(shù)據(jù)、大數(shù)據(jù)技術基礎、數(shù)據(jù)采集與預處理、大數(shù)據(jù)存儲與管理、大數(shù)據(jù)計算框架、分布式數(shù)據(jù)庫Hbase、數(shù)據(jù)挖掘、大數(shù)據(jù)應用分析、數(shù)據(jù)可視化等。
作為面向全國高校師生舉辦的第二屆“慧源共享”全國高校開放數(shù)據(jù)創(chuàng)新研究大賽系列活動的重要成果,本書主要分為三個部分,第一部分是數(shù)據(jù)論文,介紹圖書館業(yè)務數(shù)據(jù)、電子資源訪問行為數(shù)據(jù)、互聯(lián)網(wǎng)采集數(shù)據(jù)、特色數(shù)據(jù)4類數(shù)據(jù)的多個高價值數(shù)據(jù)集;第二部分收錄了大賽的8篇優(yōu)秀獲獎論文;第三部分包括大賽的活動介紹、專家寄語和訓練營專家金句等
本書始終圍繞機電動態(tài)系統(tǒng)的仿真及其工程應用這個主題而展開,主要講解了有關機電動態(tài)系統(tǒng)中的連桿機構、齒輪機構、液壓控制系統(tǒng)、液壓執(zhí)行元件、電子電路、電機、電力系統(tǒng)、測控系統(tǒng)、PID控制器、讀/寫外部數(shù)據(jù)等內容。本書在第1版的基礎上對各章節(jié)內容進行了補充和完善,增加了讀/寫外部數(shù)據(jù)內容。全書共15章,第1、2章回顧和總結M
本書主要研究了面向智慧旅游的視頻數(shù)據(jù)智能處理與挖掘相關技術及應用,以提高旅游景區(qū)視頻大數(shù)據(jù)中異常事件檢測和識別的精度、魯棒性、實時性等性能為目的,從而實現(xiàn)對旅游突發(fā)事件及時預測和預警,保障旅游安全。本書首先研究了視頻大數(shù)據(jù)的去噪技術,重點研究了基于殘差卷積神經(jīng)網(wǎng)絡的視頻去噪算法;然后研究了視頻大數(shù)據(jù)的超分辨率重建