Python因其擁有強大的第三方軟件庫,廣泛應用在人工智能開發(fā)、科學計算和數據分析中。而pandas就是一款基于NumPy的解決Python數據分析任務的軟件庫。在機器學習和數據科學中,因為很少有數據可以直接使用,所以對數據進行預處理就成為必不可少的工作。《Pandas數據預處理詳解》就利用數據處理必需的pandas庫
本書的主角是在大數據時代應運而生的數據處理與分析利器Spark。你將通過豐富的示例學習如何使用Spark的結構化數據API,利用SparkSQL進行交互式查詢,掌握Spark應用的優(yōu)化之道,用Spark和DeltaLake等開源工具構建可靠的數據湖,并用MLlib庫實現機器學習流水線。隨著Spark從2.x版本升級到3
本書主要內容如下:產品經理職業(yè)發(fā)展和個人職業(yè)品牌打造的6要素模型,并針對產品需求洞察、產品規(guī)劃、產品設計、產品研發(fā)跟蹤等提供了一系列工具模板供參考使用;產品經理工作的整個過程,將其分解為7大類工具模板,供0基礎讀者直接上手參考使用;針對產品經理實際的工作場景,梳理總結提煉出各種工具模板;針對每個工具模板給出案例講解,通
本書是“十二五”職業(yè)教育國家規(guī)劃教材的修訂版。本書內容包括:水位控制系統(tǒng)設計,加熱反應爐系統(tǒng)設計,液力變扭箱數據采集系統(tǒng)設計,水塔供水的變頻控制,點膠機器人生產線現場總線網絡的設計等。通過實際工程項目,詳細介紹了組態(tài)控制技術通用版、嵌入版的運用方法,組態(tài)軟件與PLC控制系統(tǒng),組態(tài)軟件與板卡控制系統(tǒng),組態(tài)軟件、下位機PL
本書系統(tǒng)介紹了大數據的內涵、特征、技術及應用。全書共10章,其中第1~8章為技術篇,主要從大數據處理流程出發(fā),圍繞大數據體系架構,詳細闡述大數據采集與預處理、大數據存儲、大數據分析挖掘、大數據可視化等關鍵技術。第9、10兩章為應用篇,對大數據在電信、文娛、教育、醫(yī)療等行業(yè)的具體應用進行了論述,并通過典型案例與Pytho
智能控制是自動控制發(fā)展的高級階段,是人工智能、控制論、系統(tǒng)論、信息論、仿生學、神經生理學、進化計算和計算機等多種學科的高度匯聚,是一門新興的邊緣交叉學科。本書系統(tǒng)地介紹了智能控制的內涵、理論和主要方法,包括模糊控制、神經網絡控制、專家控制系統(tǒng)、遺傳算法、基于DNA的軟計算、粒子群算法、深度學習等,著重介紹了智能控制方法
復雜數據分析是大數據研究領域的重要課題。縱向數據是復雜數據的一種,往往產生于對個體隨著時間的變化而進行的重復觀測,該類數據不同于橫截面數據和時間序列數據,便于研究個體的時間效應,廣泛出現在諸多科研領域。縱向數據非參數半參數分析是統(tǒng)計研究的熱點領域。在本書中,作者利用非參數模型、半參數模型(部分線性模型、單指標模型、部分
本書共5章,第1章闡述了本書研究的背景,分析信息物理融合系統(tǒng)研究現狀及其技術的發(fā)展趨勢;第2章討論信息物理融合系統(tǒng)物理體系結構模型,并分析不同層次體系結構的特點及其典型應用;第3章對信息物理融合系統(tǒng)進行分析;第4章研究了信息物理融合系統(tǒng)的優(yōu)化問題;第5章主要分析了信息物理融合系統(tǒng)的安全問題。
本書共七章,內容包括:大數據與數據分析、大數據存儲、大數據分析工具、大數據與信息安全、基于二部圖網絡的電子商務推薦算法研究、基于位置的社交網絡好友推薦算法研究、基于稀有類分類的信用卡欺詐識別研究。
數據科學概論(第2版)(普通高等學校應用型教材·數據科學)