本書系統(tǒng)地介紹過程挖掘的原理、方法、技術(shù)及其在教育領(lǐng)域的應(yīng)用,重點介紹基于Petri
net 的形式化挖掘技術(shù)和基于語義的挖掘技術(shù),并舉一個完整的挖掘大學校園學生行為特征的
案例。本書既有完整的理論框架又有專門的教育領(lǐng)域?qū)嵺`應(yīng)用,可供計算機、大數(shù)據(jù)、人工智
能等相關(guān)專業(yè)領(lǐng)域的學生和研究人員參考。
本書涵蓋了過程挖掘方法的理論框架,并詳細介紹了在教育領(lǐng)域的實踐與應(yīng)用
業(yè)務(wù)過程廣泛存在于工作流管理系統(tǒng)、業(yè)務(wù)過程管理系統(tǒng)、企業(yè)資源計劃系統(tǒng)等過程感知的信息系統(tǒng)以及半結(jié)構(gòu)化的分布式應(yīng)用中,過程挖掘技術(shù)從這些業(yè)務(wù)過程日志中提取有價值的知識,可發(fā)現(xiàn)、監(jiān)控和改進原有業(yè)務(wù)流程,是實現(xiàn)業(yè)務(wù)過程管理(BPM)的重要方法。過程挖掘研究包括過程發(fā)現(xiàn)、符合性檢查、模型改進三方面,其中過程發(fā)現(xiàn)的目標是從事件日志中構(gòu)造業(yè)務(wù)過程模型。當前,過程挖掘已廣泛應(yīng)用在醫(yī)療、金融、教育、電子商務(wù)等領(lǐng)域。
本書在總結(jié)歸納過程挖掘歷史和發(fā)展的基礎(chǔ)上,主要闡述基于工作流網(wǎng)(WF-net)的過程發(fā)現(xiàn)算法,側(cè)重于復(fù)雜控制流結(jié)構(gòu)發(fā)現(xiàn)算法研究,并介紹其在教育領(lǐng)域的應(yīng)用。全書分為5章,包括基本概念、基本算法、應(yīng)用實例以及軌跡挖掘中新的研究方向。第1章是過程挖掘概述,是對全書描述的問題的鋪墊,介紹了過程挖掘基本概念、任務(wù)、研究現(xiàn)狀和挑戰(zhàn)。第2章是Petri net 過程挖掘概述,闡述了形式化算法的代表理論Petri net,系統(tǒng)介紹了日志的表示、WF-net 等概念,這是全書研究的理論基礎(chǔ)。第3章是WF-net 過程挖掘技術(shù),系統(tǒng)介紹了? 系列算法,并闡述了短循環(huán)結(jié)構(gòu)和重復(fù)任務(wù)問題的挖掘算法,開拓復(fù)雜控制流結(jié)構(gòu),發(fā)現(xiàn)算法研究新思路。第4章是教育物聯(lián)網(wǎng)過程挖掘應(yīng)用,把過程發(fā)現(xiàn)算法應(yīng)用到教育物聯(lián)網(wǎng)領(lǐng)域的一卡通RFID應(yīng)用分析實踐中,重點研究事件日志質(zhì)量和多角度過程挖掘分析方法,闡述了某高校教育管理實例應(yīng)用。第5章是基于語義的過程挖掘技術(shù),在軌跡挖掘研究中引入過程挖掘技術(shù),闡述了基于主題模型LDA 的語義軌跡挖掘方法。
本書系統(tǒng)闡述了WF-net過程挖掘技術(shù),提出了解決短循環(huán)結(jié)構(gòu)和重復(fù)任務(wù)問題的挖掘算法,并進一步拓展至軌跡挖掘領(lǐng)域,理論體系完整又有所創(chuàng)新,基于物聯(lián)網(wǎng)的高校一卡通案例增強了本書的應(yīng)用參考價值。
本書在清華大學出版社相關(guān)領(lǐng)導(dǎo)和專家、編輯的信任、指導(dǎo)、支持和幫助下完稿并出版,同時,本書是廣東省普通高校創(chuàng)新團隊項目數(shù)據(jù)科學與智慧教育創(chuàng)新團隊(2021KCXTD038)、廣東省省級科技計劃項目基于物聯(lián)網(wǎng)的陶瓷生產(chǎn)遠程監(jiān)控平臺研究(2015A010103015)、廣東省教育廳創(chuàng)新強校資金基于過程發(fā)現(xiàn)和主題模型的RFID數(shù)據(jù)軌跡挖掘及應(yīng)用研究(2017KTSCX123)、廣東省普通高校重點實驗項目數(shù)據(jù)科學 與智慧教育重點實驗室(2022KSYS003)的研究成果,也參考了國內(nèi)外相關(guān)研究。在此,謹致謝意!
馮健文
2022年7月
第 1 章 過程挖掘概述 1
1.1 過程挖掘概念 1
1.2 過程發(fā)現(xiàn)算法 4
第 2 章 Petri net 過程挖掘概述 11
2.1 事件日志 11
2.2 Petri net 13
2.3 WF-net 15
2.4 SWF-net 15
第 3 章 WF-net 過程挖掘技術(shù) 17
3.1 WF-net 過程發(fā)現(xiàn)算法 17
3.2 挖掘短循環(huán)的過程挖掘算法 21
3.3 挖掘重復(fù)任務(wù)的過程挖掘算法 34
第 4 章 教育物聯(lián)網(wǎng)過程挖掘應(yīng)用 63
4.1 一卡通 RFID 業(yè)務(wù)管理決策需求 64
4.2 一卡通過程挖掘方法框架 69
4.3 設(shè)計模型 71
4.4 一卡通數(shù)據(jù)預(yù)處理 72
4.5 多角度過程挖掘分析 77
4.6 實例研究 81
第 5 章 基于語義的過程挖掘技術(shù) 104
5.1 軌跡挖掘概述 104
5.2 基于過程發(fā)現(xiàn)和 LDA 的 RFID 軌跡數(shù)據(jù)挖掘方法 110
5.3 基于過程發(fā)現(xiàn)的 RFID 數(shù)據(jù)軌跡生成方法 115
5.4 基于 LDA 的大學一卡通學生行為特征分析研究 120
參考文獻 125