數(shù)據(jù)倉庫與數(shù)據(jù)挖掘1實驗報告冊汽院科院.doc
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘1實驗報告冊汽院科院.doc》由會員分享,可在線閱讀,更多相關(guān)《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘1實驗報告冊汽院科院.doc(9頁珍藏版)》請在裝配圖網(wǎng)上搜索。
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》 實驗報告冊 20 - 20 學(xué)年 第 學(xué)期 班 級: 學(xué) 號: 姓 名: 目錄 實驗一 Microsoft SQL Server Analysis Services的使用 3 實驗二 使用WEKA進(jìn)行分類與預(yù)測 5 實驗三 使用WEKA進(jìn)行關(guān)聯(lián)規(guī)則與聚類分析 6 實驗四 數(shù)據(jù)挖掘算法的程序?qū)崿F(xiàn) 7 實驗一 Microsoft SQL Server Analysis Services的使用 實驗類型:驗證性 實驗學(xué)時:4 實驗?zāi)康模? 學(xué)習(xí)并掌握Analysis Services的操作,加深理解數(shù)據(jù)倉庫中涉及的一些概念,如多維數(shù)據(jù)集,事實表,維表,星型模型,雪花模型,聯(lián)機(jī)分析處理等。 實驗內(nèi)容: 在實驗之前,先通讀自學(xué)SQL SERVER自帶的Analysis Manager概念與教程。按照自學(xué)教程的步驟,完成對FoodMart數(shù)據(jù)源的聯(lián)機(jī)分析。建立、編輯多維數(shù)據(jù)集,進(jìn)行OLAP操作,看懂OLAP的分析數(shù)據(jù)。 實驗步驟: 1、 啟動聯(lián)機(jī)分析管理器: 2、 建立系統(tǒng)數(shù)據(jù)源連接。 3、 建立數(shù)據(jù)庫和數(shù)據(jù)源,多維數(shù)據(jù)集 編輯多維數(shù)據(jù)集 4、 設(shè)計存儲和處理多維數(shù)據(jù)集 5、 瀏覽多維數(shù)據(jù)集中的數(shù)據(jù) 按時間篩選數(shù)據(jù) 實驗小結(jié): 實驗二 使用WEKA進(jìn)行分類與預(yù)測 實驗類型:綜合性 實驗學(xué)時:4 實驗?zāi)康模? 掌握數(shù)據(jù)挖掘平臺WEKA的使用。綜合運用數(shù)據(jù)預(yù)處理、分類與預(yù)測的挖掘算法、結(jié)果的解釋等知識進(jìn)行數(shù)據(jù)挖掘。從而加深理解課程中的相關(guān)知識點。 實驗內(nèi)容: 閱讀并理解WEKA的相關(guān)中英文資料,熟悉數(shù)據(jù)挖掘平臺WEKA,針對實際數(shù)據(jù),能夠使用WEKA進(jìn)行數(shù)據(jù)的預(yù)處理,能選擇合適的分類與預(yù)測算法對數(shù)據(jù)進(jìn)行分析,并能解釋分析結(jié)果。 實驗步驟: 1、在開始->程序->啟動WEKA,進(jìn)入Explorer界面,熟悉WEKA的界面功能。 2、選擇數(shù)據(jù)集(實驗中的數(shù)據(jù)可以從網(wǎng)絡(luò)獲?。缣┨鼓峥颂枖?shù)據(jù)集,將要處理的數(shù)據(jù)集轉(zhuǎn)換成WEKA能處理的格式,如 .ARFF格式。思考:如何將其它格式的數(shù)據(jù)文件(如.XLS)轉(zhuǎn)換為.ARFF格式? 3、根據(jù)選擇的數(shù)據(jù)挖掘算法,如果有必要,在Weka Explorer界面,Preprocess選項中,進(jìn)行相應(yīng)的數(shù)據(jù)預(yù)處理。要求:熟悉Preprocess界面中各個功能選項的含義,理解數(shù)據(jù)的特征。思考:在filter中,supervised和unsupervised的區(qū)別? 4、在Weka Explorer界面,單擊Visualize選項,進(jìn)入WEKA 的可視化頁面,可以對當(dāng)前的關(guān)系作二維散點圖式的可視化瀏覽。要求: 熟悉Visualize界面中各個功能選項的含義,理解可視化圖形的意義。 5、選擇相應(yīng)的分類與預(yù)測挖掘算法對數(shù)據(jù)集進(jìn)行分析,進(jìn)行算法參數(shù)的具體設(shè)置。如利用WEKA->Classifier->trees->J48 決策樹算法,對泰坦尼克號數(shù)據(jù)集進(jìn)行分析;如利用回歸模型對連續(xù)數(shù)值進(jìn)行預(yù)測。要求:對你選擇的分類和預(yù)測算法思想分別進(jìn)行介紹,熟悉classify界面的內(nèi)容,對classifier中的參數(shù)含義分別進(jìn)行介紹。思考:classifier->trees->J48算法與classifier->trees->id3算法的區(qū)別與聯(lián)系。 6、對分析所獲得的結(jié)果進(jìn)行解釋。如,根據(jù)決策樹和分類規(guī)則嘗試討論泰坦尼克號幸存者的特征。理解評估分類和預(yù)測優(yōu)劣的一些準(zhǔn)則。 實驗小結(jié): 實驗中遇到的問題及解決辦法、心得、體會等等... 思考題 給出數(shù)據(jù)挖掘中分類與預(yù)測成功應(yīng)用的案例,并簡要介紹。 實驗三 使用WEKA進(jìn)行關(guān)聯(lián)規(guī)則與聚類分析 實驗類型:綜合性 實驗學(xué)時:4 實驗?zāi)康模? 掌握數(shù)據(jù)挖掘平臺WEKA的使用。綜合運用數(shù)據(jù)預(yù)處理、關(guān)聯(lián)規(guī)則與聚類的挖掘算法、結(jié)果的解釋等知識進(jìn)行數(shù)據(jù)挖掘。從而加深理解課程中的相關(guān)知識點。 實驗內(nèi)容: 閱讀并理解WEKA的相關(guān)中英文資料,熟悉數(shù)據(jù)挖掘平臺WEKA,針對實際數(shù)據(jù),能夠使用WEKA進(jìn)行數(shù)據(jù)的預(yù)處理,了解屬性選擇,能選擇合適的關(guān)聯(lián)規(guī)則與聚類算法對數(shù)據(jù)進(jìn)行分析,并能解釋分析結(jié)果。 實驗步驟: 1、在開始->程序->啟動WEKA,進(jìn)入Explorer界面,熟悉WEKA的界面功能。 2、選擇數(shù)據(jù)集(實驗中的數(shù)據(jù)可以從網(wǎng)絡(luò)獲?。瑢⒁幚淼臄?shù)據(jù)集轉(zhuǎn)換成WEKA能處理的格式,如 .ARFF格式。根據(jù)選擇的數(shù)據(jù)挖掘算法,如果有必要,在Weka Explorer界面,Preprocess選項中,進(jìn)行相應(yīng)的數(shù)據(jù)預(yù)處理。 3、在Weka Explorer界面,單擊Select attributes選項,進(jìn)入WEKA 的屬性選擇頁面。要求: 了解該界面中主要功能選項的含義,理解該界面的功能。 5、在Weka Explorer界面,單擊Associate選項,進(jìn)入WEKA 的關(guān)聯(lián)規(guī)則頁面。選擇一個關(guān)聯(lián)規(guī)則算法對數(shù)據(jù)集進(jìn)行分析,進(jìn)行算法參數(shù)的具體設(shè)置。要求:對你選擇的關(guān)聯(lián)規(guī)則算法思想進(jìn)行介紹,熟悉Associate界面的內(nèi)容,對Associate中的參數(shù)含義分別進(jìn)行介紹。理解用來衡量規(guī)則的關(guān)聯(lián)程度的幾個度量指標(biāo)。理解并解釋分析所獲得的結(jié)果。 6、在Weka Explorer界面,單擊Cluster選項,進(jìn)入WEKA 的聚類頁面。選擇一個聚類算法(如K均值)對數(shù)據(jù)集進(jìn)行分析,進(jìn)行算法參數(shù)的具體設(shè)置。要求:對你選擇的聚類算法思想進(jìn)行介紹,熟悉Cluster界面的內(nèi)容,對Cluster中的參數(shù)含義進(jìn)行介紹。理解并解釋分析所獲得的結(jié)果。 實驗小結(jié): 實驗中遇到的問題及解決辦法、心得、體會等等... 思考題 給出數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則與聚類成功應(yīng)用的一些案例,并簡要介紹。 實驗四 數(shù)據(jù)挖掘算法的程序?qū)崿F(xiàn) 實驗類型:設(shè)計性 實驗學(xué)時:4 實驗?zāi)康模? 運用數(shù)據(jù)挖掘、程序設(shè)計等相關(guān)知識,選擇一個數(shù)據(jù)挖掘的常用算法進(jìn)行程序設(shè)計實現(xiàn)。加深對數(shù)據(jù)挖掘算法基本原理、詳細(xì)執(zhí)行過程和具體應(yīng)用情況的理解。 實驗內(nèi)容: 采用任何一種自己熟悉的編程語言,完成算法的程序設(shè)計,并在每個程序設(shè)計語句后面進(jìn)行詳細(xì)的注釋。能夠運用實現(xiàn)的算法來解決某個具體的問題,得到并解釋程序運行的結(jié)果。 推薦的算法: 1 關(guān)聯(lián)規(guī)則:Apriori算法 2 分類與預(yù)測:ID3, C4.5, KNN, BP, 3 聚類:k-means 實驗步驟: 1. 提前預(yù)習(xí),選擇算法,理解原理。 2. 針對具體問題,選擇熟悉的編程平臺,進(jìn)行算法的程序?qū)崿F(xiàn),盡量在每個程序語句后面進(jìn)行詳細(xì)注釋。 3. 自己選擇某個數(shù)據(jù)集,應(yīng)用實現(xiàn)的算法得到結(jié)果并解釋。 實驗小結(jié): 實驗中遇到的問題及解決辦法、心得、體會等等...- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該PPT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 數(shù)據(jù)倉庫 數(shù)據(jù) 挖掘 實驗 報告 冊汽院科院
鏈接地址:http://m.appdesigncorp.com/p-6567421.html