數(shù)據(jù)倉庫與數(shù)據(jù)挖掘1實驗報告冊汽院科院.doc
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘1實驗報告冊汽院科院.doc》由會員分享,可在線閱讀,更多相關《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘1實驗報告冊汽院科院.doc(9頁珍藏版)》請在裝配圖網(wǎng)上搜索。
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》 實驗報告冊 20 - 20 學年 第 學期 班 級: 學 號: 姓 名: 目錄 實驗一 Microsoft SQL Server Analysis Services的使用 3 實驗二 使用WEKA進行分類與預測 5 實驗三 使用WEKA進行關聯(lián)規(guī)則與聚類分析 6 實驗四 數(shù)據(jù)挖掘算法的程序實現(xiàn) 7 實驗一 Microsoft SQL Server Analysis Services的使用 實驗類型:驗證性 實驗學時:4 實驗目的: 學習并掌握Analysis Services的操作,加深理解數(shù)據(jù)倉庫中涉及的一些概念,如多維數(shù)據(jù)集,事實表,維表,星型模型,雪花模型,聯(lián)機分析處理等。 實驗內(nèi)容: 在實驗之前,先通讀自學SQL SERVER自帶的Analysis Manager概念與教程。按照自學教程的步驟,完成對FoodMart數(shù)據(jù)源的聯(lián)機分析。建立、編輯多維數(shù)據(jù)集,進行OLAP操作,看懂OLAP的分析數(shù)據(jù)。 實驗步驟: 1、 啟動聯(lián)機分析管理器: 2、 建立系統(tǒng)數(shù)據(jù)源連接。 3、 建立數(shù)據(jù)庫和數(shù)據(jù)源,多維數(shù)據(jù)集 編輯多維數(shù)據(jù)集 4、 設計存儲和處理多維數(shù)據(jù)集 5、 瀏覽多維數(shù)據(jù)集中的數(shù)據(jù) 按時間篩選數(shù)據(jù) 實驗小結: 實驗二 使用WEKA進行分類與預測 實驗類型:綜合性 實驗學時:4 實驗目的: 掌握數(shù)據(jù)挖掘平臺WEKA的使用。綜合運用數(shù)據(jù)預處理、分類與預測的挖掘算法、結果的解釋等知識進行數(shù)據(jù)挖掘。從而加深理解課程中的相關知識點。 實驗內(nèi)容: 閱讀并理解WEKA的相關中英文資料,熟悉數(shù)據(jù)挖掘平臺WEKA,針對實際數(shù)據(jù),能夠使用WEKA進行數(shù)據(jù)的預處理,能選擇合適的分類與預測算法對數(shù)據(jù)進行分析,并能解釋分析結果。 實驗步驟: 1、在開始->程序->啟動WEKA,進入Explorer界面,熟悉WEKA的界面功能。 2、選擇數(shù)據(jù)集(實驗中的數(shù)據(jù)可以從網(wǎng)絡獲取),如泰坦尼克號數(shù)據(jù)集,將要處理的數(shù)據(jù)集轉換成WEKA能處理的格式,如 .ARFF格式。思考:如何將其它格式的數(shù)據(jù)文件(如.XLS)轉換為.ARFF格式? 3、根據(jù)選擇的數(shù)據(jù)挖掘算法,如果有必要,在Weka Explorer界面,Preprocess選項中,進行相應的數(shù)據(jù)預處理。要求:熟悉Preprocess界面中各個功能選項的含義,理解數(shù)據(jù)的特征。思考:在filter中,supervised和unsupervised的區(qū)別? 4、在Weka Explorer界面,單擊Visualize選項,進入WEKA 的可視化頁面,可以對當前的關系作二維散點圖式的可視化瀏覽。要求: 熟悉Visualize界面中各個功能選項的含義,理解可視化圖形的意義。 5、選擇相應的分類與預測挖掘算法對數(shù)據(jù)集進行分析,進行算法參數(shù)的具體設置。如利用WEKA->Classifier->trees->J48 決策樹算法,對泰坦尼克號數(shù)據(jù)集進行分析;如利用回歸模型對連續(xù)數(shù)值進行預測。要求:對你選擇的分類和預測算法思想分別進行介紹,熟悉classify界面的內(nèi)容,對classifier中的參數(shù)含義分別進行介紹。思考:classifier->trees->J48算法與classifier->trees->id3算法的區(qū)別與聯(lián)系。 6、對分析所獲得的結果進行解釋。如,根據(jù)決策樹和分類規(guī)則嘗試討論泰坦尼克號幸存者的特征。理解評估分類和預測優(yōu)劣的一些準則。 實驗小結: 實驗中遇到的問題及解決辦法、心得、體會等等... 思考題 給出數(shù)據(jù)挖掘中分類與預測成功應用的案例,并簡要介紹。 實驗三 使用WEKA進行關聯(lián)規(guī)則與聚類分析 實驗類型:綜合性 實驗學時:4 實驗目的: 掌握數(shù)據(jù)挖掘平臺WEKA的使用。綜合運用數(shù)據(jù)預處理、關聯(lián)規(guī)則與聚類的挖掘算法、結果的解釋等知識進行數(shù)據(jù)挖掘。從而加深理解課程中的相關知識點。 實驗內(nèi)容: 閱讀并理解WEKA的相關中英文資料,熟悉數(shù)據(jù)挖掘平臺WEKA,針對實際數(shù)據(jù),能夠使用WEKA進行數(shù)據(jù)的預處理,了解屬性選擇,能選擇合適的關聯(lián)規(guī)則與聚類算法對數(shù)據(jù)進行分析,并能解釋分析結果。 實驗步驟: 1、在開始->程序->啟動WEKA,進入Explorer界面,熟悉WEKA的界面功能。 2、選擇數(shù)據(jù)集(實驗中的數(shù)據(jù)可以從網(wǎng)絡獲?。瑢⒁幚淼臄?shù)據(jù)集轉換成WEKA能處理的格式,如 .ARFF格式。根據(jù)選擇的數(shù)據(jù)挖掘算法,如果有必要,在Weka Explorer界面,Preprocess選項中,進行相應的數(shù)據(jù)預處理。 3、在Weka Explorer界面,單擊Select attributes選項,進入WEKA 的屬性選擇頁面。要求: 了解該界面中主要功能選項的含義,理解該界面的功能。 5、在Weka Explorer界面,單擊Associate選項,進入WEKA 的關聯(lián)規(guī)則頁面。選擇一個關聯(lián)規(guī)則算法對數(shù)據(jù)集進行分析,進行算法參數(shù)的具體設置。要求:對你選擇的關聯(lián)規(guī)則算法思想進行介紹,熟悉Associate界面的內(nèi)容,對Associate中的參數(shù)含義分別進行介紹。理解用來衡量規(guī)則的關聯(lián)程度的幾個度量指標。理解并解釋分析所獲得的結果。 6、在Weka Explorer界面,單擊Cluster選項,進入WEKA 的聚類頁面。選擇一個聚類算法(如K均值)對數(shù)據(jù)集進行分析,進行算法參數(shù)的具體設置。要求:對你選擇的聚類算法思想進行介紹,熟悉Cluster界面的內(nèi)容,對Cluster中的參數(shù)含義進行介紹。理解并解釋分析所獲得的結果。 實驗小結: 實驗中遇到的問題及解決辦法、心得、體會等等... 思考題 給出數(shù)據(jù)挖掘中關聯(lián)規(guī)則與聚類成功應用的一些案例,并簡要介紹。 實驗四 數(shù)據(jù)挖掘算法的程序實現(xiàn) 實驗類型:設計性 實驗學時:4 實驗目的: 運用數(shù)據(jù)挖掘、程序設計等相關知識,選擇一個數(shù)據(jù)挖掘的常用算法進行程序設計實現(xiàn)。加深對數(shù)據(jù)挖掘算法基本原理、詳細執(zhí)行過程和具體應用情況的理解。 實驗內(nèi)容: 采用任何一種自己熟悉的編程語言,完成算法的程序設計,并在每個程序設計語句后面進行詳細的注釋。能夠運用實現(xiàn)的算法來解決某個具體的問題,得到并解釋程序運行的結果。 推薦的算法: 1 關聯(lián)規(guī)則:Apriori算法 2 分類與預測:ID3, C4.5, KNN, BP, 3 聚類:k-means 實驗步驟: 1. 提前預習,選擇算法,理解原理。 2. 針對具體問題,選擇熟悉的編程平臺,進行算法的程序實現(xiàn),盡量在每個程序語句后面進行詳細注釋。 3. 自己選擇某個數(shù)據(jù)集,應用實現(xiàn)的算法得到結果并解釋。 實驗小結: 實驗中遇到的問題及解決辦法、心得、體會等等...- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 數(shù)據(jù)倉庫 數(shù)據(jù) 挖掘 實驗 報告 冊汽院科院
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權,請勿作他用。
相關資源
更多
正為您匹配相似的精品文檔
相關搜索
鏈接地址:http://m.appdesigncorp.com/p-6567421.html