聚類分析的現(xiàn)狀與前景研究.ppt
《聚類分析的現(xiàn)狀與前景研究.ppt》由會員分享,可在線閱讀,更多相關(guān)《聚類分析的現(xiàn)狀與前景研究.ppt(25頁珍藏版)》請在裝配圖網(wǎng)上搜索。
聚類分析,,簡要介紹,聚類分析是研究如何將樣品或變量進行分類的一種方法(將一些觀察對象依據(jù)某些微量特征加以歸類)。主要應(yīng)用于探索性的研究,其分析的結(jié)果可以提供多個可能的解,選擇最終的解需要研究者的主觀判斷和后續(xù)的分析。,分類:系統(tǒng)聚類:用于對小樣本的樣品間聚類以及對變量聚類。動態(tài)聚類:適用于樣本量較大時樣品間的聚類,常用k-means法處理。有序樣品聚類:對有排列次序的樣本的樣品間聚類,要求必須是次序相鄰的樣品才能聚成一類。,房價問題,2004年全國37大城市國民經(jīng)濟和社會發(fā)展統(tǒng)計公報的相關(guān)數(shù)據(jù),分別從國內(nèi)生產(chǎn)總值(GDP)、居民家庭人均可、支配收入、房價收入比、人均GDP這四個維度對全國37大城市的房價問題進行聚類分析,房價收入比,房價收入比:是指居住單元的中等自由市場價格與中等家庭年收入之比。例如一套售價為49萬元的房子對于一個年收入7萬元的家庭,其比值便為7:1,->,消費群體,,,,聚類分析在銀行客戶細分領(lǐng)域中的應(yīng)用:所用變量:,,,結(jié)果:,前景與優(yōu)缺點,高維聚類分析已成為聚類分析的一個重要研究方向。同時高維數(shù)據(jù)聚類也是聚類技術(shù)的難點。隨著技術(shù)的進步使得數(shù)據(jù)收集變得越來越容易,導(dǎo)致數(shù)據(jù)庫規(guī)模越來越大、復(fù)雜性越來越高,如各種類型的貿(mào)易交易數(shù)據(jù)、Web文檔、基因表達數(shù)據(jù)等,它們的維度(屬性)通??梢赃_到成百上千維,甚至更高。但是,受“維度效應(yīng)”的影響,許多在低維數(shù)據(jù)空間表現(xiàn)良好的聚類方法運用在高維空間上往往無法獲得好的聚類效果。高維數(shù)據(jù)聚類分析是聚類分析中一個非常活躍的領(lǐng)域,同時它也是一個具有挑戰(zhàn)性的工作。目前,高維數(shù)據(jù)聚類分析在市場分析、信息安全、金融、娛樂、反恐等方面都有很廣泛的應(yīng)用。,聚類分析本身也存在著一些不足,比如快速聚類雖然速度快,但是其分類指標要求是定距變量,而實際研究中,有很多的定類變量,如性別、學(xué)歷、職業(yè)、重復(fù)購買的可能性等多個與研究目的緊密相關(guān)的指標無法直接參與運算,而大大限制了它的使用范圍。聚類分析通常不能單獨的應(yīng)用解決一些問題,需要和其他方法一起結(jié)合使用才能使分析更全面、科學(xué)。并且在聚類分析過程中,針對具體情況分為幾類比較合適,有的軟件沒有提供具體的操作,有時需要驗證。例如用相關(guān)系數(shù)法進行聚類分析和指數(shù)法的時候存在加權(quán)問題。聚類分析的準確性還不算是很高,有待于完善。比如算法時空復(fù)雜,孤立點、代表點、鏈接過濾等問題還沒有得到徹底解決。,,,- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 聚類分析 現(xiàn)狀 前景 研究
鏈接地址:http://m.appdesigncorp.com/p-3722451.html