主成分分析與因子分析法.ppt

上傳人：xt****7

文檔編號：2288376

上傳時間：2019-11-19

格式：PPT

頁數(shù)：37

大?。?11KB

《主成分分析與因子分析法.ppt》由會員分享，可在線閱讀，更多相關《主成分分析與因子分析法.ppt（37頁珍藏版）》請在裝配圖網(wǎng)上搜索。

,主成分分析法與因子分析法,主要內(nèi)容,主成分分析法因子分析法附：主成分分析法與因子分析法的區(qū)別,主成分分析法（Principal Components Analysis,PCA）,主成分分析法概述主成分分析的基本原理主成分分析的計算步驟,一、主成分分析概述,假定你是一個公司的財務經(jīng)理，掌握了公司的所有數(shù)據(jù)，這包括眾多的變量，比如固定資產(chǎn)、流動資金、每一筆借貸的數(shù)額和期限、各種稅費、工資支出、原料消耗、產(chǎn)值、利潤、折舊、職工人數(shù)、職工的分工和教育程度等等。如果讓你向上級或有關方面介紹公司狀況，你能夠把這些指標和數(shù)字都原封不動地擺出去嗎？,引子,當然不能。匯報什么？發(fā)現(xiàn)在如此多的變量之中，有很多是相關的。人們希望能夠找出它們的少數(shù)“代表”來對它們進行描述。需要把這種有很多變量的數(shù)據(jù)進行高度概括，用少數(shù)幾個指標簡單明了地把情況說清楚。,主成分分析法（ Principal Components Analysis ）和因子分析法（Factor Analysis）就是把變量維數(shù)降低以便于描述、理解和分析的方法。主成分分析也稱為主分量分析，是一種通過降維來簡化數(shù)據(jù)結(jié)構(gòu)的方法：如何把多個變量化為少數(shù)幾個綜合變量（綜合指標），而這幾個綜合變量可以反映原來多個變量的大部分信息，所含的信息又互不重疊，即它們之間要相互獨立，互不相關。這些綜合變量就叫因子或主成分，它是不可觀測的，即它不是具體的變量,只是幾個指標的綜合。在引入主成分分析之前，先看下面的例子。,什么是主成分分析法？,成績數(shù)據(jù),53個學生的數(shù)學、物理、化學、語文、歷史、英語的成績?nèi)缦卤恚ú糠郑?從本例可能提出的問題,能不能把這個數(shù)據(jù)表中的6個變量用一兩個綜合變量來表示呢？這一兩個綜合變量包含有多少原來的信息呢？,事實上，以上問題在平時的研究中，也會經(jīng)常遇到。它所涉及的問題可以推廣到對企業(yè)、對學校、對區(qū)域進行分析、評價、排序和分類等。比如對n個樣本進行綜合評價，可選的描述樣本特征的指標很多，而這些指標往往存在一定的相關性（既不完全獨立，又不完全相關），這就給研究帶來很大不便。若選指標太多，會增加分析問題的難度與復雜性，選指標太少，有可能會漏掉對樣本影響較大的指標，影響結(jié)果的可靠性。,這就需要我們在相關分析的基礎上，采用主成分分析法找到幾個新的相互獨立的綜合指標，達到既減少指標數(shù)量、又能區(qū)分樣本間差異的目的。,二、主成分分析的基本原理,,（一）主成分分析的幾何解釋（二）主成分分析的基本思想,（一）主成分分析的幾何解釋,例中數(shù)據(jù)點是六維的；即每個觀測值是6維空間中的一個點。希望把6維空間用低維空間表示。先假定只有二維，即只有兩個變量，語文成績（x1）和數(shù)學成績（x2），分別由橫坐標和縱坐標所代表；每個學生都是二維坐標系中的一個點。,因為在實際應用中，往往存在指標的量綱不同，所以在計算之前須先消除量綱的影響，而將原始數(shù)據(jù)標準化。為了實現(xiàn)樣本數(shù)據(jù)的標準化，應求樣本數(shù)據(jù)的平均和方差。對數(shù)據(jù)矩陣Y作標準化處理，即對每一個指標分量作標準化變換，變換公式為：,其中，樣本均值：樣本標準差：,原始變量經(jīng)規(guī)格化后變?yōu)樾伦兞? ，其均值為零，方差為1。對二維空間來講n個標準化后的樣本在二維空間的分布大體為一橢圓形，該橢圓有一個長軸和一個短軸。在短軸方向上數(shù)據(jù)變化很少，極端的情況下，短軸如退化成一點，長軸的方向可以完全解釋這些點的變化，由二維到一維的降維就自然完成了。,,,,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,假定語文成績（X1）和數(shù)學成績（X2）分別為標準化后的分數(shù)，右圖為其散點圖，橢圓傾斜為45度。,如果將坐標軸 X1 和 X2 旋轉(zhuǎn)45 ，那么點在新坐標系中的坐標（Y1,Y2）與原坐標（X1,X2）有如下的關系：,Y1和Y2均是X1 和 X2 的線性組合,,,,,,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,在新坐標系中，可以發(fā)現(xiàn)：雖然散點圖的形狀沒有改變，但新的隨機變量 Y1 和 Y2 已經(jīng)不再相關。而且大部分點沿 Y1 軸散開，在 Y1 軸方向的變異較大（即 Y1的方差較大），相對來說，在 Y2軸方向的變異較?。?Y2 的方差較小）。,在上面的例子中 Y1 和 Y2 就是原變量 X1和 X2的第一主成分和第二主成分。實際上第一主成分 Y1 就基本上反映了 X1 和X2 的主要信息，因為圖中的各點在新坐標系中的 Y1 坐標基本上就代表了這些點的分布情況，因此可以選 Y1 為一個新的綜合變量。當然如果再選 Y2也作為綜合變量，那么 Y1 和 Y2 則反映了 X1 和 X2的全部信息。,22,(二) 主成分分析的基本思想假如對某一問題的研究涉及 p 個指標，記為X1，X2, …, Xp，由這 p 個隨機變量構(gòu)成的隨機向量為X=(X1, X2, …, Xp)?，設 X 的均值向量為?，協(xié)方差矩陣為?。設Y=(Y1, Y2 , … , Yp)?為對 X 進行線性變換得到的合成隨機向量，即 (1) 設?i=(?i1, ?i2 , …, ?ip)?, A=(?1 , ?2 ,…, ?p)?，則有,,,,(2),23,且（3）由是式(1)(2)能夠看出，可以對原始變量進行任意的線性變換，不同線性變換得到的合成變量Y的統(tǒng)計特征顯然是不一樣的。每個Yi 應盡可能多地反映 p 個原始變量的信息，通常用方差來度量“信息”，Yi 的方差越大表示它所包含的信息越多。由式（3）可以看出將系數(shù)向量?i 擴大任意倍數(shù)會使Yi 的方差無限增大，為了消除這種不確定性，增加約束條件：,,,24,為了有效地反映原始變量的信息，Y的不同分量包含的信息不應重疊。綜上所述，式（1）的線性變換需要滿足下面的約束： (1) 即，i =1, 2, …, p。 (2) Y1在滿足約束 (1) 即的情況下，方差最大；Y2是在滿足約束(1) ，且與Y1不相關的條件下，其方差達到大；……；Yp是在滿足約束(1) ，且與Y1，Y2，…，Y p-1不相關的條件下，在各種線性組合中方差達到最大者。滿足上述約束得到的合成變量Y1, Y2, …, Yp分別稱為原始變量的第一主成分、第二主成分、…、第 p 主成分，而且各成分方差在總方差中占的比重依次遞減。在實際研究工作中，僅挑選前幾個方差較大的主成分，以達到簡化系統(tǒng)結(jié)構(gòu)的目的。,,三、主成分分析的計算步驟,,(一)計算相關系數(shù)矩陣 (二)計算特征值與特征向量 (三)計算主成分貢獻率及累計貢獻率 (四)計算主成分載荷,（一）計算相關系數(shù)矩陣 rij（i，j=1，2，…，p）為原變量xi與xj標準化后的相關系數(shù)， rij=rji，其計算公式為,,（3.5.3）,,,（3.5.4）,（二）計算特征值與特征向量 1、解特征方程，求出特征值，并使其按大小順序排列,2、分別求出對應于特征值的特征向量，要求 =1，即，其中表示向量的第j個分量,也就是說為單位向量。,29,（三）計算主成分貢獻率及累計貢獻率主成分分析是把 p 個隨機變量的總方差分解為 p 個不相關隨機變量的方差之和?1 ＋ ?2 ＋…＋ ?P，則總方差中屬于第 i 個主成分（被第 i 個主成分所解釋）的比例為稱為第 i 個主成分的貢獻率。定義稱為前 m 個主成分的累積貢獻率，衡量了前 m 個主成份對原始變量的解釋程度。,,,（四）計算主成分載荷在主成分之間不相關時，主成分載荷就是主成分zi與變量xj之間的相關系數(shù),,,,,,,,,因子分析法（Factor Analysis，F(xiàn)A）,因子分析法概述因子分析法的模型附：主成分分析與因子分析的區(qū)別,（一）因子分析法概述,因子分析法與主成分分析法都基于統(tǒng)計分析法，但兩者有較大的區(qū)別。主成分分析是通過坐標變換提取主成分，也就是將一組具有相關性的變量變換為一組獨立的變量，將主成分表示為原始觀察變量的線性組合。而因子分析法是要構(gòu)造因子模型，將原始觀察變量分解為因子的線性組合。因此因子分析法是主成分分析法的發(fā)展。,（二）因子分析法的模型,狹義的因子分析法常與主成分分析法在處理方法上有相類似之處，都要對變量規(guī)格化，并找出原始變量規(guī)格化后的相關矩陣。其主要不同點在于建立線性方程組時所考慮的方法，因子分析是以回歸方程的形式將變量表示成因子的線性組合，而且要使因子數(shù)m小于原始變量維數(shù)p，從而簡化了模型結(jié)構(gòu)。其步驟為：將原始數(shù)據(jù)標準化→求標準化數(shù)據(jù)的相關矩陣→求相關矩陣的特征值和特征向量→計算方差貢獻率與累計方差貢獻率→確定因子→因子旋轉(zhuǎn)→用原始的線性組合求各因子得分→求綜合得分→得分排序,因子模型的表達式為：,其矩陣形式為：其中為因子載荷。數(shù)學上可以證明，因子載荷就是第i變量與第j因子的相關系數(shù)，反映了第i變量在第j因子上的重要性。 F稱為X的公共因子或潛因子，矩陣A稱為因子載荷矩陣，e稱為X的特殊因子。,,附、主成分分析與因子分析的區(qū)別,,主成分分析法與因子分析法的區(qū)別,

下載提示(請認真閱讀)

1.請仔細閱讀文檔，確保文檔完整性，對于不預覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
2.下載的文檔，不會出現(xiàn)我們的網(wǎng)址水印。
3、該文檔所得收入（下載+內(nèi)容+預覽）歸上傳者、原創(chuàng)作者；如果您是本文檔原作者，請點此認領！既往收益都歸您。

同意并開始全文預覽

文檔包含非法信息？點此舉報后獲取現(xiàn)金獎勵！

文檔加載中……請稍候！
如果長時間未打開，您也可以點擊刷新試試。

下載文檔到電腦，查找使用更方便

9.9 積分

還剩頁未讀，繼續(xù)閱讀

舉報

版權申訴 word格式文檔無特別注明外均可編輯修改；預覽文檔經(jīng)過壓縮，下載后原文更清晰！ 立即下載

配套講稿：: 如PPT文件的首頁顯示word圖標，表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
特殊限制：: 部分文檔作品中含有的國旗、國徽等圖片，僅作為作品整體效果示例展示，禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
關鍵詞：: 成分分析因子分析

溫馨提示:
1: 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

裝配圖網(wǎng)所有資源均是用戶自行上傳分享，僅供網(wǎng)友學習交流，未經(jīng)上傳用戶書面授權，請勿作他用。

關于本文

本文標題：主成分分析與因子分析法.ppt
鏈接地址：http://m.appdesigncorp.com/p-2288376.html

相關資源更多

正為您匹配相似的精品文檔

相關搜索

成分分析 因子分析

關于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

備案號:蜀ICP備2024067431號-1 川公網(wǎng)安備51140202000466號

本站為文檔C2C交易模式，即用戶上傳的文檔直接被用戶下載，本站只是中間服務平臺，本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權或隱私，請立即通知裝配圖網(wǎng)，我們立即給予刪除！

主成分分析與因子分析法.ppt

最新文檔