《因子分析方法》PPT課件.ppt
《《因子分析方法》PPT課件.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《《因子分析方法》PPT課件.ppt(21頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
因子分析方法 演講人 馬金芳 因子分析的基本概念 因子分析的概念就是在盡可能不損失信息或少損失信息的情況下 將多個(gè)變量減少為少數(shù)幾個(gè)潛在的因子 也就是用少數(shù)幾個(gè)因子來(lái)描述許多指標(biāo)或因素之間的聯(lián)系 以較少幾個(gè)因子來(lái)反映原資料的大部分信息的統(tǒng)計(jì)學(xué)分析方法主成分分析 Principalcomponentanalysis 是因子分析的一個(gè)特例 是使用最多的因子提取方法 它通過(guò)坐標(biāo)變換手段 將原有的多個(gè)相關(guān)變量 做線性變化 轉(zhuǎn)換為另外一組不相關(guān)的變量 選取前面幾個(gè)方差最大的主成分 這樣達(dá)到了因子分析較少變量個(gè)數(shù)的目的 同時(shí)又能與較少的變量反映原有變量的絕大部分的信息 兩者關(guān)系 主成分分析 PCA 和因子分析 FA 是兩種把變量維數(shù)降低以便于描述 理解和分析的方法 而實(shí)際上主成分分析可以說(shuō)是因子分析的一個(gè)特例 因子分析的基本模型 因子分析模型中 假定每個(gè)原始變量由兩部分組成 共同因子和唯一因子 共同因子是各個(gè)原始變量所共有的因子 解釋變量之間的相關(guān)關(guān)系 唯一因子顧名思義是每個(gè)原始變量所特有的因子 表示該變量不能被共同因子解釋的部分 原始變量與因子分析時(shí)抽出的共同因子的相關(guān)關(guān)系用因子負(fù)荷表示 因子分析最常用的理論模式如下 j 1 2 3 n n為原始變量總數(shù) 1 Zj為第j個(gè)變量的標(biāo)準(zhǔn)化分?jǐn)?shù) 2 Fi i 1 2 m 為共同因素 3 m為所有變量共同因素的數(shù)目 4 Uj為變量的唯一因素 5 aij為因素負(fù)荷量 用矩陣的形式表示為Z AF UF稱為因子 由于它們出現(xiàn)在每個(gè)原始變量的線性表達(dá)式 原始變量可以用Xj表示 這里模型中實(shí)際上是以F線性表示各個(gè)原始變量的標(biāo)準(zhǔn)化分?jǐn)?shù)Zj 因此又稱為公共因子 A稱為因子載荷矩陣 aji稱為因子載荷 是第j個(gè)原始變量在第i個(gè)因子上的負(fù)荷 U稱為特殊因子 表示了原有變量不能被因子解釋的部分 其均值為0 相當(dāng)于多元線性回歸模型中的殘差 因子分析的特點(diǎn) 1 因子變量的數(shù)量遠(yuǎn)少于原有的指標(biāo)變量的數(shù)量 因而對(duì)因子變量的分析能夠減少分析中的工作量 2 因子變量不是對(duì)原始變量的取舍 而是根據(jù)原始變量的信息進(jìn)行重新組構(gòu) 它能夠反映原有變量大部分的信息 3 因子變量之間不存在顯著的線性相關(guān)關(guān)系 對(duì)變量的分析比較方便 但原始部分變量之間多存在較顯著的相關(guān)關(guān)系 4 因子變量具有命名解釋性 即該變量是對(duì)某些原始變量信息的綜合和反映 因子分析數(shù)學(xué)模型中幾個(gè)相關(guān)概念 1 因子載荷 因素負(fù)荷量 因子載荷就是因素結(jié)構(gòu)中 原始變量與因素分析時(shí)抽取出共同因素的相關(guān) 在因子不相關(guān)的前提下 因子載荷aji是變量Zj和因子Fi的相關(guān)系數(shù) 反映了變量Zj與因子Fi之間的相關(guān)程度 因子載荷值aji小于等于1 絕對(duì)值越接近1 表明因子Fi與變量Zj的相關(guān)性越強(qiáng) 同時(shí) 因子載荷aji也反映了因子Fi對(duì)解釋變量Zj的重要作用和程度 當(dāng)要判斷一個(gè)因子的意義時(shí) 需要查看哪些變量的負(fù)荷達(dá)到了0 3或0 3以上 2 變量共同度 共同性 一個(gè)因子解釋的是相關(guān)矩陣的方差 變量的方差由共同因子和唯一因子組成 可以表示成h u2 1 h 表示共同度 u2表示特殊因子的平方 變量共同度就是指每個(gè)原始變量在每個(gè)共同因子的負(fù)荷量的平方和 是全部因子對(duì)變量方差解釋說(shuō)明的比例 變量共同度h 越接近1 說(shuō)明因子全體解釋說(shuō)明了變量Zj的較大部分方差 如果用因子全體刻畫變量 則變量的信息丟失較少 共同性的意義在于說(shuō)明如果用共同因子替代原始變量后 原始變量的信息被保留的程度 特殊因子U的平方 反應(yīng)了變量方差中不能由因子全體解釋說(shuō)明的比例 越小則說(shuō)明變量的信息丟失越少 因子分析數(shù)學(xué)模型中幾個(gè)相關(guān)概念 總之 變量的共同度刻畫了因子全體對(duì)變量信息解釋的程度 是評(píng)價(jià)變量信息丟失程度的重要指標(biāo) 如果大多數(shù)原有變量的變量共同度均較高 如高于0 8 則說(shuō)明提取的因子能夠反映原有變量的大部分信息 80 以上 信息 僅有較少的信息丟失 因子分析的效果較好 因子 變量共同度是衡量因子分析效果的重要依據(jù) 2 變量共同度 共同性 3 因子的方差貢獻(xiàn) 特征值 因子的方差貢獻(xiàn) 特征值 的數(shù)學(xué)定義為 該式表明 因子Fi的方差貢獻(xiàn)是因子載荷矩陣A中第i列元素的平方和 因子Fi的方差貢獻(xiàn)反映了因子Fi對(duì)原有變量總方差的解釋能力 其解釋方差的大小成為因子的特征值 該值越高 說(shuō)明相應(yīng)因子的重要性越高 因此 因子的方差貢獻(xiàn)和方差貢獻(xiàn)率是衡量因子重要性的關(guān)鍵指標(biāo) 因子分析數(shù)學(xué)模型中幾個(gè)相關(guān)概念 舉例說(shuō)明 因子分析數(shù)學(xué)模型中幾個(gè)相關(guān)概念 因子分析的五大基本步驟 第一步 因子分析的前提條件由于因子分析的主要任務(wù)之一是對(duì)原有變量進(jìn)行濃縮 即將原有變量中的信息重疊部分提取和綜合成因子 進(jìn)而最終實(shí)現(xiàn)減少變量個(gè)數(shù)的目的 因此它要求原有變量之間應(yīng)存在較強(qiáng)的相關(guān)關(guān)系 否則 如果原有變量相互獨(dú)立 相關(guān)程度很低 不存在信息重疊 它們不可能有共同因子 那么也就無(wú)法將其綜合和濃縮 也就無(wú)需進(jìn)行因子分析 本步驟正是希望通過(guò)各種方法分析原有變量是否存在相關(guān)關(guān)系 是否適合進(jìn)行因子分析 第一步 因子分析的前提條件 三種方法判斷數(shù)據(jù)是否適合作因子分析 計(jì)算相關(guān)系數(shù)矩陣在進(jìn)行提取因子等分析步驟之前 應(yīng)對(duì)相關(guān)矩陣進(jìn)行檢驗(yàn) 如果相關(guān)矩陣中的大部分相關(guān)系數(shù)小于0 3 則不適合作因子分析 當(dāng)原始變量個(gè)數(shù)較多時(shí) 一般不會(huì)采用此方法或即使采用了此方法 也不方便在結(jié)果匯報(bào)中給出原始分析報(bào)表 巴特利特球度檢驗(yàn)Bartlett球體檢驗(yàn)的目的是檢驗(yàn)相關(guān)矩陣是否是單位矩陣 如果是單位矩陣 則認(rèn)為因子模型不合適 一般說(shuō)來(lái) 顯著水平值越小 0 05 表明原始變量之間越可能存在有意義的關(guān)系 如果顯著性水平很大 如0 10以上 可能表明數(shù)據(jù)不適宜于因子分析 KMOKMO測(cè)度的值越高 接近1 0時(shí) 表明變量間的共同因子越多 研究數(shù)據(jù)適合用因子分析 通常按以下標(biāo)準(zhǔn)解釋該指標(biāo)值的大小 KMO值達(dá)到0 9以上為非常好 0 8 0 9為好 0 7 0 8為一般 0 6 0 7為差 0 5 0 6為很差 如果KMO測(cè)度的值低于0 5時(shí) 表明樣本偏小 需要擴(kuò)大樣本 第一步 因子分析的前提條件 三種方法判斷數(shù)據(jù)是否適合作因子分析 第二步 取共同因子 確定因子的數(shù)目和求因子解的方法 因子抽取的方法最常使用的是主成份分析法 進(jìn)行主成份分析時(shí) 先要將每個(gè)變量的數(shù)值轉(zhuǎn)換成標(biāo)準(zhǔn)值 原則上 因子的數(shù)目與原始變量的數(shù)目相同 但抽取了主要的因子之后 如果剩余的方差很小 就可以放棄其余的因子 以達(dá)到簡(jiǎn)化數(shù)據(jù)的目的 因子數(shù)目的確定常用的方法是借助一是特征值準(zhǔn)則 二是碎石圖檢驗(yàn)準(zhǔn)則 特征值準(zhǔn)則就是選取特征值大于或等于1的主成份作為初始因子 而放棄特征值小于1的主成份 散點(diǎn)曲線的特點(diǎn)是由高到低 先陡后平 最后幾乎成一條直線 曲線開始變平的前一個(gè)點(diǎn)被認(rèn)為是提取的最大因子數(shù) 后面的散點(diǎn)類似于山腳下的碎石 可舍棄而不會(huì)丟失很多信息 第三步 使因子更具有命名可解釋性 因子旋轉(zhuǎn) 通常最初因素抽取后 對(duì)因素?zé)o法作有效的解釋 這時(shí)往往需要進(jìn)行因子旋轉(zhuǎn) 通過(guò)坐標(biāo)變換使因子解的意義更容易解釋 轉(zhuǎn)軸的目的在于改變題項(xiàng)在各因素負(fù)荷量的大小 轉(zhuǎn)軸時(shí)根據(jù)題項(xiàng)與因素結(jié)構(gòu)關(guān)系的密切程度 調(diào)整各因素負(fù)荷量的大小 轉(zhuǎn)軸后 使得變量在每個(gè)因素的負(fù)荷量不是變大 接近1 就是變得更小 接近0 而非轉(zhuǎn)軸前在每個(gè)因素的負(fù)荷量大小均差不多 這就使對(duì)共同因子的命名和解釋變量變得更容易 轉(zhuǎn)軸后 每個(gè)共同因素的特征值會(huì)改變 但每個(gè)變量的共同性不會(huì)改變 因子旋轉(zhuǎn)的方法 1 方差最大正交旋轉(zhuǎn) varimaxorthogonalrotation 基本思想 使公共因子的相對(duì)負(fù)荷 lij hi2 的方差之和最大 且保持原公共因子的正交性和公共方差總和不變 可使每個(gè)因子上的具有最大載荷的變量數(shù)最小 因此可以簡(jiǎn)化對(duì)因子的解釋 2 斜交旋轉(zhuǎn)因子斜交旋轉(zhuǎn)后 各因子負(fù)荷發(fā)生了較大變化 出現(xiàn)了兩極分化 各因子間不再相互獨(dú)立 而彼此相關(guān) 各因子對(duì)各變量的貢獻(xiàn)的總和也發(fā)生了改變 適用于大數(shù)據(jù)集的因子分析 第三步 使因子更具有命名可解釋性 因子旋轉(zhuǎn) 第四步 決定因素與命名 轉(zhuǎn)軸后 要決定因素?cái)?shù)目 選取較少因素層面 獲得較大的解釋量 在因素命名與結(jié)果解釋上 必要時(shí)可將因素計(jì)算后之分?jǐn)?shù)存儲(chǔ) 作為其它程序分析之輸入變量 第五步 計(jì)算各樣本的因子得分 因子分析的最終目標(biāo)是減少變量個(gè)數(shù) 以便在進(jìn)一步的分析中用較少的因子代替原有變量參與數(shù)據(jù)建模 本步驟正是通過(guò)各種方法計(jì)算各樣本在各因子上的得分 為進(jìn)一步的分析奠定基礎(chǔ) 謝謝觀賞- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 因子分析方法 因子分析 方法 PPT 課件
鏈接地址:http://m.appdesigncorp.com/p-7732991.html