《安徽省高三數(shù)學復習 第12單元第72講 變量的相關性、回歸分析、獨特性檢驗課件 理》由會員分享,可在線閱讀,更多相關《安徽省高三數(shù)學復習 第12單元第72講 變量的相關性、回歸分析、獨特性檢驗課件 理(53頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、1會作兩個有關聯(lián)變量數(shù)據(jù)的散點圖,會利用散點圖認識變量間的相關關系2了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程3了解獨立性檢驗的含義,會根據(jù)22列聯(lián)表分析判斷事件A與B是否具有相關性4了解回歸分析的基本思想、方法及其簡單應用 12340.9950.30120.44910.9534 1 AB.CDyxrrrryx 對四組變量 和 進行線性相關性檢驗,其相關系數(shù)分別是:第組,第組,第組,第組,則可以判定變量 和 具有較強的相關關系的是第、組第、組第、組第、組B.B 1r由于越接近 ,表明兩個變量的線解性相關性越強,因此選項正確,故選析: ()(1,210)()(1,21
2、0) 2. 2009/) iiiixyxyiauvuvib對變量 , 有觀測數(shù)據(jù), , ,得散點圖;對變量 , 有觀測數(shù)據(jù), , ,得散點圖由這兩個散點圖可以 (寧夏卷判斷海南A.B.C.D.xyuvxyuvxyuvxyuv變量 與 正相關, 與 正相關變量 與 正相關, 與 負相關變量 與 負相關, 與 正相關變量 與 負相關, 與 負相關 u.Cvaxyxybuv由圖中的數(shù)據(jù)隨著 的增大而 減小,因此變量 與 負相關;由圖中的數(shù)據(jù)隨著 的增大而增大,因此變量 與 正相解關,選析 14373.22要研究病人中的禿頂和患心臟病之間的關系,在某醫(yī)院隨機抽取了名男性病人,得到如下列聯(lián)表:患心臟病患
3、其他病合計禿頂214175389不禿頂4515971048合計66577214372222 .6.6350.010 ()(.)()()()()KP Kn adbcKacbdabcd由表中數(shù)據(jù)計算得 若,則有以上的把握認為“禿頂與患心臟病有關”參考公式16.3799%2Kabcdn雖的計算公式不要求記憶,但公式中 、 、 、 、 的意義易弄錯,同時對應的把握百分率也易計易錯點:算錯誤(4.)()4yx某單位為了了解用電量單位:度 與氣溫單位:之間的關系,隨機統(tǒng)計了某 天的用電量與當天的氣溫,并制作了對照表如下:氣溫()181310-1用電量(度)2434386410402604246068.xy
4、yx+aa=xy 由表中數(shù)據(jù)可得,將其代入,可得,故當時,解析:24 ybx + ab 由表中數(shù)據(jù)得線性回歸方程,求得,現(xiàn)預測當氣溫為時,用電量約為 度()x y不會應用回歸直線必過點 ,而應用系數(shù)公式計算繁雜或計易錯點:算錯誤_1._.如果兩個變量之間確實存在關系,但又沒有函數(shù)關系所具有的確定性,它們的關系帶有隨機性,則稱這兩個變量具有有相關關系的兩個變量,若一個變量的值由小到大時,另一個變量的值也是由小到大,這種相關稱為;反之,一個變量的值由小到大,另一個變量的值由大到小,兩個變量間的相關這種相關稱為關系1121_._,2nniiiiiiniiybxaxxyyx ynxybxx 在平面直角
5、坐標系中描點,得到關于兩個變量的一組數(shù)據(jù)的圖形,這樣的圖形叫做如果散點圖中,相應于具有相關關系的兩個變量所有觀察值的數(shù)據(jù)點,分布在一條直線附近,則稱這兩個變量具有,這條直線叫做,方程為其中散點圖221,niiaybxxnx, 2ii112211Q_.1.304niniiinniiiiybxax ynx yrxxyyr使殘差平方和為最小的方法,叫做樣本的相關系數(shù)當時最小二乘法線性回歸,表示兩個模型變量正相關, 212101r02()3_.iniiiiniiirry = bx + a + e eyyeyyyy當時,表示兩個變量負相關, 越近于 ,表明兩個變量的線性相關性越強: 越近于 ,表明兩個變
6、量之間幾乎不存在線性相關關系線性回歸模型為隨機誤差 總體偏差平方和,殘差,殘差平方和,回歸平方和(5)n即列出兩個分類變量的頻率表其中 為列聯(lián)表樣本容量AA合計Baba+bcdc+d合計a+cb+dnB2222226.2.706Kn adbcKabacbdcdxyKKxyK利用隨機變量進行判斷檢驗先假設兩個分類變量 與 無關系,若的值較大,則拒絕假設,只要,就認為 與 有關系利用來確定在多大程度可以認為“兩個分類變量有關系”的方法稱為獨立性檢驗相關關系;正相關;負相關;散點圖;線性相關關系;回歸直線;最小二乘法;總偏差平方【要和殘點指南】差平方和 ()(/)()A.10200B.10200C.
7、10200D.(2011020010)yxyxyxyxyx某商品銷量 件與銷售價格元 件負相關,則其回歸方程可能是例1湖南卷題型一題型一 變量的相關性變量的相關性 2005 2009()()_2xy某市居民年家庭平均收入 單位:萬元與年平均支出 單位:萬元的統(tǒng)計資料如下表所示:根據(jù)統(tǒng)計資料,居民家庭年平均收入的中位數(shù)是,家庭年平均收入與支出有線性相關關系年份20052006200720082009收入x11.512.11313.315支出y6.88.89.81012 1BDCA. 213xy13由圖象知選項 、 為正相關,選 不符合實際意義,故選由表中所給的數(shù)據(jù)知所求的中位數(shù)為 ,畫出 與 的
8、散點圖知它們有較強的線性相關關系,故應填、解析:較強的 評析:變量間是否具有線性相關關系,通常是依據(jù)統(tǒng)計數(shù)據(jù)作出其散點圖判定 A1B1CD1汽車的重量和汽車消耗一升汽油所行駛的路程成負相關,這說明汽車越重,每消耗升汽油所行駛變式:的路程越短汽車越輕,每消耗升汽油所行駛的路程越短汽車越重,消耗汽油越多汽車越輕,消耗汽油越多A ( )(2.)xy下表提供了某廠節(jié)能降耗技術改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)例量 噸與相應的生產(chǎn)能耗 噸標準煤的幾組對照數(shù)據(jù)題型二題型二 線性回歸方程的求法及回歸分析線性回歸方程的求法及回歸分析x3456y2.5344.5 ( )(2.)xy下表提供了某廠節(jié)能降耗技術改造后生
9、產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)例量 噸與相應的生產(chǎn)能耗 噸標準煤的幾組對照數(shù)據(jù)題型二題型二 線性回歸方程的求法及回歸分析線性回歸方程的求法及回歸分析x3456y2.5344.5 1.2100901100yxyabx請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出 關于的線性回歸方程已知該廠技改前噸甲產(chǎn)品的生產(chǎn)能耗為 噸標準煤,試根據(jù)求出的線性回歸方程,預測生產(chǎn)噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低多少噸標準煤? 41422114.53.540.70.35,40.350.7 .290(0.350.7 100)19.65 ()19.65iiiiixyx yxybaybxxxyx因為,所以,所以因為噸,所以生產(chǎn)能耗比技改前節(jié)
10、省了噸解析:標準煤 評析:回歸分析在生產(chǎn)和生活中的應用是依據(jù)已知的統(tǒng)計數(shù)據(jù)判定是否具有相關關系,如果具有較強的相關關系,則由回歸方程可預測未來2.xy某車間為了規(guī)定工時定額,需要確定加工零件所花費的時間,為此做了四次試驗,根據(jù)試驗數(shù)據(jù)得到如下圖所示的散點圖,其中 表示零件的個數(shù), 表示加變式工時間 1210yxybxa求出 關于 的線性回歸方程;試預測加工個零件需多長時間? 42142222222123452.5344.513.53.544422.53 34454.543.50.7,234543.543.50.73.51.05,0.71.05.2100.7 101.058.0510iiiixy
11、xiyxybxxaybxyxx ,所以所以線性回歸方程為當時,故加工個解析:零件大約需8.05小時()3.20某學校課題組為了研究學生的數(shù)學成績與物理成績之間的關系,隨機抽取高二年級名學生某次考試變式成績 百分制 如下表所示:序號12345678910數(shù)學成績9575 8094926567849871物理成績9063 7287917158829381序號1112 1314151617181920數(shù)學成績6793 6478779057837283物理成績7782 4885699161847886 90(90)85(85)122若數(shù)學成績分 含分 以上為優(yōu)秀,物理成績分含分 以上為優(yōu)秀 根據(jù)上表完
12、成下面的列聯(lián)表;數(shù)學成績優(yōu)秀數(shù)學成績不優(yōu)秀合計物理成績優(yōu)秀物理成績不優(yōu)秀12合計20 2221()n adbcKac bdab cd 根據(jù)中表格的數(shù)據(jù)計算,有多大的把握認為學生的數(shù)學成績與物理成績之間有關系?參考公式 1 22 列聯(lián)表補充解析:完整如下:數(shù)學成績優(yōu)秀數(shù)學成績不優(yōu)秀物理成績優(yōu)秀52物理成績不優(yōu)秀112合計614 022202205 12 1 28.802.6 14 7 137.8790.0058.8027.87999.5%HKHK 提出假設:學生的數(shù)學成績與物理成績之間沒有關系根據(jù)上述列聯(lián)表可以求得當成立時,的概率約為,而這里,所以我們有的把握認為“學生的數(shù)學成績與物理成績之間有
13、關系” 評析:有關22聯(lián)列表的獨立性檢驗問題系新課標新增考點,近年新課標命題省市常有考查,求解時一定要細心,計算一定要準確 124704327211222.在對人群的休閑方式的一次調(diào)查中,共調(diào)查了人,其中女性人,女性中有人主要的休閑方式是看電視,另外人主要的休閑方式是運動;男性中人主要的休閑方式是看電視,其余男性的主要休閑方式是運動根據(jù)以上數(shù)據(jù)建立一個列聯(lián)表;判斷性別與休閑方式是否有關系,并變式4說明理由 1 22解析:列聯(lián)表為看電視運動總計女432770男213354合計6460124 222100222124433327216.2.70546460H(5.024)0.025.97.5%n
14、adbcKabcdacbdHHKP K 設:性別與不同休閑方式有關系假設:性別與不同的休閑方式?jīng)]有關系,在的前提下,應該很小,而所以有的把握認為性別與不同的休閑方式之間有關系 1242.5602yxxyx下面是兩個變量間的一組數(shù)據(jù):在同一直角坐標系中畫出散點圖、直備線和曲線選例題;x1.04.06.010.014.0y19.044.040.052.053.0 235x比較所畫直線與曲線,哪一條更能表現(xiàn)這組數(shù)據(jù)之間的關系?分別計算用直線方程與曲線方程得到在 個 點處的預測值與實際預測之間的誤差,比較兩個誤差絕對值之和的大小 1 所 求 作解 析 :圖 型 如 下 : 602242.523242.
15、56027.512.52xyxxyxxyx從圖形上看,曲線比直線更能表現(xiàn)這組數(shù)據(jù)間的關系用直線近似數(shù)據(jù)時,誤差絕對值的和為,用曲線時,誤差絕對值的和為,比前者解析:小得多1計算回歸直線方程中的參數(shù) 、 時應分層進行,避免因計算錯誤而產(chǎn)生誤差2求線性回歸方程之前,應對數(shù)據(jù)利用散點圖進行線性相關分析3回歸分析的關鍵是根據(jù)散點圖選擇函數(shù)模型,用相關系數(shù)判定哪種模型更好4獨立性檢驗不能用比例余數(shù)來判定,a、b、c、d成比例擴大,K2的值是不同的,正確列出22列聯(lián)表是解題的關鍵,準確計算K2的值是重點ba500為調(diào)查某地區(qū)老年人是否需要志愿者提供幫助,用簡單隨機抽樣方法從該地區(qū)調(diào)查了位老年人,調(diào)查結果如
16、下:是否需要志愿者性別男女需要4030不需要160270 221299%n adncKab cdac bd 估計該地區(qū)老年人中需要志愿者提供幫助的老年人的比例; 能否有的把握認為該地區(qū)的老年人是否需要志愿者提供幫助與性別有關?附:P(K2k)0.0500.0100.001k3.8416.63510.828 2221403036.1%.1602702500195004027030160703002004309.967.(6.635)0.011%KP K 依題意,需要幫助的老年人的比例的估計值為由于調(diào)查的人中,男性老年人需要幫助的比例為,大于女性老年人需要幫助的比例,可知需要志愿者幫錯解助與性別有
17、關系,且而,故只有的把握認為需要幫:助與性別有關 212(6.635)0.010P K題意理解錯誤,所求的比例估計值是全體調(diào)查人員的比例,而非男、女兩類人員的比例,且所求比例也錯誤不是男、女的比例和對照數(shù)據(jù)是沒有關系的概率,而非有關分析:系的概率 2221500707014%.500500402703016029.96720030070430(6.635)0.0199%KP K 調(diào)查的位老年人中有位需要志愿者提供幫助,因此該地區(qū)的老年人中,需要幫助的老年人的比例的估計值為由于,所以有的把握認為該地區(qū)的老年人是否需要幫助與性正解:別有關 2BAAB通過觀察莖葉圖,可以發(fā)現(xiàn):品種 的平均畝產(chǎn)量比品種的平均畝產(chǎn)量高品種 的畝產(chǎn)量不夠穩(wěn)定,而品種 的畝產(chǎn)量比較集中在平均畝產(chǎn)量附近