2018-2019學(xué)年高中數(shù)學(xué)第3章統(tǒng)計(jì)案例3.2回歸分析課件新人教B版選修2 .ppt
第三章,統(tǒng)計(jì)案例,3.2 回歸分析,學(xué)習(xí)目標(biāo) 1.會(huì)建立線性回歸模型分析兩個(gè)變量間的相關(guān)關(guān)系. 2.能通過(guò)相關(guān)系數(shù)判斷兩個(gè)變量間的線性相關(guān)程度.,1,預(yù)習(xí)導(dǎo)學(xué) 挑戰(zhàn)自我,點(diǎn)點(diǎn)落實(shí),2,課堂講義 重點(diǎn)難點(diǎn),個(gè)個(gè)擊破,3,當(dāng)堂檢測(cè) 當(dāng)堂訓(xùn)練,體驗(yàn)成功,知識(shí)鏈接 1.什么叫回歸分析? 答 回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種方法.,2.回歸分析中,利用線性回歸方程求出的函數(shù)值一定是真實(shí)值嗎? 答 不一定是真實(shí)值,利用線性回歸方程求的值,在很多時(shí)候是個(gè)預(yù)報(bào)值,例如,人的體重與身高存在一定的線性關(guān)系,但體重除了受身高的影響外,還受其他因素的影響,如飲食、是否喜歡運(yùn)動(dòng)等.,預(yù)習(xí)導(dǎo)引,2.相關(guān)系數(shù) 對(duì)于變量x與y隨機(jī)抽到的n對(duì)數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn),檢測(cè)統(tǒng)計(jì)量是樣本相關(guān)系數(shù),相關(guān)系數(shù)r的取值范圍是 ,|r|越接近1,變量之間的線性相關(guān)程度越高,|r|越接近0,線性相關(guān)程度越弱,當(dāng)|r|> 時(shí),有95%的把握認(rèn)為兩個(gè)變量之間有線性相關(guān)關(guān)系.,1,1,r0.05,3.非線性回歸分析 回歸曲線方程也可以線性化 (1)將冪函數(shù)型函數(shù)yaxn(a為常數(shù),a,x,y均取正值)化為線性函數(shù): 將yaxn兩邊取常用對(duì)數(shù),則有l(wèi)g ynlg xlg a,令lg y,vlg x,blg a,代入上式得nvb(其中n、b是常數(shù)),其圖象是一條直線.,(2)將指數(shù)型函數(shù)ycax(a0,c0,a,c為常數(shù))化為線性函數(shù); 將ycax兩邊取常用對(duì)數(shù),則有l(wèi)g yxlg alg c,令lg y,blg c,dlg a,代入上式得dxb(d,b是常數(shù)),它的圖象是一條直線.,要點(diǎn)一 求線性回歸方程 例1 某班5名學(xué)生的數(shù)學(xué)和物理成績(jī)?nèi)缦卤恚?(1)畫出散點(diǎn)圖; 解 散點(diǎn)圖如圖.,(2)求物理成績(jī)y對(duì)數(shù)學(xué)成績(jī)x的回歸直線方程;,(3)一名學(xué)生的數(shù)學(xué)成績(jī)是96,試預(yù)測(cè)他的物理成績(jī).,即可以預(yù)測(cè)他的物理成績(jī)是82.,規(guī)律方法 (1)散點(diǎn)圖是定義在具有相關(guān)關(guān)系的兩個(gè)變量基礎(chǔ)上的,對(duì)于性質(zhì)不明確的兩組數(shù)據(jù),可先作散點(diǎn)圖,在圖上看它們有無(wú)關(guān)系,關(guān)系的密切程度,然后再進(jìn)行相關(guān)回歸分析. (2)求回歸直線方程,首先應(yīng)注意到,只有在散點(diǎn)圖大致呈線性時(shí),求出的回歸直線方程才有實(shí)際意義,否則,求出的回歸直線方程毫無(wú)意義.,跟蹤演練1 某研究機(jī)構(gòu)對(duì)高三學(xué)生的記憶力x和判斷力y進(jìn)行統(tǒng)計(jì)分析,得下表數(shù)據(jù):,(1)請(qǐng)畫出上表數(shù)據(jù)的散點(diǎn)圖(要求:點(diǎn)要描粗); 解 如圖:,(3)試根據(jù)求出的線性回歸方程,預(yù)測(cè)記憶力為9的同學(xué)的判斷力.,要點(diǎn)二 相關(guān)性檢驗(yàn) 例2 下面的數(shù)據(jù)是從年齡在40到60歲的男子中隨機(jī)抽出的6個(gè)樣本,分別測(cè)定了心臟的功能水平y(tǒng)(滿分100)以及每天花在看電視上的平均時(shí)間x(小時(shí)).,(1)求心臟的功能水平y(tǒng)與每天花在看電視上的平均時(shí)間x之間的樣本相關(guān)系數(shù)r;,心臟的功能水平y(tǒng)與每天花在看電視上的平均時(shí)間x之間的相關(guān)系數(shù),(2)求心臟的功能水平y(tǒng)與每天花在看電視上的平均時(shí)間x的線性回歸方程,并討論方程是否有意義;,查表n24,r0.050.811,因?yàn)閨r|0.902 5>0.811, 所以有95%以上的把握認(rèn)為y與x之間有線性關(guān)系,這個(gè)方程是有意義的.,(3)估計(jì)平均每天看電視3小時(shí)的男子的心臟的功能水平.,因此估計(jì)平均每天看電視3小時(shí)的男子的心臟的功能水平為69分.,規(guī)律方法 解決這一類問(wèn)題時(shí),首先應(yīng)對(duì)問(wèn)題進(jìn)行必要的相關(guān)性檢驗(yàn),如果不作相關(guān)性檢驗(yàn),我們?nèi)匀豢梢郧蟪鰔與y的線性回歸方程,但不知道這時(shí)的線性回歸方程是否有意義,也就不知道能否反映變量x與y之間的變化規(guī)律,只有在x與y之間具有相關(guān)關(guān)系時(shí),求得的線性回歸方程才有意義.,跟蹤演練2 維尼綸纖維的耐熱水性能的好壞可以用指標(biāo)“縮醛化度”y來(lái)衡量,這個(gè)指標(biāo)越高,耐熱水性能也越好,而甲醛濃度是影響縮醛化度的重要因素,在生產(chǎn)中常用甲醛濃度x(g/L)去控制這一指標(biāo),為此必須找出它們之間的關(guān)系,現(xiàn)安排一批實(shí)驗(yàn),獲得如下數(shù)據(jù).,(1)畫散點(diǎn)圖; 解,(2)求線性回歸方程; 解 列表:,0.264 3,,(3)求相關(guān)系數(shù)r,并進(jìn)行相關(guān)性檢驗(yàn).,0.96. 計(jì)算得r0.96>r0.050.754.說(shuō)明甲醛濃度與縮醛化度兩個(gè)變量之間有較強(qiáng)的線性相關(guān)關(guān)系.,要點(diǎn)三 非線性回歸模型 例3 某地區(qū)不同身高的未成年男性的體重平均值如下表:,試建立y與x之間的回歸方程.,解 根據(jù)上表中數(shù)據(jù)畫出散點(diǎn)圖如圖所示.,由圖看出,樣本點(diǎn)分布在某條指數(shù)型函數(shù)曲線yc1e 的周圍,于是令zln y.由計(jì)算器計(jì)算可得下表,,c2x,畫出散點(diǎn)圖如圖所示.,由表中數(shù)據(jù)可得z與x之間的回歸直線方程:,規(guī)律方法 根據(jù)已有的函數(shù)知識(shí),可以發(fā)現(xiàn)樣本分布在某一條指數(shù)型函數(shù)曲線yc1e 的周圍,其中c1和c2是待定參數(shù);可以通過(guò)對(duì)x進(jìn)行對(duì)數(shù)變換,轉(zhuǎn)化為線性相關(guān)關(guān)系.,c2x,跟蹤演練3 某種書每?jī)?cè)的成本費(fèi)Y(元)與印刷冊(cè)數(shù)x(千冊(cè))有關(guān),經(jīng)統(tǒng)計(jì)得到數(shù)據(jù)如下:,檢驗(yàn)每?jī)?cè)書的成本費(fèi)Y與印刷冊(cè)數(shù)的倒數(shù) 之間是否具有線性相關(guān)關(guān)系?若有,求出Y對(duì)x的回歸方程;若無(wú),說(shuō)明理由.,解 設(shè),則Y與的數(shù)據(jù)關(guān)系如下表所示:,經(jīng)過(guò)計(jì)算r0.999 8>r0.050.632. 從而有95%的把握認(rèn)為這兩個(gè)變量具有線性相關(guān)關(guān)系,從而求Y與的回歸直線方程有意義.,1.下列各組變量之間具有線性相關(guān)關(guān)系的是( ) A.出租車費(fèi)與行駛的里程 B.學(xué)習(xí)成績(jī)與學(xué)生身高 C.身高與體重 D.鐵的體積與質(zhì)量,1,2,3,4,C,1,2,3,4,2.若勞動(dòng)生產(chǎn)率x(千元)與月工資y(元)之間的線性回歸方程為 5080 x,則下列判斷正確的是( ) A.勞動(dòng)生產(chǎn)率為1 000元時(shí),月工資為130元 B.勞動(dòng)生產(chǎn)率提高1 000元時(shí),月工資平均提高80元 C.勞動(dòng)生產(chǎn)率提高1 000元時(shí),月工資平均提高130元 D.月工資為210元時(shí),勞動(dòng)生產(chǎn)率為2 000元,B,1,2,3,4,1,2,3,4,解析 由于銷售量y與銷售價(jià)格x成負(fù)相關(guān),故排除B、D. 又當(dāng)x10時(shí),A中y100,而C中y300,C不符合實(shí)際情況,故選A. 答案 A,4.某電腦公司有6名產(chǎn)品推銷員,其工作年限與年推銷金額數(shù)據(jù)如下表:,1,2,3,4,1,2,3,4,(1)求年推銷金額y關(guān)于工作年限x的線性回歸方程;,1,2,3,4,1,2,3,4,(2)若第6名推銷員的工作年限為11年,試估計(jì)他的年推銷金額.,所以可以估計(jì)第6名推銷員的年推銷金額為5.9萬(wàn)元.,課堂小結(jié) 回歸分析的基本思路: (1)確定研究對(duì)象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是預(yù)報(bào)變量; (2)畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等);,