2019-2020年高中數(shù)學(xué) 統(tǒng)計(jì) 板塊四 統(tǒng)計(jì)數(shù)據(jù)的數(shù)字特征完整講義(學(xué)生版).doc
《2019-2020年高中數(shù)學(xué) 統(tǒng)計(jì) 板塊四 統(tǒng)計(jì)數(shù)據(jù)的數(shù)字特征完整講義(學(xué)生版).doc》由會(huì)員分享,可在線閱讀,更多相關(guān)《2019-2020年高中數(shù)學(xué) 統(tǒng)計(jì) 板塊四 統(tǒng)計(jì)數(shù)據(jù)的數(shù)字特征完整講義(學(xué)生版).doc(6頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
2019-2020年高中數(shù)學(xué) 統(tǒng)計(jì) 板塊四 統(tǒng)計(jì)數(shù)據(jù)的數(shù)字特征完整講義(學(xué)生版) 知識(shí)內(nèi)容 一.隨機(jī)抽樣 1.隨機(jī)抽樣:滿足每個(gè)個(gè)體被抽到的機(jī)會(huì)是均等的抽樣,共有三種經(jīng)常采用的隨機(jī)抽樣方法: ⑴簡單隨機(jī)抽樣:從元素個(gè)數(shù)為的總體中不放回地抽取容量為的樣本,如果每一次抽取時(shí)總體中的各個(gè)個(gè)體有相同的可能性被抽到,這種抽樣方法叫做簡單隨機(jī)抽樣. 抽出辦法:①抽簽法:用紙片或小球分別標(biāo)號(hào)后抽簽的方法. ②隨機(jī)數(shù)表法:隨機(jī)數(shù)表是使用計(jì)算器或計(jì)算機(jī)的應(yīng)用程序生成隨機(jī)數(shù)的功能生成的一張數(shù)表.表中每一位置出現(xiàn)各個(gè)數(shù)字的可能性相同. 隨機(jī)數(shù)表法是對(duì)樣本進(jìn)行編號(hào)后,按照一定的規(guī)律從隨機(jī)數(shù)表中讀數(shù),并取出相應(yīng)的樣本的方法. 簡單隨機(jī)抽樣是最簡單、最基本的抽樣方法. ⑵系統(tǒng)抽樣:將總體分成均衡的若干部分,然后按照預(yù)先制定的規(guī)則,從每一部分抽取一個(gè)個(gè)體,得到所需要的樣本的抽樣方法. 抽出辦法:從元素個(gè)數(shù)為的總體中抽取容量為的樣本,如果總體容量能被樣本容量整除,設(shè),先對(duì)總體進(jìn)行編號(hào),號(hào)碼從到,再從數(shù)字到中隨機(jī)抽取一個(gè)數(shù)作為起始數(shù),然后順次抽取第個(gè)數(shù),這樣就得到容量為的樣本.如果總體容量不能被樣本容量整除,可隨機(jī)地從總體中剔除余數(shù),然后再按系統(tǒng)抽樣方法進(jìn)行抽樣. 系統(tǒng)抽樣適用于大規(guī)模的抽樣調(diào)查,由于抽樣間隔相等,又被稱為等距抽樣. ⑶分層抽樣:當(dāng)總體有明顯差別的幾部分組成時(shí),要反映總體情況,常采用分層抽樣,使總體中各個(gè)個(gè)體按某種特征分成若干個(gè)互不重疊的幾部分,每一部分叫做層,在各層中按層在總體中所占比例進(jìn)行簡單隨機(jī)抽樣,這種抽樣方法叫做分層抽樣. 分層抽樣的樣本具有較強(qiáng)的代表性,而且各層抽樣時(shí),可靈活選用不同的抽樣方法,應(yīng)用廣泛. 2.簡單隨機(jī)抽樣必須具備下列特點(diǎn): ⑴簡單隨機(jī)抽樣要求被抽取的樣本的總體個(gè)數(shù)是有限的. ⑵簡單隨機(jī)樣本數(shù)小于等于樣本總體的個(gè)數(shù). ⑶簡單隨機(jī)樣本是從總體中逐個(gè)抽取的. ⑷簡單隨機(jī)抽樣是一種不放回的抽樣. ⑸簡單隨機(jī)抽樣的每個(gè)個(gè)體入樣的可能性均為. 3.系統(tǒng)抽樣時(shí),當(dāng)總體個(gè)數(shù)恰好是樣本容量的整數(shù)倍時(shí),?。? 若不是整數(shù)時(shí),先從總體中隨機(jī)地剔除幾個(gè)個(gè)體,使得總體中剩余的個(gè)體數(shù)能被樣本容量整除.因?yàn)槊總€(gè)個(gè)體被剔除的機(jī)會(huì)相等,因而整個(gè)抽樣過程中每個(gè)個(gè)體被抽取的機(jī)會(huì)仍然相等,為. 二.頻率直方圖 列出樣本數(shù)據(jù)的頻率分布表和頻率分布直方圖的步驟: ①計(jì)算極差:找出數(shù)據(jù)的最大值與最小值,計(jì)算它們的差; ②決定組距與組數(shù):取組距,用決定組數(shù); ③決定分點(diǎn):決定起點(diǎn),進(jìn)行分組; ④列頻率分布直方圖:對(duì)落入各小組的數(shù)據(jù)累計(jì),算出各小數(shù)的頻數(shù),除以樣本容量,得到各小組的頻率. ⑤繪制頻率分布直方圖:以數(shù)據(jù)的值為橫坐標(biāo),以的值為縱坐標(biāo)繪制直方圖, 知小長方形的面積=組距=頻率. 頻率分布折線圖:將頻率分布直方圖各個(gè)長方形上邊的中點(diǎn)用線段連接起來,就得到頻率分布折線圖,一般把折線圖畫成與橫軸相連,所以橫軸左右兩端點(diǎn)沒有實(shí)際意義. 總體密度曲線:樣本容量不斷增大時(shí),所分組數(shù)不斷增加,分組的組距不斷縮小,頻率分布直方圖可以用一條光滑曲線來描繪,這條光滑曲線就叫做總體密度曲線.總體密度曲線精確地反映了一個(gè)總體在各個(gè)區(qū)域內(nèi)取值的規(guī)律. 三.莖葉圖 制作莖葉圖的步驟: ①將數(shù)據(jù)分為“莖”、“葉”兩部分; ②將最大莖與最小莖之間的數(shù)字按大小順序排成一列,并畫上豎線作為分隔線; ③將各個(gè)數(shù)據(jù)的“葉”在分界線的一側(cè)對(duì)應(yīng)莖處同行列出. 四.統(tǒng)計(jì)數(shù)據(jù)的數(shù)字特征 用樣本平均數(shù)估計(jì)總體平均數(shù);用樣本標(biāo)準(zhǔn)差估計(jì)總體標(biāo)準(zhǔn)差. 數(shù)據(jù)的離散程序可以用極差、方差或標(biāo)準(zhǔn)差來描述. 極差又叫全距,是一組數(shù)據(jù)的最大值和最小值之差,反映一組數(shù)據(jù)的變動(dòng)幅度; 樣本方差描述了一組數(shù)據(jù)平均數(shù)波動(dòng)的大小,樣本的標(biāo)準(zhǔn)差是方差的算術(shù)平方根. 一般地,設(shè)樣本的元素為樣本的平均數(shù)為, 定義樣本方差為, 樣本標(biāo)準(zhǔn)差 簡化公式:. 五.獨(dú)立性檢驗(yàn) 1.兩個(gè)變量之間的關(guān)系; 常見的有兩類:一類是確定性的函數(shù)關(guān)系;另一類是變量間存在關(guān)系,但又不具備函數(shù)關(guān)系所要求的確定性,它們的關(guān)系是帶有一定隨機(jī)性的.當(dāng)一個(gè)變量取值一定時(shí),另一個(gè)變量的取值帶有一定隨機(jī)性的兩個(gè)變量之間的關(guān)系叫做相關(guān)關(guān)系. 2.散點(diǎn)圖:將樣本中的個(gè)數(shù)據(jù)點(diǎn)描在平面直角坐標(biāo)系中,就得到了散點(diǎn)圖. 散點(diǎn)圖形象地反映了各個(gè)數(shù)據(jù)的密切程度,根據(jù)散點(diǎn)圖的分布趨勢可以直觀地判斷分析兩個(gè)變量的關(guān)系. 3.如果當(dāng)一個(gè)變量的值變大時(shí),另一個(gè)變量的值也在變大,則這種相關(guān)稱為正相關(guān);此時(shí),散點(diǎn)圖中的點(diǎn)在從左下角到右上角的區(qū)域. 反之,一個(gè)變量的值變大時(shí),另一個(gè)變量的值由大變小,這種相關(guān)稱為負(fù)相關(guān).此時(shí),散點(diǎn)圖中的點(diǎn)在從左上角到右下角的區(qū)域. 散點(diǎn)圖可以判斷兩個(gè)變量之間有沒有相關(guān)關(guān)系. 4.統(tǒng)計(jì)假設(shè):如果事件與獨(dú)立,這時(shí)應(yīng)該有,用字母表示此式,即,稱之為統(tǒng)計(jì)假設(shè). 5.(讀作“卡方”)統(tǒng)計(jì)量: 統(tǒng)計(jì)學(xué)中有一個(gè)非常有用的統(tǒng)計(jì)量,它的表達(dá)式為,用它的大小可以用來決定是否拒絕原來的統(tǒng)計(jì)假設(shè).如果的值較大,就拒絕,即認(rèn)為與是有關(guān)的. 統(tǒng)計(jì)量的兩個(gè)臨界值:、;當(dāng)時(shí),有的把握說事件與有關(guān);當(dāng)時(shí),有的把握說事件與有關(guān);當(dāng)時(shí),認(rèn)為事件與是無關(guān)的. 獨(dú)立性檢驗(yàn)的基本思想與反證法類似,由結(jié)論不成立時(shí)推出有利于結(jié)論成立的小概率事件發(fā)生,而小概率事件在一次試驗(yàn)中通常是不會(huì)發(fā)生的,所以認(rèn)為結(jié)論在很大程度上是成立的. 1.獨(dú)立性檢驗(yàn)的步驟:統(tǒng)計(jì)假設(shè):;列出聯(lián)表;計(jì)算統(tǒng)計(jì)量;查對(duì)臨界值表,作出判斷. 2.幾個(gè)臨界值:. 聯(lián)表的獨(dú)立性檢驗(yàn): 如果對(duì)于某個(gè)群體有兩種狀態(tài),對(duì)于每種狀態(tài)又有兩個(gè)情況,這樣排成一張的表,如下: 狀態(tài) 狀態(tài) 合計(jì) 狀態(tài) 狀態(tài) 如果有調(diào)查得來的四個(gè)數(shù)據(jù),并希望根據(jù)這樣的個(gè)數(shù)據(jù)來檢驗(yàn)上述的兩種狀態(tài)與是否有關(guān),就稱之為聯(lián)表的獨(dú)立性檢驗(yàn). 六.回歸分析 1.回歸分析:對(duì)于具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的方法叫做回歸分析,即回歸分析就是尋找相關(guān)關(guān)系中這種非確定關(guān)系的某種確定性. 回歸直線:如果散點(diǎn)圖中的各點(diǎn)都大致分布在一條直線附近,就稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線. 2.最小二乘法: 記回歸直線方程為:,稱為變量對(duì)變量的回歸直線方程,其中叫做回歸系數(shù). 是為了區(qū)分的實(shí)際值,當(dāng)取值時(shí),變量的相應(yīng)觀察值為,而直線上對(duì)應(yīng)于的縱坐標(biāo)是. 設(shè)的一組觀察值為,,且回歸直線方程為, 當(dāng)取值時(shí),的相應(yīng)觀察值為,差刻畫了實(shí)際觀察值與回歸直線上相應(yīng)點(diǎn)的縱坐標(biāo)之間的偏離程度,稱這些值為離差. 我們希望這個(gè)離差構(gòu)成的總離差越小越好,這樣才能使所找的直線很貼近已知點(diǎn). 記,回歸直線就是所有直線中取最小值的那條. 這種使“離差平方和為最小”的方法,叫做最小二乘法. 用最小二乘法求回歸系數(shù)有如下的公式: ,,其中上方加“”,表示是由觀察值按最小二乘法求得的回歸系數(shù). 3.線性回歸模型:將用于估計(jì)值的線性函數(shù)作為確定性函數(shù);的實(shí)際值與估計(jì)值之間的誤差記為,稱之為隨機(jī)誤差;將稱為線性回歸模型. 產(chǎn)生隨機(jī)誤差的主要原因有: ①所用的確定性函數(shù)不恰當(dāng)即模型近似引起的誤差; ②忽略了某些因素的影響,通常這些影響都比較?。? ③由于測量工具等原因,存在觀測誤差. 4.線性回歸系數(shù)的最佳估計(jì)值: 利用最小二乘法可以得到的計(jì)算公式為 ,,其中, 由此得到的直線就稱為回歸直線,此直線方程即為線性回歸方程.其中,分別為,的估計(jì)值,稱為回歸截距,稱為回歸系數(shù),稱為回歸值. 5.相關(guān)系數(shù): 6.相關(guān)系數(shù)的性質(zhì): ⑴; ⑵越接近于1,的線性相關(guān)程度越強(qiáng); ⑶越接近于0,的線性相關(guān)程度越弱. 可見,一條回歸直線有多大的預(yù)測功能,和變量間的相關(guān)系數(shù)密切相關(guān). 7.轉(zhuǎn)化思想: 根據(jù)專業(yè)知識(shí)或散點(diǎn)圖,對(duì)某些特殊的非線性關(guān)系,選擇適當(dāng)?shù)淖兞看鷵Q,把非線性方程轉(zhuǎn)化為線性回歸方程,從而確定未知參數(shù). 8.一些備案 ①回歸(regression)一詞的來歷:“回歸”這個(gè)詞英國統(tǒng)計(jì)學(xué)家Francils Galton提出來的.1889年,他在研究祖先與后代的身高之間的關(guān)系時(shí)發(fā)現(xiàn),身材較高的父母,他們的孩子也較高,但這些孩子的平均身高并沒有他們父母的平均身高高;身材較矮的父母,他們的孩子也較矮,但這些孩子的平均身高卻比他們父母的平均身高高.Galton把這種后代的身高向中間值靠近的趨勢稱為“回歸現(xiàn)象”.后來,人們把由一個(gè)變量的變化去推測另一個(gè)變量的變化的方法稱為回歸分析. ②回歸系數(shù)的推導(dǎo)過程: , 把上式看成的二次函數(shù),的系數(shù), 因此當(dāng)時(shí)取最小值. 同理,把的展開式按的降冪排列,看成的二次函數(shù),當(dāng)時(shí)取最小值. 解得:,, 其中,是樣本平均數(shù). 9. 對(duì)相關(guān)系數(shù)進(jìn)行相關(guān)性檢驗(yàn)的步驟: ①提出統(tǒng)計(jì)假設(shè):變量不具有線性相關(guān)關(guān)系; ②如果以的把握作出推斷,那么可以根據(jù)與(是樣本容量)在相關(guān)性檢驗(yàn)的臨界值表中查出一個(gè)的臨界值(其中稱為檢驗(yàn)水平); ③計(jì)算樣本相關(guān)系數(shù); ④作出統(tǒng)計(jì)推斷:若,則否定,表明有的把握認(rèn)為變量與之間具有線性相關(guān)關(guān)系;若,則沒有理由拒絕,即就目前數(shù)據(jù)而言,沒有充分理由認(rèn)為變量與之間具有線性相關(guān)關(guān)系. 說明: ⑴對(duì)相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn),一般取檢驗(yàn)水平,即可靠程度為. ⑵這里的指的是線性相關(guān)系數(shù),的絕對(duì)值很小,只是說明線性相關(guān)程度低,不一定不相關(guān),可能是非線性相關(guān)的某種關(guān)系. ⑶這里的是對(duì)抽樣數(shù)據(jù)而言的.有時(shí)即使,兩者也不一定是線性相關(guān)的.故在統(tǒng)計(jì)分析時(shí),不能就數(shù)據(jù)論數(shù)據(jù),要結(jié)合實(shí)際情況進(jìn)行合理解釋. 典例分析 題型一.?dāng)?shù)字特征的計(jì)算 【例1】 (xx海淀二模) 某校高中年級(jí)開設(shè)了豐富多彩的校本課程,甲、乙兩班各隨機(jī)抽取了5名學(xué)生的學(xué)分,用莖葉圖表示(如右圖).,分別表示甲、乙兩班各自5名學(xué)生學(xué)分的標(biāo)準(zhǔn)差,則 .(填“”、“”或“”) 【例2】 (xx崇文二模) 甲、乙、丙三名射擊運(yùn)動(dòng)員在某次測試中各射擊20次,三人的測試成績?nèi)缦卤? 甲的成績 環(huán)數(shù) 7 8 9 10 頻數(shù) 5 5 5 5 乙的成績 環(huán)數(shù) 7 8 9 10 頻數(shù) 6 4 4 6 丙的成績 環(huán)數(shù) 7 8 9 10 頻數(shù) 4 6 6 4 分別表示甲、乙、丙三名運(yùn)動(dòng)員這次測試成績的平均數(shù),則的大小關(guān)系為 ;分別表示甲、乙、丙三名運(yùn)動(dòng)員這次測試成績的標(biāo)準(zhǔn)差,則的大小關(guān)系為 . 【例3】 個(gè)正數(shù)的平方和是,方差是,那么平均數(shù)為( ) A. B. C. D. 【例4】 若個(gè)數(shù)的平均數(shù)是,個(gè)數(shù)的平均數(shù)是,則這個(gè)數(shù)的平均數(shù)是( ) A. B. C. D. 【例5】 已知一組數(shù)據(jù)的方差是, 且,則這組數(shù)據(jù)的平均數(shù)__________. 【例6】 求下列各組數(shù)據(jù)的方差與標(biāo)準(zhǔn)差(精確到),并分析由這些結(jié)果可得出什么更一般的結(jié)論. ⑴; ⑵; ⑶ 【例7】 (xx上海18) 在發(fā)生某公共衛(wèi)生事件期間,有專業(yè)機(jī)構(gòu)認(rèn)為該事件在一段時(shí)間內(nèi)沒有發(fā)生大規(guī)模群體感染的標(biāo)志為“連續(xù)天,每天新增疑似病例不超過人”.根據(jù)過去天甲、乙、丙、丁四地新增疑似病例數(shù)據(jù),一定符合該標(biāo)志的是( ) A.甲地:總體均為,中位數(shù)為 B.乙地:總體均值為,總體方差大于 C.丙地:中位數(shù)為,眾數(shù)為 D.丁地:總體均值為,總體方差為 【例8】 (xx四川卷文) 設(shè)矩形的長為,寬為,其比滿足,這種矩形給人以美感,稱為黃金矩形.黃金矩形常應(yīng)用于工藝品設(shè)計(jì)中.下面是某工藝品廠隨機(jī)抽取兩個(gè)批次的初加工矩形寬度與長度的比值樣本: 甲批次: 乙批次: 根據(jù)上述兩個(gè)樣本來估計(jì)兩個(gè)批次的總體平均數(shù),與標(biāo)準(zhǔn)值比較,正確結(jié)論是 A.甲批次的總體平均數(shù)與標(biāo)準(zhǔn)值更接近 B.乙批次的總體平均數(shù)與標(biāo)準(zhǔn)值更接近 C.兩個(gè)批次總體平均數(shù)與標(biāo)準(zhǔn)值接近程度相同 D.兩個(gè)批次總體平均數(shù)與標(biāo)準(zhǔn)值接近程度不能確定 【例9】 (xx上海9) 已知總體的各個(gè)體的值由小到大依次為,且總體的中位數(shù)為,若要使該總體的方差最小,則、的取值分別是 . 【例10】 (xx山東9) 從某項(xiàng)綜合能力測試中抽取人的成績,統(tǒng)計(jì)如表,則這人成績的標(biāo)準(zhǔn)差為( ) 分?jǐn)?shù) 人數(shù) A. B. C.3 D. 【例11】 兩臺(tái)機(jī)床同時(shí)生產(chǎn)直徑為的零件,為了檢驗(yàn)產(chǎn)品質(zhì)量,質(zhì)量檢驗(yàn)員從兩臺(tái)機(jī)床的產(chǎn)品中各抽出件進(jìn)行測量,結(jié)果如下: 機(jī)床甲 機(jī)床乙 如果你是質(zhì)量檢驗(yàn)員,在得到上述數(shù)據(jù)后,你將通過怎樣的運(yùn)算來判斷哪臺(tái)機(jī)床生產(chǎn)的零件質(zhì)量更符合要求?- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 2019-2020年高中數(shù)學(xué) 統(tǒng)計(jì) 板塊四 統(tǒng)計(jì)數(shù)據(jù)的數(shù)字特征完整講義學(xué)生版 2019 2020 年高 數(shù)學(xué) 板塊 統(tǒng)計(jì)數(shù)據(jù) 數(shù)字 特征 完整 講義 學(xué)生
鏈接地址:http://m.appdesigncorp.com/p-2587611.html