統(tǒng)計學第二章統(tǒng)計數(shù)據(jù)的搜集、整理和顯示.ppt
《統(tǒng)計學第二章統(tǒng)計數(shù)據(jù)的搜集、整理和顯示.ppt》由會員分享,可在線閱讀,更多相關《統(tǒng)計學第二章統(tǒng)計數(shù)據(jù)的搜集、整理和顯示.ppt(78頁珍藏版)》請在裝配圖網(wǎng)上搜索。
第二章統(tǒng)計數(shù)據(jù)的搜集、整理和圖表展示,教學目的和要求:1.掌握統(tǒng)計調(diào)查各組織方式的分類特點和應用;2.掌握統(tǒng)計調(diào)查方案設計的內(nèi)容;3.熟悉各種統(tǒng)計數(shù)據(jù)的搜集方法;4.掌握數(shù)據(jù)分組方法和頻數(shù)分布數(shù)列的編制方法;5.掌握各種統(tǒng)計表的結構和表現(xiàn)形式;6.熟悉各種統(tǒng)計圖的表現(xiàn)形式;7.熟悉各種統(tǒng)計表的制表規(guī)則。,,第一節(jié)數(shù)據(jù)來源和調(diào)查第二節(jié)統(tǒng)計數(shù)據(jù)第三節(jié)數(shù)據(jù)整理第四節(jié)數(shù)據(jù)的圖表展示,第一節(jié)數(shù)據(jù)來源和調(diào)查,一、調(diào)查的基本理論(一)統(tǒng)計調(diào)查的概念1、統(tǒng)計數(shù)據(jù)搜集的概念統(tǒng)計數(shù)據(jù)搜集就是根據(jù)統(tǒng)計任務的要求,運用科學的調(diào)查方法,有目的、有計劃、有組織地及時搜集各項反映社會經(jīng)濟活動和科學試驗成果的統(tǒng)計資料的過程。,2、搜集數(shù)據(jù)的方法:實驗與調(diào)查(1).調(diào)查:人們?yōu)楂@得社會經(jīng)濟現(xiàn)象的相關數(shù)據(jù),運用相應的調(diào)查方法,向客觀實際搜集數(shù)字資料的過程,所獲數(shù)據(jù)為調(diào)查數(shù)據(jù)。(2).實驗:在實驗中控制一個或多個變量,在一定的控制條件下觀察實驗對象,從實驗中獲得的數(shù)據(jù)為實驗數(shù)據(jù),3、搜集的統(tǒng)計數(shù)據(jù)有兩種:(1).原始資料(初始資料):是直接向調(diào)查對象搜集反映調(diào)查單位情況的統(tǒng)計資料,對原始資料的搜集即為統(tǒng)計調(diào)查(2).次級資料(二手資料):根據(jù)研究目的,搜集已經(jīng)加工,整理過的說明總體現(xiàn)象的資料,(二)統(tǒng)計調(diào)查的要求,根據(jù)統(tǒng)計制度方法的統(tǒng)一規(guī)定,統(tǒng)計調(diào)查必須達到準確、及時兩個基本要求,做到數(shù)字準、情況明、反映及時。1、準確性。統(tǒng)計調(diào)查的準確性是指提供的統(tǒng)計資料必須符合客觀實際情況,保證各項統(tǒng)計資料真實可靠。2、及時性。各項調(diào)查資料不但要求準確,而且需要及時,這是很明顯的,因為過時的資料落在了形勢發(fā)展的后面,失去時效,猶如“雨后送傘”起不到統(tǒng)計的真實作用。,,統(tǒng)計調(diào)查形式示意圖,(三)統(tǒng)計調(diào)查的種類,1、全面調(diào)查與非全面調(diào)查統(tǒng)計調(diào)查按調(diào)查的范圍劃分,可分為全面調(diào)查和非全面調(diào)查兩大類。(1)全面調(diào)查是對調(diào)查對象的所有單位一一進行調(diào)查。普查、全面統(tǒng)計報表都屬于全面調(diào)查。,1)普查,概念:普查是專門組織的一次性的全面調(diào)查,它主要是用以調(diào)查某些不能或不宜用定期的全面報表搜集的統(tǒng)計資料。世界各國一般都定期進行各種普查,以便掌握國情,國力的基本統(tǒng)計數(shù)據(jù)。普查有主要特點:是一次性或周期性的調(diào)查。間隔時間較長。普查要規(guī)定統(tǒng)一的標準時點和普查期限。以避免調(diào)查數(shù)據(jù)的重復或遺漏。規(guī)定普查的項目和指標,不能隨意改變或增減普查的數(shù)據(jù)較準確,全面,但普查的范圍較窄普查的組織形式:組織普查機構或利用調(diào)查單位的原始記錄和核算資料。,2)全面統(tǒng)計報表制度,概念:全面統(tǒng)計報表制度是依照國家有關法規(guī),自上而下地統(tǒng)一布置,以一定的原始記錄為依據(jù),按照統(tǒng)一的表式,統(tǒng)一的指標項目,統(tǒng)一的報送時間和報送程序,自下而上地逐級地定期提供統(tǒng)計資料的一種調(diào)查方式。全面統(tǒng)計報表的實施范圍,是調(diào)查對象的全部單位均要填報。統(tǒng)計報表的主要特點:第一,資料的來源是各個基層單位的原始記錄。第二,逐級上報和匯總的。第三,屬于經(jīng)常性(連續(xù)性)調(diào)查,調(diào)查項目相對穩(wěn)定。,(2)非全面調(diào)查:對調(diào)查對象其中的一部分單位進行調(diào)查。,1)抽樣調(diào)查。抽樣調(diào)查是按隨機原則從調(diào)查對象中抽取一部分單位作為樣本進行觀察,然后根據(jù)所獲得的樣本數(shù)據(jù),對調(diào)查對象總體特征作出具有一定可靠程度的推算。A)特點:第一,按隨機原則抽取樣本。第二,根據(jù)部分調(diào)查的實際資料對調(diào)查對象總體的數(shù)量特征作出估計。第三,抽樣誤差可以事先計算并加以控制。B)適用范圍:第一,不可能或不必要進行全面調(diào)查的社會現(xiàn)象。第二,對普查資料進行必要的修正。,,C)抽樣調(diào)查的理論基礎概率論和數(shù)理統(tǒng)計的有關定理。D)抽樣調(diào)查對數(shù)據(jù)的要求:所研究的變量是隨機變量。E)抽樣調(diào)查應遵循的原則:第一,隨機原則。第二,最大抽樣效果原則。,2)重點調(diào)查,重點調(diào)查:是指在調(diào)查對象中,只選擇一部分重點單位進行的非全面調(diào)查。選擇的單位在全部總體中雖然數(shù)目不多,所占比重不多,但可以說明整個總體在該標志總量方面的基本情況。優(yōu)缺點:優(yōu)點是調(diào)查單位少,可調(diào)查較多的項目和指標;缺點是不能由重點調(diào)查的結果推算總體。重點單位的選擇:第一,選多少由調(diào)查任務確定;第二,選擇時要注意重點可變動;第三,選中單位應是管理健全,統(tǒng)計基礎工作較好的單位組織形式:是專門調(diào)查的組織形式搜集資料的方法:以企事業(yè)單位的原始資料為依據(jù)的報告法,3)典型調(diào)查,概念:典型調(diào)查是一種專門組織的非全面調(diào)查。根據(jù)調(diào)查的目的,在對所研究的對象進行初步分析的基礎上,有意識地選取若干具有代表性的單位進行調(diào)查和研究,借以認識事物發(fā)展變化的規(guī)律。有人也認為它是“目的抽樣”,以若干具有代表性的單位為樣本。特點:第一,調(diào)查單位少,能深入實際,深入群眾;第二,有意識的選擇,對其調(diào)查,能取得代表性較高的資料;第三,調(diào)查機動靈活。選擇:第一,為近似估算總體,可將總體分為若干類型,從每一類型中選擇典型單位;第二,總體一般數(shù)量表現(xiàn),可選擇中等的典型單位;第三,如為研究成功經(jīng)驗教訓,可選擇先進或后進的單位。,(二)經(jīng)常性調(diào)查與一次性調(diào)查,統(tǒng)計調(diào)查按時間標志可分為連續(xù)性(經(jīng)常性)和不連續(xù)性(一次性)調(diào)查兩大類。1、連續(xù)性(經(jīng)常性)調(diào)查:是指隨著研究現(xiàn)象的變化,連續(xù)不斷地進行調(diào)查登記。如統(tǒng)計報表制度。2、不連續(xù)性(一次性)調(diào)查:是指間隔一段較長的時間對事物的變化進行一次性調(diào)查,如普查、典型調(diào)查。,(三)定期報表形式與專門調(diào)查,統(tǒng)計調(diào)查按組織形式可分為定期報表形式和專門調(diào)查。1、定期報表制度是按國家統(tǒng)一規(guī)定的表式和內(nèi)容,定期地向各級領導機構報送統(tǒng)計資料的一種形式。2、專門調(diào)查是為某一專題研究而組織的專項調(diào)查,如抽樣調(diào)查、典型調(diào)查、普查。,二、調(diào)查方案的設計,(一)調(diào)查方案的含義調(diào)查方案是指在統(tǒng)計調(diào)查工作正式開始之前,應當事先設計一個切實可行、周密細致的數(shù)據(jù)搜集方案,以指導整個調(diào)查工作,使調(diào)查得以順利地實施和完成。調(diào)查方案又稱數(shù)據(jù)搜集方案,它是指導整個調(diào)查過程的綱領性文件。,(二)統(tǒng)計調(diào)查的方案設計(5W1H),1、確定調(diào)查目的(why)。(為什么要進行調(diào)查,調(diào)查要解決什么問題,是統(tǒng)計調(diào)查中的根本性問題)2、確定調(diào)查對象和調(diào)查單位(根據(jù)目的確定who)調(diào)查對象:是指需要調(diào)查的現(xiàn)象總體,該總體是由許多性質(zhì)相同的調(diào)查單位組成的。調(diào)查單位:是指所要調(diào)查的具體單位,它是進行調(diào)查登記的標志的承擔者。報告單位:報告單位亦稱填報單位,它是負責向上報告調(diào)查內(nèi)容、提交統(tǒng)計資料的單位。調(diào)查單位與報告單位,有時是一致的,有時不一致。3、確定調(diào)查項目和調(diào)查表(what)(1)確定調(diào)查項目。調(diào)查項目就是調(diào)查中所要登記的調(diào)查單位的特征,即調(diào)查單位所承擔的基本標志,它由一系列品質(zhì)標志(或稱質(zhì)量標志、屬性標志)和數(shù)量標志所構成。,在擬定調(diào)查項目時要注意以下四個問題:,調(diào)查項目要少而精本著需要和可能的原則,只列入能夠得到確定答案的項目調(diào)查項目之間盡可能保持聯(lián)系,以便相互核對起到校驗作用有的項目可擬定為“選擇式”(2)、調(diào)查表格和問卷的設計。1)調(diào)查表:列出調(diào)查項目的表格形式就是調(diào)查表。有一覽表和單一表兩種形式。(包括表頭、表體和表外附加)一覽表:把許多單位和相應的項目按次序登記在一張表格里的一種統(tǒng)計表,在調(diào)查項目不多時用。這種表格優(yōu)點是每個調(diào)查單位的共同事項只需登記一次,缺點是不能多登記調(diào)查單位的標志。單一表:一張表格內(nèi)只登記一個調(diào)查單位,項目多時,一張表格可由幾張表組成。優(yōu)點是可容納較多的標志,缺點是每份表上都要注明時間地點和其他共同事項。,2).問卷調(diào)查:根據(jù)調(diào)查目的,在調(diào)查對象中隨機選擇或有意識地確定調(diào)查單位,以書面文字或表格形式了解被調(diào)查者的意見,調(diào)查者自愿、自由回答問卷中所提出的問題。這是一種特殊形式的調(diào)查表,主要用于非政府統(tǒng)計機構或個人的市場調(diào)查或社會調(diào)查。問卷有面訪與自填兩種,其基本結構、問題類型、設計要求大致相同?;窘Y構:說明詞、問題、作業(yè)記錄主題問句類型:開放式問題和封閉式問題基本要求:主題明確、提問科學、邏輯性強、容量適當,4、確定調(diào)查時間(when)。統(tǒng)計調(diào)查時間包括二種涵義,即調(diào)查時間和調(diào)查期限。調(diào)查時間:是指調(diào)查資料所屬的時點或時期。調(diào)查期限:是進行調(diào)查工作的時限,包括搜集資料和報送資料的工作所需的時間。5、確定調(diào)查地域范圍(where)6、調(diào)查的計劃實施(how)包括調(diào)查人員的選擇、組織和培訓:調(diào)查表格問卷和調(diào)查員手冊的印刷;調(diào)查工具的準備等。,三、調(diào)查體系及應用,(一)統(tǒng)計調(diào)查方法體系的含義統(tǒng)計調(diào)查方法體系是指以必要的周期性的普查為基礎,經(jīng)常性的抽樣調(diào)查為主體,同時輔之以重點調(diào)查、科學推算和少量的全面報表綜合運用的調(diào)查方法體系。(二)統(tǒng)計調(diào)查方法體系的應用,,普查和全面報表都是全面調(diào)查,但兩者不能互相替代。抽樣調(diào)查雖然是一種非全面調(diào)查,但它能夠解決全面調(diào)查無法或難以解決的問題,抽樣調(diào)查調(diào)查單位少,調(diào)查項目就可以多一些,以便對某一社會經(jīng)濟現(xiàn)象進行更深入的研究,也可以節(jié)省調(diào)查費用,又可以滿足統(tǒng)計時效性的要求。所以,我國統(tǒng)計調(diào)查體系是以經(jīng)常性的抽樣調(diào)查為主體。如果調(diào)查任務只要求掌握基本情況,而現(xiàn)象總體中又有部分單位能比較集中地反映研究項目的數(shù)量特征,則可采用重點調(diào)查。在統(tǒng)計調(diào)查體系中,適度地采用了科學的推算方法。,四、現(xiàn)有統(tǒng)計資料的主要來源,1.統(tǒng)計年鑒2.有關期刊3.有關網(wǎng)站,第二節(jié)統(tǒng)計數(shù)據(jù),一、數(shù)據(jù)類型(一)數(shù)據(jù)的計量尺度根據(jù)對研究對象計量的不同精確程度,人們將計量尺度由低到高、由粗略到精確分為四個層次:定類尺度、定序尺度、定距尺度和定比尺度。(二)數(shù)據(jù)類型1、橫截面數(shù)據(jù)。是指在同一時間對同一總體內(nèi)不同單位的數(shù)量進行觀察而獲得的數(shù)據(jù)。2、時間序列數(shù)據(jù)。是指在不同時間對同一總體的數(shù)量表現(xiàn)進行觀察而獲得的數(shù)據(jù)。,(三)數(shù)據(jù)的表現(xiàn)形式,1、絕對數(shù)現(xiàn)象的規(guī)模、水平一般以絕對數(shù)形式表現(xiàn)。絕對數(shù)的計量單位一般為實物單位或價值單位,有時也采用復合單位。2、相對數(shù)相對數(shù)由兩個互相聯(lián)系的數(shù)值對比求得。常用的相對數(shù)包括:結構相對數(shù)、動態(tài)相對數(shù)、比較相對數(shù)、強度相對數(shù)、利用程度相對數(shù)、計劃完成相對數(shù)等。3、平均數(shù)平均數(shù)反映現(xiàn)象總體一般水平或分布的集中趨勢,二、數(shù)據(jù)誤差,(一)數(shù)據(jù)誤差的產(chǎn)生調(diào)查數(shù)據(jù)誤差根據(jù)其產(chǎn)生的原因可以分為登記性誤差和代表性誤差。登記性誤差是統(tǒng)計過程中的種種工作失誤引起的,代表性誤差一般指抽樣調(diào)查誤差,是由調(diào)查方式本身引起的,不可避免,但可以計算和控制。(二)數(shù)據(jù)誤差的防范為了取得準確的數(shù)據(jù)資料,必須采取各種措施,具體有:制定科學的統(tǒng)計調(diào)查方案。加強對調(diào)查人員的培訓。建立健全經(jīng)濟核算體系,加強統(tǒng)計基礎工作建設。加強對統(tǒng)計資料質(zhì)量的監(jiān)督檢查。,三、數(shù)據(jù)的搜集方法,(一)訪問調(diào)查(二)電話調(diào)查(三)郵寄調(diào)查(四)座談會(五)個別深度訪問(六)網(wǎng)上調(diào)查,第三節(jié)數(shù)據(jù)整理,一、數(shù)據(jù)的預處理(一)數(shù)據(jù)的審核對調(diào)查資料進行審核是統(tǒng)計整理的第一步,包括以下內(nèi)容:1、審核資料的完整性和及時性2、審核資料的正確性:審核資料的正確性,是檢查所填報的資料是否準確可靠。常用的審核方法有兩種:邏輯檢查和計算檢查3、歷史資料的審核,(二)資料審核后的訂正,通過上述審核,如發(fā)現(xiàn)有缺報、缺份和缺項等情況,應及時催報、補報;如有不正確之處,則應分別不同情況作如下處理:1、對于可以肯定的一般錯誤,應及時代為更正,并通知原報單位。2、對于可疑之數(shù)或無法代為更正的錯誤,應要求原單位復查更正。3、如果所發(fā)現(xiàn)的差錯在其他單位也可能發(fā)生時,應將錯誤情況通報所有單位,以免發(fā)生類似錯誤。4、對于嚴重的錯誤,應發(fā)還重新填報,并查明發(fā)生錯誤的原因,若屬于違法行為,則應依法嚴肅處理。,二、數(shù)據(jù)統(tǒng)計整理的內(nèi)容和程序,(一)統(tǒng)計整理及其作用1、統(tǒng)計整理的含義統(tǒng)計整理就是根據(jù)統(tǒng)計研究的目的,對所搜集到的資料進行科學的加工,使之系統(tǒng)化,條理化的工作過程。統(tǒng)計整理即包括對統(tǒng)計調(diào)查所得到的原始資料進行整理,也包括對加工過的綜合資料,即次級資料進行再整理。2、統(tǒng)計整理的作用(1)通過對第一手資料的加工整理,使之系統(tǒng)化,以便通過綜合指標對總體作出概括性的說明。(2)統(tǒng)計整理是整個統(tǒng)計工作和研究過程的中間環(huán)節(jié),起著承前啟后的作用。(3)統(tǒng)計整理還是積累歷史資料的必要手段。,(二)統(tǒng)計整理的內(nèi)容和程序,統(tǒng)計整理的全過程包括對統(tǒng)計資料的審核、分組、匯總和編制統(tǒng)計圖表四個環(huán)節(jié),需要按照一定的程序進行:第一步,設計和制定統(tǒng)計整理方案。第二步,對原始資料進行審核。第三步,對經(jīng)過審核的資料進行分組、并結合匯總,計算相應的統(tǒng)計指標。第四步,將匯總計算的結果,以統(tǒng)計表或統(tǒng)計圖的形式表現(xiàn)出來。第五步,對統(tǒng)計資料妥善保存,系統(tǒng)積累。,三、統(tǒng)計分組和頻數(shù)分布,(一)統(tǒng)計分組1、統(tǒng)計分組1)根據(jù)統(tǒng)計研究的目的和客觀現(xiàn)象的內(nèi)在特點,按某個標志(或幾個標志)把被研究的總體劃分為若干個不同性質(zhì)的組,稱為統(tǒng)計分組。分組標志可為品質(zhì)標志也可為數(shù)量標志。2)分組的性質(zhì)來說:兼有分和合雙重含義。2、統(tǒng)計分組的原則(不重不漏原則)窮盡原則,使總體中的每一個單位都應有組可歸,或者說各分組的空間足以容納總體所有的單位。互斥原則,在特定的分組標志下,總體中的任何一個單位的只能歸屬于某一組,而不能同時或可能歸屬于幾個組。,3、統(tǒng)計分組的類型,1)按分組標志的多少,可分為簡單分組和復合分組。簡單分組:就是對研究現(xiàn)象按一個標志進行分組。復合分組:用兩個或兩個以上標志分組,即先按一個標志分組,在此基礎上再按第二個標志分小組,又再層疊地按第三個標志分成更小的組,這稱為復合分組。2)按分組的標志的性質(zhì)不同,分為品質(zhì)分組(或稱屬性分組)和數(shù)量分組(或稱變量分組)。品質(zhì)分組:按品質(zhì)(或?qū)傩裕酥具M行分組。品質(zhì)分組所形成的數(shù)列稱為品質(zhì)數(shù)列。數(shù)量分組:按數(shù)量標志分組,數(shù)量標志的變異性體現(xiàn)在它不斷變動自身的數(shù)量上,故也稱為變量分組。變量分組所形成的數(shù)列稱為變量數(shù)列。,3)按分組的作用和任務不同,分為類型分組、結構分組和分析分組。,類型分組:把復雜的現(xiàn)象總體,劃分為若干個不同性質(zhì)的部分,就是類型分組。結構分組:在對總體分組的基礎上計算出各組對總體的比重,借此研究總體各部分的結構,即結構分組。分析分組:為研究現(xiàn)象之間依存關系而進行的統(tǒng)計分組即分析分組。,4、統(tǒng)計分組的方法,(1)、品質(zhì)分組的方法。按品質(zhì)標志分組,有些分組比較簡單,分組標志一經(jīng)確定,組的名稱和組數(shù)也隨之確定。(2)、數(shù)量分組的方法。按數(shù)量標志分組,應注意如下兩個問題:首先,分組時各組數(shù)量界限的確定必須能反映事物質(zhì)的差別。其次,應根據(jù)被研究的現(xiàn)象總體的數(shù)量特征,采用適當?shù)姆纸M形式,確定相宜的組距、組限。,1)單項式分組與組距式分組,A)單項式分組:用一個變量值作為一組,形成單項式變量數(shù)列。單項式分組一般適用于離散型變量且變量變動范圍不大的場合。B)組距式分組:將變量依次劃分為幾段區(qū)間,一段區(qū)間表現(xiàn)為“從……到……”距離,把一段區(qū)間內(nèi)的所有變量值歸為一組,形成組距式變量數(shù)列。區(qū)間的距離就是組距。連續(xù)型變量或者變動范圍較大的離散型變量,適宜采用組距式分組。,2)間斷組距式分組和連續(xù)組距式分組,下限,上限:組距式分組的每一組變量值中,其最小值為下限,最大值為上限。組距:上下限之間的距離。組限:相鄰兩組的界限。間斷組距式分組:組限不相連的組距式分組。連續(xù)組距式分組:組限相連(或稱相重疊的),即以同一數(shù)值作為相鄰兩組的共同界限的組距式分組。離散型變量,可間斷組距式分組,也可連續(xù)組距式分組。連續(xù)型變量,只能采用連續(xù)組距式分組?!吧舷薏辉趦?nèi)”原則:在連續(xù)組距式分組中,以同一個數(shù)值作為相鄰兩組共同的界限,統(tǒng)計上規(guī)定,凡是總體某一個單位的變量值是相鄰兩組的界限值,這一個單位歸入作為下限值的那一組內(nèi)。,3)等距分組與異距分組,等距分組:標志值在各組保持相等的組距,即各組的標志值變動都限于相同的范圍。一般用于標志值變動比較均勻的場合。異距分組:各組的組距不相等。,4)、相關指標的計算,(1).組距連續(xù)式分組的組距計算公式:組距=本組上限–本組下限間斷式分組的組距計算公式:組距=本組上限–本組下限+1開口組的組距:以相鄰組的組距為本組的組距可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定組數(shù)即組距=(最大值-最小值)/組數(shù),另為便于計算,組距宜取5或10的倍數(shù)。(2).組中值:上下限之間的中點數(shù)值稱為組中值,組中值的計算公式:閉口組,開口組:計算組中值時,開口組的組距是以相鄰組的組距為本組組距即組中值=下限+相鄰組組距/2組中值=上限-相鄰組組距/2計算平均指標或進行其它統(tǒng)計分析時,常以組中值來代表各組標志值的平均水平。,(3).組數(shù)組數(shù)=全距/組距斯特杰斯經(jīng)驗公式:組數(shù)=1+3.3LgN由此推出組距=(最大變量值-最小變量值)/(1+3.3LgN),斯特杰斯經(jīng)驗公式只是一經(jīng)驗公式,在實際應用時刻根據(jù)數(shù)據(jù)的多少和特點及分析要求,參考這一標準靈活確定組數(shù),另按經(jīng)驗看法,組數(shù)過多或過少都不妥,一般情況下可分為5——7組,組數(shù)盡可能取奇數(shù),避免偶數(shù)。,(4)、組限的確定原則:(按這樣的組限分后,標志值在各組的變動能反映事物質(zhì)的變化),應根據(jù)標志值分布的情況找出變量的最大值和最小值。根據(jù)分布比較集中的標志值確定組距的中心位置根據(jù)預定的組距大小定出上下限第一組下限必須略小于實際變量值的最小值,最后一組的上限必須略大于實際變量值的最大值連續(xù)變量的相鄰組上下限通常以同一數(shù)值來表示,按“上限不在內(nèi)”原則;離散變量相鄰組組限可用同一數(shù)值表示也可用兩個相鄰的不同整數(shù)表示。,(二)頻數(shù)分布,1、頻數(shù)分布的基本概念(1)、頻數(shù)分布頻數(shù):也叫次數(shù),是落在各類別中的數(shù)據(jù)個數(shù)即各組內(nèi)的數(shù)據(jù)個數(shù)頻率:各組總體單位個數(shù)和總體單位總數(shù)之比即各組次數(shù)與全部次數(shù)之和的比值稱為頻率或比重在統(tǒng)計分組的基礎上,將總體所有的單位按某一標志進行歸類排列,稱為頻數(shù)分布,或次數(shù)分布。即將各個類別及其相應的頻數(shù)全部列出來??煞从晨傮w各組之間單位分布的狀況。根據(jù)分組標志特征的不同,分布數(shù)列可分為品質(zhì)分布數(shù)列和變量分布數(shù)列。品質(zhì)分布數(shù)列:有各組名稱和次數(shù)組成,可用絕對數(shù)(頻數(shù))表示也可用相對數(shù)(頻率)表示數(shù)列分布數(shù)列:單項式和組距式分布數(shù)列,(2)、分布數(shù)列的兩個要素,1)總體按某標志所分的組。2)各組所出現(xiàn)的單位數(shù),即頻數(shù),亦稱次數(shù)。對于變量數(shù)列,標志值形成的數(shù)列,稱為變量,一般用x表示;頻數(shù)(次數(shù))用f表示。,2、變量數(shù)列的編制,1、編制方法。1)將原始資料按順序排列,確定變量值變動范圍2)確定組距、組數(shù)、組限和組限的表示方法3)確定頻數(shù)和頻率(如為異距分組則確定頻數(shù)密度和頻率密度)2、頻率的性質(zhì)1)任何頻率都是界于0和1之間的一個分數(shù),即:2)各組頻率之和等于1,即:3、頻數(shù)密度:采用異距分組,各組次數(shù)的多少受到組距不同的影響,為消除異距分組所造成的影響須計算頻數(shù)密度(或稱次數(shù)密度)。頻數(shù)密度的計算公式:頻數(shù)密度=頻數(shù)/組距頻率密度=頻率/組距各組頻數(shù)密度與各組組距乘積之和等于總體單位數(shù),各組頻率密度與各組組距乘積之和等于1。,3、累計頻數(shù)與累計頻率,1、向上累計頻數(shù)(或頻率)分布:先列出各組的上限,然后由標志值低的組向標志值高的組依次累計。向上累計頻數(shù)表明某組上限以下的各組單位數(shù)之和是多少,向上累計頻率表明某組上限以下的各組單位數(shù)之和占總體單位數(shù)比重的大小。2、向下累計頻數(shù)(或頻率)分布:先列出各組的下限,然后由標志值高的組向標志值低的組依次累計。向下累計頻數(shù)表明某組下限以上的各組單位數(shù)之和是多少,向下累計頻率表明某組下限以上的各組單位數(shù)之和占總體單位數(shù)比重的大小。,4、累計頻數(shù)分布特點,1)第一組的累計頻數(shù)等于第一組本身的頻數(shù);2)最后一組累計頻數(shù)等于總體單位數(shù)。累計頻率同樣也具有兩個特點:1)第一組的累計頻率等于第一組本身的頻率;2)最后一組的累計頻率等于1。累計頻數(shù)(頻率)分布圖分為向上累計頻數(shù)(頻率)分布圖和向下累計頻數(shù)(頻率)分布圖。以分組變量為橫軸,以累計頻數(shù)(頻率)為縱軸。在直角坐標點系上將各組組距的上限與其相應的累計頻數(shù)(頻率)所構成坐標點,依次用直線(或光滑曲線)相連,即是向上累計曲線。在直角坐標系上將各組組距下限與其相應累計頻數(shù)(頻率)所構成坐標點,依次用直線(或光滑曲線)相連,即是向下累計分布曲線圖。,累計頻數(shù)分布曲線顯然,累計頻數(shù)分布曲線只有兩種形狀:或持續(xù)增長的或持續(xù)減少的。這分別取決于向上累計或向下累計。累計頻數(shù)分布曲線一般都呈邏輯斯諦曲線形,其斜率最大的地方對應于頻數(shù)最大的組,其水平的地方對應于空組。,,5、頻數(shù)分布的類型,(1).鐘形圖:“兩頭小,中間大”1)對稱分布2)偏態(tài)分布婚齡、學生身高——近似正態(tài)分布收入分配、資源配置——偏態(tài)分布(2).u型分布:“兩頭小,中間大”(3).J型分布:“一邊小,一邊大”1)正J型2)反J型這三種頻數(shù)分布的圖形是常見的曲線圖形,●U形曲線:中間小,兩頭大,●J形曲線:正J分布,反J分布,,思考題:1.按百分制計分,某班學生統(tǒng)計學考試成績?nèi)缦拢?9887699746082608986939994827779977895928784796598675972848556817773656683637970試分組,并計算組中值。2.如某組數(shù)據(jù)最大值為139,最小值為107,組數(shù)為7,則組距應為多少?3.按完成凈產(chǎn)值分組(萬元),計算各組組中值10以下10~2020~3030~4040~7070以上,,4\某行業(yè)管理局所屬40個企業(yè)1999年的銷售收入如下:(單位:萬元)1521241291161101039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126按125以上為先進企業(yè),115~125為良好企業(yè),105~115為一般企業(yè),105一下為落后企業(yè)分組編制頻數(shù)分布表,并計算累計頻數(shù)和累計頻率,第四節(jié)數(shù)據(jù)的圖表展示,統(tǒng)計調(diào)查搜集來的資料往往是沒有次序的原始資料,使原始資料有序化,列表和作圖是兩種基本方法,得到的分別就是統(tǒng)計表和統(tǒng)計圖。一、統(tǒng)計表(一)統(tǒng)計表的定義和作用1、統(tǒng)計表的定義統(tǒng)計表:把統(tǒng)計數(shù)據(jù)按一定的順序排列在表格上,就形成了統(tǒng)計表。它清楚地、有條理地顯示統(tǒng)計資料,直觀地反映統(tǒng)計分布特征,是統(tǒng)計分析的一種重要工具。,2、統(tǒng)計表的作用:1、它利用表格形式,合理地安排統(tǒng)計資料,清晰、簡明地反映出現(xiàn)象總體的特征。2、統(tǒng)計表通過科學、合理地表現(xiàn)統(tǒng)計資料,便于對統(tǒng)計資料進行對照比較和分析,有利于計算統(tǒng)計分析指標。3、在統(tǒng)計分析報告中使用統(tǒng)計表,能節(jié)省文字敘述篇幅,達到簡明易懂、緊湊有力的分析效果。4、統(tǒng)計表還是匯總和積累統(tǒng)計資料,進行統(tǒng)計分析的重要工具。,,,,2002年我國城鄉(xiāng)人口情況,,,,,,按城鄉(xiāng)分,,比重(%),人口數(shù)(萬人),128453,39.09,60.91,78241,50212,,,,,,,(二).統(tǒng)計表的結構,1)從表式上看,表格包括總標題、橫行標題、縱欄標題和指標數(shù)值四個部分。,總標題,鄉(xiāng)村,城鎮(zhèn),,100.00,合計,縱欄標題,統(tǒng)計數(shù)值,橫行標題,表3.4離婚案件構成,2)從內(nèi)容上看,統(tǒng)計表由主詞欄和賓詞欄兩個部分組成。主詞—統(tǒng)計表所要說明的總體及其組成部分。賓詞—用來說明總體數(shù)量特征的各個統(tǒng)計指標。如需要,主賓詞可互換。,(三)統(tǒng)計表的分類,1、按主詞的結構分類1)簡單表:主詞未經(jīng)任何分組的統(tǒng)計表稱為簡單表,也稱一覽表。主詞羅列各單位的名稱。2)分組表:主詞只按一個標志進行分組形成的統(tǒng)計表,也稱簡單分組表,。3)復合表:主詞按兩個或兩個以上標志進行分組的統(tǒng)計表,也稱復合分組表。,●簡單表我國城市居民家庭基本情況(2002年),中國人口年齡結構狀況單位:%,資料來源|:《2003中國統(tǒng)計年鑒》第99頁。,●簡單分組表,●復合分組表我國社會福利主要費用情況單位:億元,資料來源|:《2003中國統(tǒng)計年鑒》第838頁。,2、按賓詞設計分類,1)賓詞簡單排列是指賓詞不加任何分組、按一定順序排列在統(tǒng)計表上,就是賓詞簡單排列表。2)賓詞分組平行排列是指賓詞欄中各分組標志彼此分開,平行排列,就是賓詞分組平行排列表。3)賓詞分組層疊排列:指同時按兩個或兩個以上標志分組,(四)統(tǒng)計表的設計,統(tǒng)計表的設計應注意如下事項:1.線條的繪制。表的上下端應以粗線繪制,表內(nèi)縱橫線以細線繪制。表格的左右兩端一般不劃線,采用“開口式”。2.合計欄的設置。3.標題設計。以簡練而又準確的文字表述統(tǒng)計資料的內(nèi)容、資料所屬的空間和時間范圍。,,4.指標數(shù)值的填寫。當數(shù)字因小可略而不計時,可寫上“0”;當缺某項數(shù)字資料時,可用符號“…”表示;不應有數(shù)字時用符號“—”表示。5.計量單位。統(tǒng)計表必須注明數(shù)字資料的計量單位。當全表只有一種計量單位時,可以把它寫在表頭的右上方。如果表中各格的指標數(shù)值計量單位不同,可在橫行標題后添一列計量單位。6.注解或資料來源。在統(tǒng)計表下,應注明資料來源。,二、統(tǒng)計圖,(一)分類和順序數(shù)據(jù)的圖形顯示1、條形圖(bargraph):在平面直角坐標系中,我們指定橫坐標為各組變量,縱坐標表示各組的頻數(shù)、相對頻數(shù)或百分比頻數(shù),然后使各組條形的寬度相同,條形的高度等于該組的頻數(shù)、相對頻數(shù)或百分比頻數(shù)。橫置條形圖、縱置條形圖例:某商店顧客購買計算機頻數(shù)分布表、條形圖購買計算機數(shù)據(jù)的頻數(shù)分布表,,公司頻數(shù)比重(%)蘋果機1326康柏機1224貝爾510蓋特威—2000918IBM1122合計50100,,,,,,,,,,,2、餅形圖(piechart):首先繪制一個圓形(餅形),然后利用相對頻數(shù)或百分比頻數(shù),按各組在圓形360度中的比重,將圓形劃分成對應的幾個部分。例:某商店顧客購買計算機餅形圖,,3、環(huán)形圖環(huán)形圖與圓形圖又有區(qū)別,環(huán)形圖中間有一個空洞,總體中的每一部分數(shù)據(jù)用環(huán)中的一段表示;圓形圖只能顯示每一個總體各部分所占的比例,而環(huán)形圖則可以同時繪制多個總體的數(shù)據(jù)系列,每一個總體的數(shù)據(jù)系列為一個環(huán)。因此環(huán)形圖可以顯示多個總體各部分所占的相應比例,從而有利于進行比較研究。例如:在一項有關住房問題的研究中,調(diào)查人員在甲乙兩個城市各抽樣調(diào)查300戶家庭,其中一個問題是:“您對您家庭目前的住房狀況是否滿意?”備選答案有:(1)非常不滿意;(2)不滿意;(3)一般;(4)滿意;(5)非常滿意。調(diào)查結果如下表:,頻數(shù)分布不但可以用統(tǒng)計表的形式表現(xiàn),也可以用統(tǒng)計圖的形式表現(xiàn)。用統(tǒng)計圖表示頻數(shù)分布,較之用統(tǒng)計表,要直觀便捷得多。但缺點是不及統(tǒng)計表精確。統(tǒng)計圖的種類很多,本節(jié)僅就與頻數(shù)分布數(shù)列相銜接的統(tǒng)計圖加以介紹。根據(jù)編制好的頻數(shù)分布數(shù)列,可以繪制出相應的統(tǒng)計圖,最常用的有頻數(shù)分布直方圖、折線圖、曲線圖以及累計頻數(shù)分布曲線。具體方法是:先畫直角坐標系,橫軸代表分組或各組組限,縱軸代表各組頻數(shù)或頻率,然后再根據(jù)相應的分配數(shù)列作圖。,,(二)數(shù)值型數(shù)據(jù)的顯示,條件下,很顯然各矩形的面積與其高度成正比。因此,各矩形的面積同樣可以用來表示各組的頻數(shù)或頻率,而且看起來更形象直觀。如果取各矩形的總面積為1,各矩形的面積必定等于各組的相對頻數(shù)。,1.直方圖(Histograms)直方圖是用矩形(或長條)的高度來表示數(shù)列各組的頻數(shù)或頻率。對于定類變量和定序變量的分組,矩形(或長條)的寬度是沒有意義的,各矩形之間要留出一定的空隙;對于定距變量(和定比變量)的分組,矩形的寬度表示各組組距,各矩形之間一般不留空隙。在等距分組的,,其實,在頻數(shù)分布圖中,用面積來理解頻數(shù)分布狀況更合適。比如直方圖,當處理異距分組時應該用矩形面積而不是用矩形高度來顯示頻數(shù)分布。下面是根據(jù)表3.15繪制出的兩個直方圖。左圖用矩形高度來表示各組頻數(shù)就會產(chǎn)生錯覺。右圖是按照標準組距頻數(shù)作出來的,用矩形面積來表示各組頻數(shù)就避免了不必要的錯覺。以后當我們接觸正態(tài)曲線等曲線后,將進一步體會到用面積來表示頻數(shù)分布的好處。,2.折線圖(Polygon)表示頻數(shù)分布的另一種圖形是頻數(shù)多邊形圖,簡稱折線圖。直接把直方圖各矩形頂部的中點用直線連接起來,并把原來的矩形抹掉,就得到頻數(shù)多邊形圖。,,當變量數(shù)列中的組數(shù)愈加增多,變量值也非常多時,折線圖會逐步過渡到平滑曲線。頻數(shù)分布曲線圖實質(zhì)上是對應于連續(xù)變量的頻數(shù)分布的函數(shù)關系圖。,3.曲線圖,,4、描述時間序列的線圖線圖是在平面坐標上用折線表現(xiàn)數(shù)量變化特征和規(guī)律的統(tǒng)計圖。線圖主要用于顯示時間序列數(shù)據(jù),以反映事物發(fā)展變化的規(guī)律和趨勢。,從上圖可以清楚地看出,城鄉(xiāng)居民的家庭人均收入逐年提高,而且城鎮(zhèn)居民的家庭人均收入高于農(nóng)村,1993年以后這種差距有擴大的趨勢。繪制線圖時應注意以下幾點:1、時間一般繪在橫軸,指標數(shù)據(jù)繪在縱軸;2、圖形的長寬比例要適當,一般為橫軸略大于縱軸的長方形,其長寬比例大致為10:7,圖形過扁或過于瘦高,不僅不美觀,而且會給人造成視覺上的錯覺,不便于對數(shù)據(jù)變化的理解;3、一般情況下,縱軸數(shù)據(jù)下端應從0開始,以便于比較。數(shù)據(jù)與0之間的間距過大,可以采取折斷的“∥”符號將縱軸折斷。,- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 統(tǒng)計學 第二 統(tǒng)計數(shù)據(jù) 搜集 整理 顯示
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權,請勿作他用。
鏈接地址:http://m.appdesigncorp.com/p-3525751.html