第十二章 資料的統(tǒng)計(jì)分析
資料分析包括統(tǒng)計(jì)分析、邏輯和理論分析。統(tǒng)計(jì)分析又分為:描述性統(tǒng)計(jì)、推論性統(tǒng)計(jì)。
一 統(tǒng)計(jì)分析的必要性與特點(diǎn)
1、統(tǒng)計(jì)分析是運(yùn)用統(tǒng)計(jì)學(xué)方法對(duì)調(diào)查得到的數(shù)據(jù)資料進(jìn)行定量分析,以揭示事物內(nèi)在的數(shù)量關(guān)系、規(guī)律和發(fā)展趨勢(shì)。它是人們認(rèn)識(shí)社會(huì)現(xiàn)象的重要手段。
2、定性預(yù)測(cè):根據(jù)事實(shí),運(yùn)用經(jīng)驗(yàn)和判斷能力,邏輯思維方法進(jìn)行的預(yù)測(cè)。
3、定量預(yù)測(cè):根據(jù)數(shù)據(jù)、統(tǒng)計(jì)資料,運(yùn)用統(tǒng)計(jì)分析方法進(jìn)行的預(yù)測(cè)。
4、統(tǒng)計(jì)分析的必要性表現(xiàn)在一下幾個(gè)方面:
(1)統(tǒng)計(jì)分析的方法可以為我們的研究提供一種清晰準(zhǔn)確的形式化語(yǔ)言
(2)統(tǒng)計(jì)分析是進(jìn)行科學(xué)預(yù)測(cè),探索未來(lái)的重要方法
(3)新的調(diào)查方法和技術(shù)要求運(yùn)用統(tǒng)計(jì)分析的方法
5、統(tǒng)計(jì)分析的特點(diǎn):
(1)統(tǒng)計(jì)分析要以定性分析為基礎(chǔ)(定性分析要為定量分析規(guī)定方向)
(2)統(tǒng)計(jì)分析方法必須和其他分析方法結(jié)合運(yùn)用
(3)統(tǒng)計(jì)分析有一套專(zhuān)門(mén)的方法和技術(shù)
二 集中量數(shù)分析
1、集中量數(shù)(集中趨勢(shì)):是一組數(shù)據(jù)的代表值,代表著現(xiàn)象的一般水平。用以說(shuō)明某一社會(huì)現(xiàn)象的一般狀態(tài)或平均狀態(tài)。
2、集中量數(shù)對(duì)不同層次的變量描述應(yīng)使用不同的統(tǒng)計(jì)量:
(1)對(duì)定類(lèi)變量,用“眾數(shù)”
(2)對(duì)定序變量,用“中位數(shù)”
(3)對(duì)定距變量,用“算術(shù)平均數(shù)”,也可以用“中位數(shù)”
3、集中量數(shù)的作用:
(1)說(shuō)明某一社會(huì)現(xiàn)象在一定條件下,其數(shù)量的一般水平
(2)對(duì)于在不同空間的同類(lèi)現(xiàn)象進(jìn)行比較
(3)對(duì)一定社會(huì)現(xiàn)象在不同時(shí)間中的變化進(jìn)行比較
(4)分析某些社會(huì)現(xiàn)象之間的依存關(guān)系
4、眾數(shù)是指在一組數(shù)據(jù)中重復(fù)次數(shù)最多的標(biāo)志值。
計(jì)算:
(1)單項(xiàng)分組數(shù)據(jù)資料計(jì)算眾數(shù)的方法比較簡(jiǎn)單,一般采用直接觀察法即可
書(shū)本328頁(yè),表12-3 直接觀察出現(xiàn)次數(shù)最多的標(biāo)志值是30,即某村青年文化程度的眾數(shù)是小學(xué)文化程度
(2)計(jì)算組距分組資料的眾數(shù),一種是組中值法,另一種是摘補(bǔ)法
L+U
組中值法:眾數(shù)= 2 ,L、U分別代表出現(xiàn)次數(shù)最多組的組上限和組下限。
計(jì)算眾數(shù)是要有條件的。只有在總體單位數(shù)量較多并且有明顯集中趨勢(shì)的資料才能計(jì)算眾數(shù)。
5中位數(shù)(位置平均數(shù))是把調(diào)查到的資料按照標(biāo)志值的大小順序排列,處于中央位置的標(biāo)志值表示中間位置的平均數(shù)。
計(jì)算:
(1)原始數(shù)據(jù)計(jì)算中位數(shù)
n+1
中位數(shù)位次= 2 n代表總體單位數(shù)。按中位數(shù)位次找出這個(gè)標(biāo)志值就是中位數(shù)。
(2)單項(xiàng)分組資料計(jì)算中位數(shù)
n+1
中位數(shù)位次= 2 然后順著累計(jì)次數(shù)找到中位數(shù)位次值所在的組,該組的標(biāo)志值就是中位數(shù)
(3)組距分組資料計(jì)算中位數(shù)
a先用 Sf 公式確定中位數(shù)所在組的位置,然后用下限公式計(jì)算中位數(shù)的值
2
b下限公式:
Md為中位數(shù),L為中位數(shù)所在組的下限,fm為中位數(shù)所在組的次數(shù),cfm-1為中位數(shù)所在組以下的累積次數(shù),Sf為累計(jì)數(shù),i為中位數(shù)所在組的組距。
6算術(shù)平均數(shù)是以總體各單位數(shù)值之和除以總體單位總數(shù)的商。
計(jì)算:
(1)簡(jiǎn)單算術(shù)平均數(shù)的計(jì)算
(2)加權(quán)算術(shù)平均數(shù)的計(jì)算(單項(xiàng)分組資料求算術(shù)平均數(shù)的計(jì)算)
當(dāng)使用第二手資料的統(tǒng)計(jì)表計(jì)算平均數(shù)的時(shí)候,要用加權(quán)平均數(shù)法進(jìn)行計(jì)算
其中f為權(quán)數(shù),即變量在總體中出現(xiàn)的次數(shù)。書(shū)本325頁(yè)
(3)組距分組資料計(jì)算算術(shù)平均數(shù)
a:先計(jì)算出組中距
下組距+上組距
Xmid= 2
b:
書(shū)本326頁(yè)。
三 離中量數(shù)分析
1、離中量數(shù)(差異量數(shù))用以說(shuō)明調(diào)查對(duì)象在某一變量上的分散程度或差異幅度。
2、離中量數(shù)的作用:
(1)描述一組數(shù)據(jù)的差異情況
(2)對(duì)集中量數(shù)的代表性作補(bǔ)充說(shuō)明,差異量數(shù)越小,集中量數(shù)的代表性越大
3、常用的離中量數(shù)有:異眾比率、四分位差、標(biāo)準(zhǔn)差。
4、相對(duì)差異量數(shù):離散系數(shù)、標(biāo)準(zhǔn)分?jǐn)?shù)
四 相關(guān)與回歸分析
1、相關(guān)和回歸可分為單相關(guān)、一元回歸和多元相關(guān)、多元回歸
2、雙變量相關(guān)分析的作用是探尋兩個(gè)變量間的相關(guān)關(guān)系,不涉及兩個(gè)變量間有無(wú)因果關(guān)系,只是對(duì)客觀事務(wù)的一種描述。相關(guān)關(guān)系是一種非完全確定的關(guān)系,它只表示事物間的相互依存關(guān)系。雙變量間關(guān)系的精確度量通常使用相關(guān)系數(shù),定距變量是用皮爾遜系數(shù)(r),r的取值范圍-1~+1,r=0是不相關(guān),r絕對(duì)值=1是完全相關(guān)。r的大小分高度相關(guān)、中度相關(guān)、低度相關(guān)。
3、散點(diǎn)圖的六種圖形:
(1) 強(qiáng)正相關(guān) (2)弱正相關(guān) (3)強(qiáng)負(fù)相關(guān) (4)弱負(fù)相關(guān) (5)非線(xiàn)形相關(guān) (6)沒(méi)有相關(guān)關(guān)系或極弱的相關(guān)關(guān)系
4、回歸分析的作用是精確預(yù)測(cè)自變量的變化后因變量會(huì)改變多少,前提是兩變量有相關(guān)關(guān)系。從本質(zhì)上說(shuō)回歸分析具有推理的性質(zhì),可以進(jìn)行預(yù)測(cè)。是一種因果關(guān)系但不同于相關(guān)關(guān)系的雙向性,它是單向的,這種因果關(guān)系不能顛倒。
5、回歸方程式表示為:y=a+bx
五 推論統(tǒng)計(jì)
1、描述性統(tǒng)計(jì)是依據(jù)樣本資料計(jì)算樣本的統(tǒng)計(jì)值
2、推論統(tǒng)計(jì)研究如何將樣本的統(tǒng)計(jì)值推論為總體的參數(shù)值。
3、推論統(tǒng)計(jì)主要有兩種方法,即區(qū)間估計(jì)和假設(shè)檢驗(yàn)。
習(xí)題
1、統(tǒng)計(jì)分析方法不僅是對(duì)客觀現(xiàn)象數(shù)量關(guān)系描述的工具,還是進(jìn)行科學(xué)抽象的思維方法。它使人們能夠發(fā)現(xiàn)靠直覺(jué)不能領(lǐng)悟到的規(guī)律,進(jìn)行準(zhǔn)確的科學(xué)預(yù)測(cè)。
2、統(tǒng)計(jì)分析包括:
(1)描述性統(tǒng)計(jì):說(shuō)明由樣本資料所表示的事物內(nèi)在的數(shù)量特征和數(shù)量關(guān)系
(2)推論性統(tǒng)計(jì):的目的是根據(jù)樣本資料對(duì)總體進(jìn)行推理
3、統(tǒng)計(jì)分析還可以分為單變量分析、雙變量分析和多變量分析。
4、統(tǒng)計(jì)分析的數(shù)字成果是運(yùn)用數(shù)學(xué)模型來(lái)描述、解釋、預(yù)測(cè)社會(huì)現(xiàn)象。
5、單變量分析是要描述一個(gè)現(xiàn)象的分布狀態(tài)的集中趨勢(shì)(或一般狀態(tài))和離中趨勢(shì)(或差異狀態(tài))。
6、中位數(shù)可以用于定距變量和定序變量的計(jì)算
7、中位數(shù)主要應(yīng)用于非數(shù)值的定序測(cè)量資料中,因?yàn)樯鐣?huì)調(diào)查中有許多資料屬于定序測(cè)量,所要它的應(yīng)用比算術(shù)平均數(shù)更為廣泛,這正是它的長(zhǎng)處。
8、通常把概率不超過(guò)0.05或0.01的事件當(dāng)作“小概率事件”,也稱(chēng)為顯著性水平。
9、集中量數(shù)、離中量數(shù)、相關(guān)量數(shù)、回歸量數(shù)都屬于描述性統(tǒng)計(jì)內(nèi)容。
10、可以表明原始數(shù)據(jù)在總體分布中相對(duì)位置的是標(biāo)準(zhǔn)分?jǐn)?shù)
資料分析包括統(tǒng)計(jì)分析、邏輯和理論分析。統(tǒng)計(jì)分析又分為:描述性統(tǒng)計(jì)、推論性統(tǒng)計(jì)。
一 統(tǒng)計(jì)分析的必要性與特點(diǎn)
1、統(tǒng)計(jì)分析是運(yùn)用統(tǒng)計(jì)學(xué)方法對(duì)調(diào)查得到的數(shù)據(jù)資料進(jìn)行定量分析,以揭示事物內(nèi)在的數(shù)量關(guān)系、規(guī)律和發(fā)展趨勢(shì)。它是人們認(rèn)識(shí)社會(huì)現(xiàn)象的重要手段。
2、定性預(yù)測(cè):根據(jù)事實(shí),運(yùn)用經(jīng)驗(yàn)和判斷能力,邏輯思維方法進(jìn)行的預(yù)測(cè)。
3、定量預(yù)測(cè):根據(jù)數(shù)據(jù)、統(tǒng)計(jì)資料,運(yùn)用統(tǒng)計(jì)分析方法進(jìn)行的預(yù)測(cè)。
4、統(tǒng)計(jì)分析的必要性表現(xiàn)在一下幾個(gè)方面:
(1)統(tǒng)計(jì)分析的方法可以為我們的研究提供一種清晰準(zhǔn)確的形式化語(yǔ)言
(2)統(tǒng)計(jì)分析是進(jìn)行科學(xué)預(yù)測(cè),探索未來(lái)的重要方法
(3)新的調(diào)查方法和技術(shù)要求運(yùn)用統(tǒng)計(jì)分析的方法
5、統(tǒng)計(jì)分析的特點(diǎn):
(1)統(tǒng)計(jì)分析要以定性分析為基礎(chǔ)(定性分析要為定量分析規(guī)定方向)
(2)統(tǒng)計(jì)分析方法必須和其他分析方法結(jié)合運(yùn)用
(3)統(tǒng)計(jì)分析有一套專(zhuān)門(mén)的方法和技術(shù)
二 集中量數(shù)分析
1、集中量數(shù)(集中趨勢(shì)):是一組數(shù)據(jù)的代表值,代表著現(xiàn)象的一般水平。用以說(shuō)明某一社會(huì)現(xiàn)象的一般狀態(tài)或平均狀態(tài)。
2、集中量數(shù)對(duì)不同層次的變量描述應(yīng)使用不同的統(tǒng)計(jì)量:
(1)對(duì)定類(lèi)變量,用“眾數(shù)”
(2)對(duì)定序變量,用“中位數(shù)”
(3)對(duì)定距變量,用“算術(shù)平均數(shù)”,也可以用“中位數(shù)”
3、集中量數(shù)的作用:
(1)說(shuō)明某一社會(huì)現(xiàn)象在一定條件下,其數(shù)量的一般水平
(2)對(duì)于在不同空間的同類(lèi)現(xiàn)象進(jìn)行比較
(3)對(duì)一定社會(huì)現(xiàn)象在不同時(shí)間中的變化進(jìn)行比較
(4)分析某些社會(huì)現(xiàn)象之間的依存關(guān)系
4、眾數(shù)是指在一組數(shù)據(jù)中重復(fù)次數(shù)最多的標(biāo)志值。
計(jì)算:
(1)單項(xiàng)分組數(shù)據(jù)資料計(jì)算眾數(shù)的方法比較簡(jiǎn)單,一般采用直接觀察法即可
書(shū)本328頁(yè),表12-3 直接觀察出現(xiàn)次數(shù)最多的標(biāo)志值是30,即某村青年文化程度的眾數(shù)是小學(xué)文化程度
(2)計(jì)算組距分組資料的眾數(shù),一種是組中值法,另一種是摘補(bǔ)法
L+U
組中值法:眾數(shù)= 2 ,L、U分別代表出現(xiàn)次數(shù)最多組的組上限和組下限。
計(jì)算眾數(shù)是要有條件的。只有在總體單位數(shù)量較多并且有明顯集中趨勢(shì)的資料才能計(jì)算眾數(shù)。
5中位數(shù)(位置平均數(shù))是把調(diào)查到的資料按照標(biāo)志值的大小順序排列,處于中央位置的標(biāo)志值表示中間位置的平均數(shù)。
計(jì)算:
(1)原始數(shù)據(jù)計(jì)算中位數(shù)
n+1
中位數(shù)位次= 2 n代表總體單位數(shù)。按中位數(shù)位次找出這個(gè)標(biāo)志值就是中位數(shù)。
(2)單項(xiàng)分組資料計(jì)算中位數(shù)
n+1
中位數(shù)位次= 2 然后順著累計(jì)次數(shù)找到中位數(shù)位次值所在的組,該組的標(biāo)志值就是中位數(shù)
(3)組距分組資料計(jì)算中位數(shù)
a先用 Sf 公式確定中位數(shù)所在組的位置,然后用下限公式計(jì)算中位數(shù)的值
2
b下限公式:
Md為中位數(shù),L為中位數(shù)所在組的下限,fm為中位數(shù)所在組的次數(shù),cfm-1為中位數(shù)所在組以下的累積次數(shù),Sf為累計(jì)數(shù),i為中位數(shù)所在組的組距。
6算術(shù)平均數(shù)是以總體各單位數(shù)值之和除以總體單位總數(shù)的商。
計(jì)算:
(1)簡(jiǎn)單算術(shù)平均數(shù)的計(jì)算
(2)加權(quán)算術(shù)平均數(shù)的計(jì)算(單項(xiàng)分組資料求算術(shù)平均數(shù)的計(jì)算)
當(dāng)使用第二手資料的統(tǒng)計(jì)表計(jì)算平均數(shù)的時(shí)候,要用加權(quán)平均數(shù)法進(jìn)行計(jì)算
其中f為權(quán)數(shù),即變量在總體中出現(xiàn)的次數(shù)。書(shū)本325頁(yè)
(3)組距分組資料計(jì)算算術(shù)平均數(shù)
a:先計(jì)算出組中距
下組距+上組距
Xmid= 2
b:
書(shū)本326頁(yè)。
三 離中量數(shù)分析
1、離中量數(shù)(差異量數(shù))用以說(shuō)明調(diào)查對(duì)象在某一變量上的分散程度或差異幅度。
2、離中量數(shù)的作用:
(1)描述一組數(shù)據(jù)的差異情況
(2)對(duì)集中量數(shù)的代表性作補(bǔ)充說(shuō)明,差異量數(shù)越小,集中量數(shù)的代表性越大
3、常用的離中量數(shù)有:異眾比率、四分位差、標(biāo)準(zhǔn)差。
4、相對(duì)差異量數(shù):離散系數(shù)、標(biāo)準(zhǔn)分?jǐn)?shù)
四 相關(guān)與回歸分析
1、相關(guān)和回歸可分為單相關(guān)、一元回歸和多元相關(guān)、多元回歸
2、雙變量相關(guān)分析的作用是探尋兩個(gè)變量間的相關(guān)關(guān)系,不涉及兩個(gè)變量間有無(wú)因果關(guān)系,只是對(duì)客觀事務(wù)的一種描述。相關(guān)關(guān)系是一種非完全確定的關(guān)系,它只表示事物間的相互依存關(guān)系。雙變量間關(guān)系的精確度量通常使用相關(guān)系數(shù),定距變量是用皮爾遜系數(shù)(r),r的取值范圍-1~+1,r=0是不相關(guān),r絕對(duì)值=1是完全相關(guān)。r的大小分高度相關(guān)、中度相關(guān)、低度相關(guān)。
3、散點(diǎn)圖的六種圖形:
(1) 強(qiáng)正相關(guān) (2)弱正相關(guān) (3)強(qiáng)負(fù)相關(guān) (4)弱負(fù)相關(guān) (5)非線(xiàn)形相關(guān) (6)沒(méi)有相關(guān)關(guān)系或極弱的相關(guān)關(guān)系
4、回歸分析的作用是精確預(yù)測(cè)自變量的變化后因變量會(huì)改變多少,前提是兩變量有相關(guān)關(guān)系。從本質(zhì)上說(shuō)回歸分析具有推理的性質(zhì),可以進(jìn)行預(yù)測(cè)。是一種因果關(guān)系但不同于相關(guān)關(guān)系的雙向性,它是單向的,這種因果關(guān)系不能顛倒。
5、回歸方程式表示為:y=a+bx
五 推論統(tǒng)計(jì)
1、描述性統(tǒng)計(jì)是依據(jù)樣本資料計(jì)算樣本的統(tǒng)計(jì)值
2、推論統(tǒng)計(jì)研究如何將樣本的統(tǒng)計(jì)值推論為總體的參數(shù)值。
3、推論統(tǒng)計(jì)主要有兩種方法,即區(qū)間估計(jì)和假設(shè)檢驗(yàn)。
習(xí)題
1、統(tǒng)計(jì)分析方法不僅是對(duì)客觀現(xiàn)象數(shù)量關(guān)系描述的工具,還是進(jìn)行科學(xué)抽象的思維方法。它使人們能夠發(fā)現(xiàn)靠直覺(jué)不能領(lǐng)悟到的規(guī)律,進(jìn)行準(zhǔn)確的科學(xué)預(yù)測(cè)。
2、統(tǒng)計(jì)分析包括:
(1)描述性統(tǒng)計(jì):說(shuō)明由樣本資料所表示的事物內(nèi)在的數(shù)量特征和數(shù)量關(guān)系
(2)推論性統(tǒng)計(jì):的目的是根據(jù)樣本資料對(duì)總體進(jìn)行推理
3、統(tǒng)計(jì)分析還可以分為單變量分析、雙變量分析和多變量分析。
4、統(tǒng)計(jì)分析的數(shù)字成果是運(yùn)用數(shù)學(xué)模型來(lái)描述、解釋、預(yù)測(cè)社會(huì)現(xiàn)象。
5、單變量分析是要描述一個(gè)現(xiàn)象的分布狀態(tài)的集中趨勢(shì)(或一般狀態(tài))和離中趨勢(shì)(或差異狀態(tài))。
6、中位數(shù)可以用于定距變量和定序變量的計(jì)算
7、中位數(shù)主要應(yīng)用于非數(shù)值的定序測(cè)量資料中,因?yàn)樯鐣?huì)調(diào)查中有許多資料屬于定序測(cè)量,所要它的應(yīng)用比算術(shù)平均數(shù)更為廣泛,這正是它的長(zhǎng)處。
8、通常把概率不超過(guò)0.05或0.01的事件當(dāng)作“小概率事件”,也稱(chēng)為顯著性水平。
9、集中量數(shù)、離中量數(shù)、相關(guān)量數(shù)、回歸量數(shù)都屬于描述性統(tǒng)計(jì)內(nèi)容。
10、可以表明原始數(shù)據(jù)在總體分布中相對(duì)位置的是標(biāo)準(zhǔn)分?jǐn)?shù)