第四節(jié) 參數(shù)估計(jì)
根據(jù)樣本對(duì)總體進(jìn)行推斷是數(shù)理統(tǒng)計(jì)的核心,參數(shù)估計(jì)與假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩個(gè)基本內(nèi)容。本節(jié)著重討論參數(shù)估計(jì)問(wèn)題。
這里所說(shuō)的參數(shù)主要是指如下幾類(lèi):
①分布中的未知參數(shù),如二項(xiàng)分布b(n,p)中的p,正態(tài)分布 中的 , 或 。
②分布的均值E(x)、方差Var(x)等未知特征數(shù)。
③其他未知參數(shù),如某事件的概率P(A)等。
上述未知參數(shù)都需要根據(jù)樣本和參數(shù)的統(tǒng)計(jì)含義選擇適宜的統(tǒng)計(jì)量并作出估計(jì),這一統(tǒng)計(jì)推斷過(guò)程通稱(chēng)為參數(shù)估計(jì)。未知參數(shù)通常用 表示。
參數(shù)估計(jì)有兩種基本形式:點(diǎn)估計(jì)與區(qū)間估計(jì)。
一、點(diǎn)估計(jì)
(一) 點(diǎn)估計(jì)的概念
設(shè) 是總體的一個(gè)未知參數(shù),記與總體對(duì)應(yīng)的隨機(jī)變量為X,從中抽取樣本量為n的一個(gè)樣本 。根據(jù)這個(gè)樣本,構(gòu)造一個(gè)統(tǒng)計(jì)量 ,用 來(lái)對(duì) 進(jìn)行估計(jì),稱(chēng) 為 的點(diǎn)估計(jì)量。對(duì)一個(gè)具體的樣本 ,可計(jì)算 的一個(gè)具體的數(shù)值,稱(chēng)為 的估計(jì)值。在本教材中,除討論統(tǒng)計(jì)量的分布及性質(zhì)外,不嚴(yán)格區(qū)分估計(jì)量及具體估計(jì)值,通稱(chēng)為估計(jì)。
(二)點(diǎn)估計(jì)優(yōu)良性標(biāo)準(zhǔn)
點(diǎn)估計(jì)量 是隨所抽取的樣本不同而不同的,它是一個(gè)隨機(jī)變量。評(píng)價(jià)一個(gè)估計(jì)量 的優(yōu)劣不能從一個(gè)具體樣本獲得的估計(jì)值來(lái)評(píng)判,應(yīng)該從多次使用中來(lái)評(píng)定。
對(duì)于一個(gè)特定的樣本,估計(jì)值 與 的真值之間總是有偏差的,但由于 未知,因此偏差 也未知。但是我們可以通過(guò)多次抽樣,對(duì)不同樣本, 不同的具體估計(jì)值,對(duì)實(shí)際偏差 進(jìn)行“平均”。當(dāng)然這種平均不能直接進(jìn)行,因?yàn)?有正有負(fù),直接平均由于正負(fù)抵消反而不能反映誤差。與以前對(duì)方差處理的方法相仿,用估計(jì)偏差的平方 來(lái)代替,并對(duì)其求均值,于是用 來(lái)表示估計(jì)量 的優(yōu)劣。這個(gè)量稱(chēng)為 的均方誤差,簡(jiǎn)記為MSE( ),均方誤差實(shí)際上是平均平方誤差的意思。雖然由于 是未知的,MSE( )也并不是總能求得的。但是經(jīng)過(guò)簡(jiǎn)單的推導(dǎo),總有
MSE( )= 。 (交叉乘積項(xiàng)為零)
(1.4-1)
(1.4-1)式中的第一項(xiàng) = 表示的是 的均值E( )與未知參數(shù) 的差,稱(chēng)為偏倚;當(dāng) =0時(shí),也即:
E( )= 或 時(shí),稱(chēng)估計(jì)量 是無(wú)偏的,否則稱(chēng)為有偏的。無(wú)偏性是表示估計(jì)量?jī)?yōu)良性的一個(gè)重要標(biāo)準(zhǔn)。只要有可能,應(yīng)該盡可能選用無(wú)偏估計(jì)量,或近似無(wú)偏估計(jì)量。應(yīng)該注意,使用無(wú)偏估計(jì) 估計(jì) 時(shí),每次使用是有偏差的,只是多次使用時(shí)其平均偏差為零。
(1.4-1)式中的第二項(xiàng)表示的是 對(duì)其均值E( )差的平方的均值,它是估計(jì)量的方差。對(duì)于無(wú)偏估計(jì)量,當(dāng)然方差愈小愈好。方差 愈小,稱(chēng)估計(jì)量更有效。有效性是判定估計(jì)量?jī)?yōu)良性的另一個(gè)標(biāo)準(zhǔn)。
根據(jù)樣本對(duì)總體進(jìn)行推斷是數(shù)理統(tǒng)計(jì)的核心,參數(shù)估計(jì)與假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩個(gè)基本內(nèi)容。本節(jié)著重討論參數(shù)估計(jì)問(wèn)題。
這里所說(shuō)的參數(shù)主要是指如下幾類(lèi):
①分布中的未知參數(shù),如二項(xiàng)分布b(n,p)中的p,正態(tài)分布 中的 , 或 。
②分布的均值E(x)、方差Var(x)等未知特征數(shù)。
③其他未知參數(shù),如某事件的概率P(A)等。
上述未知參數(shù)都需要根據(jù)樣本和參數(shù)的統(tǒng)計(jì)含義選擇適宜的統(tǒng)計(jì)量并作出估計(jì),這一統(tǒng)計(jì)推斷過(guò)程通稱(chēng)為參數(shù)估計(jì)。未知參數(shù)通常用 表示。
參數(shù)估計(jì)有兩種基本形式:點(diǎn)估計(jì)與區(qū)間估計(jì)。
一、點(diǎn)估計(jì)
(一) 點(diǎn)估計(jì)的概念
設(shè) 是總體的一個(gè)未知參數(shù),記與總體對(duì)應(yīng)的隨機(jī)變量為X,從中抽取樣本量為n的一個(gè)樣本 。根據(jù)這個(gè)樣本,構(gòu)造一個(gè)統(tǒng)計(jì)量 ,用 來(lái)對(duì) 進(jìn)行估計(jì),稱(chēng) 為 的點(diǎn)估計(jì)量。對(duì)一個(gè)具體的樣本 ,可計(jì)算 的一個(gè)具體的數(shù)值,稱(chēng)為 的估計(jì)值。在本教材中,除討論統(tǒng)計(jì)量的分布及性質(zhì)外,不嚴(yán)格區(qū)分估計(jì)量及具體估計(jì)值,通稱(chēng)為估計(jì)。
(二)點(diǎn)估計(jì)優(yōu)良性標(biāo)準(zhǔn)
點(diǎn)估計(jì)量 是隨所抽取的樣本不同而不同的,它是一個(gè)隨機(jī)變量。評(píng)價(jià)一個(gè)估計(jì)量 的優(yōu)劣不能從一個(gè)具體樣本獲得的估計(jì)值來(lái)評(píng)判,應(yīng)該從多次使用中來(lái)評(píng)定。
對(duì)于一個(gè)特定的樣本,估計(jì)值 與 的真值之間總是有偏差的,但由于 未知,因此偏差 也未知。但是我們可以通過(guò)多次抽樣,對(duì)不同樣本, 不同的具體估計(jì)值,對(duì)實(shí)際偏差 進(jìn)行“平均”。當(dāng)然這種平均不能直接進(jìn)行,因?yàn)?有正有負(fù),直接平均由于正負(fù)抵消反而不能反映誤差。與以前對(duì)方差處理的方法相仿,用估計(jì)偏差的平方 來(lái)代替,并對(duì)其求均值,于是用 來(lái)表示估計(jì)量 的優(yōu)劣。這個(gè)量稱(chēng)為 的均方誤差,簡(jiǎn)記為MSE( ),均方誤差實(shí)際上是平均平方誤差的意思。雖然由于 是未知的,MSE( )也并不是總能求得的。但是經(jīng)過(guò)簡(jiǎn)單的推導(dǎo),總有
MSE( )= 。 (交叉乘積項(xiàng)為零)
(1.4-1)
(1.4-1)式中的第一項(xiàng) = 表示的是 的均值E( )與未知參數(shù) 的差,稱(chēng)為偏倚;當(dāng) =0時(shí),也即:
E( )= 或 時(shí),稱(chēng)估計(jì)量 是無(wú)偏的,否則稱(chēng)為有偏的。無(wú)偏性是表示估計(jì)量?jī)?yōu)良性的一個(gè)重要標(biāo)準(zhǔn)。只要有可能,應(yīng)該盡可能選用無(wú)偏估計(jì)量,或近似無(wú)偏估計(jì)量。應(yīng)該注意,使用無(wú)偏估計(jì) 估計(jì) 時(shí),每次使用是有偏差的,只是多次使用時(shí)其平均偏差為零。
(1.4-1)式中的第二項(xiàng)表示的是 對(duì)其均值E( )差的平方的均值,它是估計(jì)量的方差。對(duì)于無(wú)偏估計(jì)量,當(dāng)然方差愈小愈好。方差 愈小,稱(chēng)估計(jì)量更有效。有效性是判定估計(jì)量?jī)?yōu)良性的另一個(gè)標(biāo)準(zhǔn)。