一致估計(jì)亦稱相合估計(jì)和相容估計(jì),是一種優(yōu)良點(diǎn)估計(jì)。按收斂的意義不同將一致估計(jì)分為兩種:弱一致估計(jì)和強(qiáng)一致估計(jì)。

點(diǎn)估計(jì)又稱定值估計(jì),是指直接用樣本平均數(shù)或樣本成數(shù)代替總體平均數(shù)或成數(shù),而不考慮誤差的一種估計(jì)方法。例如對(duì)100名大學(xué)生進(jìn)行收視率調(diào)查,調(diào)查結(jié)果是30%每天收看電視新聞,從而推斷, 在全體大學(xué)生中30%每天收看電視新聞。

概念

一致估計(jì)(consistent estimator)亦稱相合估計(jì)和相容估計(jì)。是一種優(yōu)良點(diǎn)估計(jì)。設(shè)總體ξ的概率分布函數(shù)為

為未知參數(shù),若可估函數(shù)g(θ)估計(jì)量

當(dāng)n趨于無窮時(shí),在某種意義下收斂于g(θ),則稱

在這種收斂意義下的一致估計(jì)。它要求作為估計(jì)量的統(tǒng)計(jì)量,當(dāng)樣本容量無限增大時(shí),在某種意義下,收斂于待估計(jì)參數(shù)的真值。按收斂的意義不同將一致估計(jì)分為兩種:若當(dāng)樣本容量

時(shí),對(duì)任意給定的

,有:

稱為

的弱一致估計(jì);若有:

稱為

的強(qiáng)一致估計(jì)。一致估計(jì)是點(diǎn)估計(jì)中最基本的大樣本準(zhǔn)則。例如,正態(tài)總體

的樣本均值ξ就是

的一致估計(jì),因?yàn)楦鶕?jù)大數(shù)定律,對(duì)任給

,當(dāng)

時(shí),有:

成立。這就表明ξ是E(ξ)的弱一致估計(jì)。

估計(jì)

根據(jù)觀測(cè)值來推測(cè)母體參數(shù)的值或范圍的過程稱為估計(jì)。估計(jì)分為點(diǎn)估計(jì)和區(qū)間估 計(jì)。點(diǎn)估計(jì),是根據(jù)觀測(cè)值估計(jì)出對(duì)母體參數(shù)θ的估計(jì)值

的過程。例如,在進(jìn)行燈泡壽命測(cè)定時(shí),根據(jù)幾個(gè)燈泡壽命 來推測(cè)一批燈泡壽命的過程,就為點(diǎn)估計(jì)。其過程是:先抽取若干個(gè)燈泡做樣本來測(cè)取壽命值 (以小時(shí)為單位) ,樣本的壽命分別是

,求出平均值

和方差:

此時(shí)就用平均壽命去估計(jì)母體壽命μ,用方差S去估計(jì)母體 σ,即是點(diǎn)估計(jì)。

點(diǎn)估計(jì)

點(diǎn)估計(jì)又稱定值估計(jì),是指直接用樣本平均數(shù)或樣本成數(shù)代替總體平均數(shù)或成數(shù),而不考慮誤差的一種估計(jì)方法。例如對(duì)100名大學(xué)生進(jìn)行收視率調(diào)查,調(diào)查結(jié)果是

每天收看電視新聞,從而推斷,在全體大學(xué)生中

每天收看電視新聞。

一般說來,用抽樣指標(biāo)估計(jì)總體指標(biāo),總會(huì)存在一定差異,但如果滿足下面3個(gè)要求,就可認(rèn)為是合理估計(jì)或優(yōu)良估計(jì)。1.無偏性。用抽樣指標(biāo)估計(jì)總體指標(biāo)時(shí),個(gè)別樣本指標(biāo)與總體指標(biāo)間會(huì)有偏差,而用很多樣本指標(biāo)的平均值估計(jì)總體指標(biāo),平均說來是無偏差的。2.一致性。用抽樣指標(biāo)估計(jì)總體指標(biāo),當(dāng)樣本單位數(shù)充分大時(shí),抽樣指標(biāo)將充分接近總體指標(biāo)。3.有效性。用抽樣平均數(shù)和總體某一變量來估計(jì)總體平均數(shù)時(shí),雖然兩者都是無偏估計(jì)量,但樣本平均數(shù)更靠近總體平均數(shù),平均說來,它的離差較小,因此,是更優(yōu)良的估計(jì)量。

區(qū)間估計(jì)

設(shè)總體或總體分布的某個(gè)參數(shù)為θ,從該總體抽取含量為n的樣本,按一定概率估計(jì)總體參數(shù)θ在哪個(gè)范圍,即由樣本觀測(cè)值求θ的

可信區(qū)間,

稱可信度,通常取95%可信度,即

,求θ的

可信區(qū)間。如求總體均數(shù)μ的

可信區(qū)間,求總體率π的

可信區(qū)間,求總體回歸系數(shù)β的

可信區(qū)間等。θ的區(qū)間估計(jì)常和其點(diǎn)估計(jì)θ相結(jié)合。一般當(dāng)樣本含量較大時(shí)(如

),θ近似服從正態(tài)分布,可用正態(tài)近似法求總體參數(shù)的

可信區(qū)間:

或簡寫成

。

為θ的標(biāo)準(zhǔn)誤。通常求總體參數(shù)θ的

可信區(qū)間:

或簡寫成

。可信區(qū)間的含義為:固定樣本含量n,從總體中作隨機(jī)抽樣,每個(gè)樣本可以算得一個(gè)可信區(qū)間,如

可信區(qū)間,意味著做100次抽樣,算得100個(gè)可信區(qū)間,平均有95個(gè)可信區(qū)間包括總體參數(shù)(估計(jì)正確),只有5個(gè)可信區(qū)間不包括總體參數(shù)(估計(jì)錯(cuò)誤)。

是小概率事件,實(shí)際發(fā)生的可能性小,因此,在實(shí)際應(yīng)用中就認(rèn)為總體參數(shù)在算得的一個(gè)可信區(qū)間內(nèi),冒5%犯錯(cuò)誤的風(fēng)險(xiǎn)??尚艆^(qū)間的兩個(gè)要素:一是準(zhǔn)確度,反映在可信度

的大小,越接近1越準(zhǔn)確,如可信度

準(zhǔn)確;二是精密度,反映在區(qū)間的長度,越小越精密。二者是矛盾的,需要兼顧。

統(tǒng)計(jì)量

樣本的已知函數(shù),其作用是把樣本中有關(guān)總體的信息匯集起來,是數(shù)理統(tǒng)計(jì)學(xué)中一個(gè)重要的基本概念。常用統(tǒng)計(jì)量有樣本矩、次序統(tǒng)計(jì)量、U統(tǒng)計(jì)量和秩統(tǒng)計(jì)量等。其中U統(tǒng)計(jì)量是W.霍夫丁于1948年引進(jìn)的。統(tǒng)計(jì)量的充分性和完全性是兩個(gè)重要概念,充分性是費(fèi)希爾在1925年引進(jìn)的,內(nèi)曼和P.R.哈爾莫斯在1949年嚴(yán)格證明了一個(gè)判定統(tǒng)計(jì)量充分性的方法,叫做因子分解定理。統(tǒng)計(jì)量的分布叫做抽樣分布,它的研究是數(shù)理統(tǒng)計(jì)中的重要課題。對(duì)一維正態(tài)總體,有三個(gè)重要的抽樣分布,即χ分布、t分布和F分布。其中χ分布是F.赫爾梅特于1875年在研究正態(tài)總體的樣本方差時(shí)得到的;t分布是英國統(tǒng)計(jì)學(xué)家W.S.戈塞特(筆名“學(xué)生”)于1908年提出的;F分布是費(fèi)希爾在20世紀(jì)20年代提出的。