konfidencia intervallumok

várható érték, normális sokaság, ismert szórás

  • adjunk 1α szintű konfidencia-intervallumot a sokasági várható értékre
    X¯μσn N(0,1)
  • 0-ra szimmetrikus intervallumot keresünk:
    P(c<X¯μσn<c)=1α
    Φ(c)=1α2 azaz c egy 1α2 kvantilis, ahol Φ a sztenderd normális eloszlásfv. Röviden a c=z1α2 jelölést használjuk.
In [37]:
# generált adatra N(22,2^2)
nX=50
X=2*rnorm(nX)+22
sigma=2
pk=seq(0.04,0.96,by=0.06)
qX=quantile(X,pk)
qno=qnorm(pk)
plot(qX,qno)
p=c(0.8,0.9,0.95,0.99)
pp=1-0.5*(1-p)
pp=qnorm(pp)
for( i in 1:4 ){
    print(c(szint=p[i],
            bal=mean(X)-pp[i]*sd(X)/sqrt(nX),
            jobb=mean(X)+pp[i]*sd(X)/sqrt(nX)))
}
   szint      bal     jobb 
 0.80000 21.39983 22.17592 
   szint      bal     jobb 
 0.90000 21.28982 22.28593 
   szint      bal     jobb 
 0.95000 21.19441 22.38134 
   szint      bal     jobb 
 0.99000 21.00793 22.56782 

várható érték, normális sokaság, ismeretlen szórás:

  • adjunk 1α szintű konfidencia-intervallumot a sokasági várható értékre
    X¯μskorrn tn1
  • 0-ra szimmetrikus intervallumot keresünk:
    P(c<X¯μskorrn<c)=1α
    Fn1(c)=1α2 azaz c egy 1α2 kvantilis, ahol Fn1 az n1 szabadsági fokú Student v.v. eloszlásfv.-e. Rövidebben: c=tn1,1α2.
In [36]:
data(iris)
#head(iris)
X=iris[iris$Species=="setosa","Sepal.Length"]
#hist(X)
#plot(density(X))
summary(X)
nX=length(X)
pk=seq(0.05,0.95,by=0.05)
qX=quantile(X,pk)
qno=qnorm(pk)
plot(qX,qno)
p=c(0.8,0.9,0.95,0.99)
pp=1-0.5*(1-p)
pp=qt(df=nX-1,pp)
for( i in 1:4 ){
    print(c(szint=p[i],
            bal=mean(X)-pp[i]*sd(X)/sqrt(nX),
            jobb=mean(X)+pp[i]*sd(X)/sqrt(nX)))
}
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  4.300   4.800   5.000   5.006   5.200   5.800 
   szint      bal     jobb 
0.800000 4.941242 5.070758 
   szint      bal     jobb 
0.900000 4.922425 5.089575 
   szint      bal     jobb 
0.950000 4.905824 5.106176 
   szint      bal     jobb 
0.990000 4.872406 5.139594 

konfidencia-intervalum szórásnégyzetre

  • adjunk 1α=0.8,0.9,0.95,0.99 szintű konfidencia-intervallumot a sokasági szórásnégyzetre (szórásra).
  • normális sokaság
  • bizonyítható, hogy X1,,Xn FAE minta esetén:
    (n1)skorr2σ2 χn12
  • olyan ca,cf-et keresünk, melyekkel:
    P(ca<χn12<cf)=1α
    • ca=χn1,α22 és cf=χn1,1α22 számok pont megfelelőek
  • azaz:
    P((n1)skorr2cf<σ2<(n1)skorr2ca)=1α
    P(skorrn1cf<σ<skorrn1ca)=1α

konfidencia-intervalum sokasági arányra

  • adjunk 1α=0.8,0.9,0.95,0.99 szintű konfidencia-intervallumot a sokasági arányra.
  • közelítés: központi h.t.
  • Legyen p^=X¯ és P az elméleti arány.
    p^Pp^(1p^)n N(0,1)
  • n50 és nem túl extrém p^-re megbízható: min(np^,n(1p^))5.
In [44]:
# feladatsor sokasági arány, 1. feladat
k=5
n=100
pk=k/n
alpha=0.1
z=qnorm(1-0.5*alpha)
delta=sqrt(pk*(1-pk))*z/sqrt(n)
print(c(szint=1-alpha,bal=pk-delta,jobb=pk+delta))
     szint        bal       jobb 
0.90000000 0.01415125 0.08584875 

Csebisev

  • amikor csak a szórás (σ) ismert, de nincs az eloszlásról információ és a μ=E(X)-et akarjuk becsülni:
    P(|Xμ|<d)1σ2d2
In [51]:
# gyufás feladat
x=47:53
p=c(5,10,15,40,15,10,5)/100
valasz1=sum(p[2:4])
print(c(igazi=valasz1))
mu=sum(p*x)
sig2=sum(p*x^2)-mu^2
# print(c(mu=mu, sig2=sig2))
# d=2-vel Csebisev
print(c(csebisev=1-sig2/4))
igazi 
 0.65 
csebisev 
     0.5