konfidencia intervallumok¶

várható érték, normális sokaság, ismert szórás¶

adjunk $1-\alpha$ szintű konfidencia-intervallumot a sokasági várható értékre $\frac{\bar{X} - μ}{\frac{σ}{\sqrt{n}}} \sim N (0, 1)$ $\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}} \ \sim {\cal N}(0,1)$
0-ra szimmetrikus intervallumot keresünk: $P (- c < \frac{\bar{X} - μ}{\frac{σ}{\sqrt{n}}} < c) = 1 - α$ $\mathbb{P}\left(-c< \frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}} <c\right)=1-\alpha$ $\Phi(c)=1-\frac{\alpha}{2}$ azaz $c$ egy $1-\frac{\alpha}{2}$ kvantilis, ahol $\Phi$ a sztenderd normális eloszlásfv. Röviden a $c=z_{1-\frac{\alpha}{2}}$ jelölést használjuk.

# generált adatra N(22,2^2)
nX=50
X=2*rnorm(nX)+22
sigma=2
pk=seq(0.04,0.96,by=0.06)
qX=quantile(X,pk)
qno=qnorm(pk)
plot(qX,qno)
p=c(0.8,0.9,0.95,0.99)
pp=1-0.5*(1-p)
pp=qnorm(pp)
for( i in 1:4 ){
    print(c(szint=p[i],
            bal=mean(X)-pp[i]*sd(X)/sqrt(nX),
            jobb=mean(X)+pp[i]*sd(X)/sqrt(nX)))
}

   szint      bal     jobb 
 0.80000 21.39983 22.17592 
   szint      bal     jobb 
 0.90000 21.28982 22.28593 
   szint      bal     jobb 
 0.95000 21.19441 22.38134 
   szint      bal     jobb 
 0.99000 21.00793 22.56782

várható érték, normális sokaság, ismeretlen szórás:¶

adjunk $1-\alpha$ szintű konfidencia-intervallumot a sokasági várható értékre $\frac{\bar{X} - μ}{\frac{s_{k o r r}}{\sqrt{n}}} \sim t_{n - 1}$ $\frac{\overline{X}-\mu}{\frac{s_{korr}}{\sqrt{n}}} \ \sim t_{n-1}$
0-ra szimmetrikus intervallumot keresünk: $P (- c < \frac{\bar{X} - μ}{\frac{s_{k o r r}}{\sqrt{n}}} < c) = 1 - α$ $\mathbb{P}\left(-c< \frac{\overline{X}-\mu}{\frac{s_{korr}}{\sqrt{n}}} <c\right)=1-\alpha$ $F_{n-1}(c)=1-\frac{\alpha}{2}$ azaz $c$ egy $1-\frac{\alpha}{2}$ kvantilis, ahol $F_{n-1}$ az $n-1$ szabadsági fokú Student v.v. eloszlásfv.-e. Rövidebben: $c=t_{n-1,1-\frac{\alpha}{2}}$ .

data(iris)
#head(iris)
X=iris[iris$Species=="setosa","Sepal.Length"]
#hist(X)
#plot(density(X))
summary(X)
nX=length(X)
pk=seq(0.05,0.95,by=0.05)
qX=quantile(X,pk)
qno=qnorm(pk)
plot(qX,qno)
p=c(0.8,0.9,0.95,0.99)
pp=1-0.5*(1-p)
pp=qt(df=nX-1,pp)
for( i in 1:4 ){
    print(c(szint=p[i],
            bal=mean(X)-pp[i]*sd(X)/sqrt(nX),
            jobb=mean(X)+pp[i]*sd(X)/sqrt(nX)))
}

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  4.300   4.800   5.000   5.006   5.200   5.800

   szint      bal     jobb 
0.800000 4.941242 5.070758 
   szint      bal     jobb 
0.900000 4.922425 5.089575 
   szint      bal     jobb 
0.950000 4.905824 5.106176 
   szint      bal     jobb 
0.990000 4.872406 5.139594

konfidencia-intervalum szórásnégyzetre¶

adjunk $1-\alpha=0.8,0.9,0.95,0.99$ szintű konfidencia-intervallumot a sokasági szórásnégyzetre (szórásra).
normális sokaság
bizonyítható, hogy $X_1,\ldots,X_n$ FAE minta esetén: $\frac{(n - 1) s_{k o r r}^{2}}{σ^{2}} \sim χ_{n - 1}^{2}$ $\frac{(n-1)s^2_{korr}}{\sigma^2}\ \sim \chi^2_{n-1}$
olyan -et keresünk, melyekkel:
$P (c_{a} < χ_{n - 1}^{2} < c_{f}) = 1 - α$
- $c_a=\chi^2_{n-1,\frac{\alpha}{2}}$ és $c_f=\chi^2_{n-1,1-\frac{\alpha}{2}}$ számok pont megfelelőek
azaz: $P (\frac{(n - 1) s_{k o r r}^{2}}{c_{f}} < σ^{2} < \frac{(n - 1) s_{k o r r}^{2}}{c_{a}}) = 1 - α$ $\mathbb{P}\left( \frac{(n-1)s^2_{korr}}{c_f} < \sigma^2 < \frac{(n-1)s^2_{korr}}{c_a}\right)=1-\alpha$ $P (s_{k o r r} \sqrt{\frac{n - 1}{c_{f}}} < σ < s_{k o r r} \sqrt{\frac{n - 1}{c_{a}}}) = 1 - α$ $\mathbb{P}\left( s_{korr}\sqrt{\frac{n-1}{c_f}} < \sigma < s_{korr}\sqrt{\frac{n-1}{c_a}}\right)=1-\alpha$

konfidencia-intervalum sokasági arányra¶

adjunk $1-\alpha=0.8,0.9,0.95,0.99$ szintű konfidencia-intervallumot a sokasági arányra.
közelítés: központi h.t.
Legyen $\hat{p}=\overline{X}$ és $P$ az elméleti arány. $\frac{\hat{p} - P}{\sqrt{\hat{p} (1 - \hat{p})}} \sqrt{n} \sim N (0, 1)$ $\frac{\hat{p}-P}{\sqrt{\hat{p}(1-\hat{p})}}\sqrt{n} \ \sim \cal{N}(0,1)$
$n\ge 50$ és nem túl extrém $\hat{p}$ -re megbízható: $\min(n\hat{p},n(1-\hat{p}))\ge 5$ .

# feladatsor sokasági arány, 1. feladat
k=5
n=100
pk=k/n
alpha=0.1
z=qnorm(1-0.5*alpha)
delta=sqrt(pk*(1-pk))*z/sqrt(n)
print(c(szint=1-alpha,bal=pk-delta,jobb=pk+delta))

     szint        bal       jobb 
0.90000000 0.01415125 0.08584875

Csebisev¶

amikor csak a szórás ( $\sigma$ ) ismert, de nincs az eloszlásról információ és a $\mu=\mathbb{E}(X)$ -et akarjuk becsülni: $P (| X - μ | < d) \geq 1 - \frac{σ^{2}}{d^{2}}$ $\mathbb{P}\left( |X-\mu | < d\right) \ge 1-\frac{\sigma^2}{d^2}$

# gyufás feladat
x=47:53
p=c(5,10,15,40,15,10,5)/100
valasz1=sum(p[2:4])
print(c(igazi=valasz1))
mu=sum(p*x)
sig2=sum(p*x^2)-mu^2
# print(c(mu=mu, sig2=sig2))
# d=2-vel Csebisev
print(c(csebisev=1-sig2/4))

igazi 
 0.65 
csebisev 
     0.5