• table,barplot,hist
  • par,mfrow,mfcol
In [99]:
n=1000
dsz=ceiling(log(n)/3)
minta=floor(rnorm(n)*dsz)+1
tm=table(minta)/n
par(mfrow=c(2,1))
barplot(tm)
hist(minta)
  • becslések összehasonlítása - hatásosság
  • mutassuk meg, hogy a sokasági várható érték
    kαkXk,   kαk=1,αk0
    alakú becslései közül a mintaátlag a leghatásosabb.
  • rnorm,sample,append,paste
In [100]:
X=rnorm(100000) # ez a sokaság, sztenderd normális
mu=mean(X)
n=10 # ennyi elemű mintákat vizsgálunk a sokaságból
alpha=c(3,2,1,10,1,1,2,1,1,6)
alpha=alpha/sum(alpha)
ism=100
r1=c()
r2=c()
for(it in 1:ism){
    x=sample(X,n,replace = T)
    r1=append(r1,mean(x))
    r2=append(r2,sum(x*alpha))
}
mx=max(abs(r1),abs(r2)) # egyforma lim mindket abran

par(mfrow=c(2,2))
s1=paste("sd =",toString(sd(r1)))
plot(r1,ylim=c(-mx,mx),xlab=s1)
s2=paste("sd =",toString(sd(r2)))
plot(r2,ylim=c(-mx,mx),xlab=s2)
  • mutassuk meg hogy
    E(k(XkX¯)2n1)=σ2
  • vizsgáljuk meg ezt R-ben is, az alábbi eloszlásokkal:
    • rnorm,runif,rexp,rbinom,rpois
In [101]:
N=10 # minták elemszáma
ISM=1000 # ennyiszer veszünk mintát
r=c() # az eredmények
for(it in 1:ISM){
    x=rnorm(N)
    x=sum((x-mean(x))^2)
    r=append(r,x)
}
mx=max(r/(N-1)) # histogram bin-ekhez határ

r=r/N
par(mfcol=c(2,2))
atlag=mean(r)
plot(r,ylim=c(0,4),xlab=toString(atlag))
abline(h=1,col="red")
hist(r,seq(0,mx,by=mx/7),probability = T)

r=N*r/(N-1)
atlag=mean(r)
plot(r,ylim=c(0,4),xlab=toString(atlag))
abline(h=1,col="red")
hist(r,seq(0,mx,by=mx/7),probability = T)
In [102]:
data(iris)
head(iris)
x=iris[iris$Species=="setosa","Sepal.Length"]
#summary(x)
#hist(x)
#plot(density(x))
sx=(x-mean(x))/sd(x)
pk=seq(0.1,0.9,by=0.1)
qsx=quantile(sx,pk)
qno=qnorm(pk)
plot(qsx,qno)
A data.frame: 6 × 5
Sepal.LengthSepal.WidthPetal.LengthPetal.WidthSpecies
<dbl><dbl><dbl><dbl><fct>
15.13.51.40.2setosa
24.93.01.40.2setosa
34.73.21.30.2setosa
44.63.11.50.2setosa
55.03.61.40.2setosa
65.43.91.70.4setosa