valség

\[ \def\P{\mathbf{P}} \def\O{\emptyset} \def\R{\mathbb{R}} \def\E{\mathbf{E}} \def\D{\mathbf{D}} \def\cov{\rm{cov}} \def\corr{\rm{corr}} \]

eseménytér

$\Omega$: összes kimenetel, eseménytér, nemüres halmaz
- itt még nincsen valség, csak részhalmazok
$\omega \in \Omega$: elemi események,
$A\subset \Omega$: esemény
- ezt pontosítani kellene mert általában nem tekintünk minden részhalmazt eseménynek
- biztos esemény: $\Omega$
- lehetetlen esemény: $\O$, üreshalmaz
$A+B$: valamelyik bekövetkezik
$A\cdot B$: mindegyik bekövetkezik
$\overline{A}$: $A$ nem következik be
$A-B=A\cdot \overline{B}$: $A$ bekövetkezik és/de $B$ nem
$A\subset B$: $A$ maga után vonja $B$-t
de Morgan
- nem igaz hogy valamelyik $\equiv$ egyik sem: $\overline{A+B} = \overline{A}\cdot\overline{B}$
- nem igaz hogy mindegyik $\equiv$ egyik sem: $\overline{A\cdot B} = \overline{A}+\overline{B}$
- ezek tetszőleges számú eseményre igazak
ha $A\cdot B=\O$, akkor azt mondjuk hogy $A$ és $B$ kizáró események (diszjunktak)

valószínűség (P)

a valószínűség egy függvény, $\P:\cal{A}\to {\rm [0,1]}$
$\cal{A}\subset 2^{\Omega}$, azaz $\Omega$ részhalmazazinak bizonyos rendszere ($\sigma$-algebra)
- $\Omega, \O \in \cal{A}$
követelmények (azaz ilyennek kell lennie)
- $\P(\Omega)=1$
- $\P(A+B)=\P(A) + \P(B)$ ha $A\cdot B=\O$
  - ezt tetszőleges, megszámlálható páronként kizáró eseménysorozatra szokták megkövetelni: $\P(\sum_{k} A_{k})=\sum_{k}\P(A_{k})$
tulajdonságok:
- $\P(\O)=0$
- $\P(\overline{A})=1-\P(A)$
- $A\subset B \implies \P(A)\le \P(B)$
- $\P(A+B)=\P(A)+\P(B)-\P(A\cdot B)$
  - ez a szita formula 2 eseményre

klasszikus - kedvező/összes - kiszámolási mód

$\Omega$ véges ($N$ elemű) és azt feltételezzük/tudjuk hogy az elemi események egyformán valószínűek
$\P(A)=\frac{K}{N}$ ahol $K$ az $A$ elemeinek száma

geometriai - kedvező méret/összes méret - kiszámolási mód

méret = terület/térfogat.
$\Omega \subset \R^{2,3}$ és "véletlenszerűen"/egyenletesen választunk pontot $\Omega$-ból.
$\P(A)=\frac{A\ \ \rm{mérete}}{\Omega\ {\rm mérete}}$
azt később látjuk majd hogy mit jelent egyenletesen húzni egy pontot mondjuk egy körlemezből.
a klasszikus kiszámolási mód az, amikor a méret a darabszám

feltételes valség/függetlenség

$\P(A\vert B)=\frac{\P(A\cdot B)}{\P(B)}$
- $\P(B)>0$
- $A$ feltételes valsége $B$-re nézve
- péÁfeltéveBé
- $A$ valsége ha tudjuk, hogy $B$ bekövetkezett.
- bizonyos plusz információ birtokában számoljuk a ki egy esemény valségét
ha $B$-rögzített, akkor a $\P_{B}$ halmazfüggvény egy valség
- tehát pl. $\P_{B}(\overline{X})=1-\P_{B}(X)$ bármilyen $X$ eseményre
amikor $\P(A\vert B)=\P(A)$ akkor a plusz infó a $B$ bekövetkezéséről nem változtatja meg az esélyeket
mi más ez ha nem az $A$ és $B$ függetlensége?
$A$ és $B$ függetlenek, ha $P(A\cdot B)=\P(A)\cdot\P(B)$
- ez az alak általánosabb, mert nulla valségű eseményeket is megenged.
- ha feltesszük hogy $\P(B)>0$ akkor ez ugyanaz mint $\P(A)=\P(A\vert B)$

teljes eseményrendszer/Bayes-tétel

ha $\Omega = B_{1}+\ldots+B_{n}$ és páronként kizáró események
$\P(A)=\P(A\vert B_{1})\cdot\P(B_{1})+\ldots+\P(A\vert B_{n})\cdot\P(B_{n})$
- ez a teljes valség tétele
- ha ismerjük egy $A$ eseménymek egy teljes eseményrendszer tagjaira vonatkuzó feltételes valségeit akkor ki tudjuk számolni az $A$ valségét
- a feltételes valségeket sokszor 1xű kiszámolni/ismertek/adottak.
- a $B_{i}$-kre gondolhatunk úgy mint okokra/időben $A$-t megelőző történésekre, az $A$-ra mint okozatra/következményre.
$P(B_{k}\vert A) = \frac{\P(A\vert B_{k})}{\P(A)}=\frac{\P(A\vert B_{k})}{\P(A\vert B_{1})\cdot\P(B_{1})+\ldots+\P(A\vert B_{n})\cdot\P(B_{n})}$
- a $B_{k}$ ("ok") bekövetkezési esélye ha tudjuk hogy az $A$ ("okozat") bekövetkezett
kétlépéses kísérleteknél hasznosak

valségi változó

egy $\Omega \to \R$ függvény
- sokszor számokat rendelünk bizonyos eseményekhez és/de az hogy milyen elemi események vannak a háttérben nem fontos/nem érdekel minket
csoportosítás
- diszkrét: az értékkészlete véges vagy megszámlálhatóan végtelen
- folytonos: az értékkészlete nem megszámlálható (nem pontosan ez, de nem részletezzük)
hagyományosan görög betűkkel nevezzük meg őket - egy kis emlékeztető:
- $\xi$ - kszí
- $\eta$ - éta
- $\omega$ - ómega
- $\lambda$ - lambda
- $\varphi$ - fí

diszkrét valségi változó

az értékkészlet egy (esetleg véges) sorozat $x_1,x_2,\ldots$
rövidítés: dvv

valségeloszlás

$p_k=\P(\xi=x_k)$
$p_k\ge 0$ és $\sum p_k = 1$
a későbbi sűrűségfüggvénnyel analóg fogalom
az intenzitása/erőssége a lehetséges értékeknek
julia

nevezetes diszkrét eloszlások

Bernoulli

$0/1$ értéket vesz fel (indikátor)
paramétere egy $0\le p \le 1$ valós szám
$x=(0,1),\ \ p_x=(1-p,p)$
elvégünk egy kísérletet, és figyeljük hogy egy A esemény bekövetkezik vagy sem (1/0).

Binomiális

$0,1,\ldots,n$ értékeket veszi fel $p_{k}=\binom{n}{k} p^{k}(1-p)^{n-k}$ valséggel
paraméterei $n,p$ egy egész szám és egy valség
$n$ darab független Bernoulli összege

kód

using Distributions, Plots
d = Binomial(10,0.4)
minta = rand(d, 1000)
histogram(minta; bins = -0.5:10.5, normalize=:pdf, label = nothing)
xx = 0:10
yy = pdf.(d,xx)
scatter!(xx, yy, label = nothing,ylimits=(0,0.3))

Geometriai

addig végezzük el a kísérletet amíg be nem következik egy $A$ esemény
az első bekövetkezésig eltelt lépések/kísérletek száma
$0,1,\ldots,n,\ldots$ értékeket veszi fel $p_{k}=p(1-p)^{k}$ valséggel
paraméterei $p$ egy valség

kód

using Distributions, Plots
d = Geometric(0.1)
minta = rand(d, 1000)
a,b=extrema(minta)
histogram(minta; bins = a-0.5:b+0.5, normalize=:pdf, label = nothing)
xx = a:b
yy = pdf.(d,xx)
scatter!(xx, yy, label = nothing, ylimits=(0,0.15))

Poisson

$0,1,\ldots,n,\ldots$ értékeket veszi fel $p_{k}=e^{-\lambda} \frac{\lambda^{k}}{k!}$ valséggel
paraméterei $\lambda>0$ intenzitás
szoros kapcsolatban a Binomiális-sal

várható érték

$\E(\xi)=\sum p_k x_k$
az értékek súlyozott átlaga, a súlyok a megfelelő valségek
feltétel: $\sum p_k \vert x_k\vert \lt \infty$
$\E$ expektáció, átlag
néha kényelmesebb zárójel nélkül írni: $\E\xi, \ \E\xi^2,\ (\E\xi)^2$
a várható érték lineáris: $\E(\lambda\xi + \eta)=\lambda\E(\xi)+\E(\eta)$
megfelelő ${\rm h}:\R\to\R$ függvénnyel: $\E({\rm h}(\xi))=\sum p_k{\rm h}(x_k)$
- például megfelel a ${\rm h}$ ha folytonos és $\sum p_k\vert{\rm h}(x_k)\vert \lt \infty$
- azaz nem kell "újra" meghatározni az értékkészletet és a valségeloszlást

szórásnégyzet/variancia

$\D^2(\xi)=\E(\xi - \E\xi)^2$
feltétel: $\sum p_k \vert x^2_k\vert \lt \infty$
$=\sum p_{i}\cdot(x_{i} - \E\xi)^2$
$\D^{2}(\xi)=\E\xi^2-(\E\xi)^2$ (Steiner-tétel)
$=\sum p_{i}\cdot x^2_{i} - (\E\xi)^2$
$\D(\xi)=\sqrt{\D^2(\xi)}$
- ez már ugyanolyan skálán van mint a $\xi$

kovariancia

$\cov(\xi,\eta)=\E\left[(\xi-\E\xi) \cdot (\eta-\E\eta)\right]$
az előjele arról ad infót, hogy mennyire "mozognak" ugyanabba/ellentétes irányba a saját átlagukhoz képest
akármilyan nagy/kicsi lehet
$\cov(\xi,\eta)=\E(\xi\cdot\eta)-(\E\xi)\cdot(\E\eta)$
$=\sum x_{i}\cdot y_{j}\cdot \P(\xi=x_i, \eta=y_j)-(\E\xi)\cdot(\E\eta)$

korreláció

$\corr(\xi,\eta)=\frac{\cov(\xi,\eta)}{\D(\xi)\cdot \D(\eta)}$
$-1\le \corr(\xi,\eta) \le 1$ (CBS-egyenlőtlenség)
a lineáris kapcsolat erősségét méri két valségi változó között.
$\corr(\xi,\eta) = _{+1}^{-1}$ pontosan akkor, ha $\xi=a\cdot\eta+b$, ahol $a _{\gt 0}^{\lt 0}$
korrelálatlanok: $\corr(\xi,\eta)=0$

együttes-(valség)eloszlás

$p_{i,j}=\P(\xi=x_{i},\eta=y_{j})$
kontingencia táblázat
$\sum_{i,j}p_{i,j}=1$
$\sum_{j} p_{i,j}=\P(\xi=x_{i})$ (marginális, $\xi$ valségeloszlása)
$\sum_{i} p_{i,j}=\P(\eta=y_{j})$ (marginális, $\eta$ valségeloszlása)

függetlenség (dvv)

$\xi$ és $\eta$ függetlenek ha az együttes-valségeloszlás felbomlik a marginálisok szorzatára
azaz $\P(\xi=x_{i},\eta=y_{j}) = \P(\xi=x_{i})\cdot \P(\eta=y_{j})$
ha $\xi,\eta$ függetlenek akkor
- $\E(\xi\cdot\eta)=\E(\xi)\cdot\E(\eta)$
- $\cov(\xi,\eta)=\corr(\xi,\eta)=0$

eloszlásfüggvény

$F_{\xi}: \R \to [0,1]$
ha nem okoz félreértést csak $F(x)$-et írunk
$F(x) = \P(\omega : \xi(\omega)\lt x) = \P(\xi \lt x)$
$_{\lim_{x\to -\infty}}^{\lim_{x\to +\infty}} F(x)= _{0}^{1}$
monoton nemcsökkenő és balról folytonos
diszkrét esetben egy lépcsős függvény
$\P(\xi \in {\rm [a,b)})=F(b)-F(a)$
- intervallumba esés valsége
- balról zárt jobbról nyílt az intervallum (ez néha nem fontos)

abszolút folytonos valségi változó

van sűrűségfüggvénye, azaz:
$F(x)=\int_{-\infty}^{x} f(y)dy$ valmilyen $f\ge 0$ függvénnyel
$\int_{-\infty}^{+\infty} f(y)dy=1$
$\P(\xi \in {\rm [a,b)})=F(b)-F(a)=\int_{a}^{b} f(y)dy$
- Newton-Leibniz formula
- $F'=f$
$\Delta \cdot f(x) \approx F(x+\frac{\Delta}{2})-F(x-\frac{\Delta}{2})=\P(\xi\in [x-\frac{\Delta}{2},x+\frac{\Delta}{2}))\ \ (\Delta\ \ {\rm kicsi})$
julia

nevezetes abszolút folytonos valségi változók

[a,b]-n egyenletes

$\xi \sim U(a,b)\ \ a\lt b$ valósak

\[ f(x) = \begin{cases} \frac{1}{b-a} & {\rm ha }\ \ x\in [a,b]\\ 0 & {\rm egyébként}\\ \end{cases} \]

kód

using Distributions, Plots
minta = rand(Uniform(2,5), 1000)
histogram(minta; bins = 10, normalize=:pdf, label = nothing)
plot!([2,5],[1/3,1/3], label = nothing)

exponenciális

$\xi \sim exp(\lambda)\ \ \lambda>0$ valós

\[ f(x) = \begin{cases} \lambda e^{-\lambda x} & \ \ {\rm ha} \ \ x>0\\ 0 & {\rm egyébként }\\ \end{cases} \]

kód

using Distributions, Plots
d = Exponential(2)
minta = rand(d, 1000)
histogram(minta; bins = 10, normalize=:pdf, label = nothing)
xx = minimum(minta):0.01:maximum(minta)
yy = pdf.(d,xx)
plot!(xx, yy, label = nothing)

normális

$\xi \sim {\cal N}(\mu,\sigma)\ \ \mu,\sigma>0$ valósak

\[ f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \]

kód

using Distributions, Plots
d = Normal(10,1)
minta = rand(d, 1000)
histogram(minta; bins = 10, normalize=:pdf, label = nothing)
xx = minimum(minta):0.01:maximum(minta)
yy = pdf.(d,xx)
plot!(xx, yy, label = nothing)

várható érték - absz.folyt

$\E(\xi)=\int_{-\infty}^{\infty} x f(x) {\rm d}x$
feltétel: $\int_{-\infty}^{\infty} \vert x\vert f(x) {\rm d}x \lt \infty$
a várható érték itt is lineáris: $\E(\lambda\xi + \eta)=\lambda\E(\xi)+\E(\eta)$
megfelelő ${\rm h}:\R\to\R$ függvénnyel: $\E({\rm h}(\xi))=\int_{-\infty}^{\infty} {\rm h}(x) f(x) {\rm d}x$
- például megfelel a ${\rm h}$ ha folytonos és $\int_{-\infty}^{\infty} \vert{\rm h}(x)\vert f(x) {\rm d}x$

szórásnégyzet/variancia - absz.folyt

$\D^2(\xi)=\E(\xi - \E\xi)^2$
feltétel: $\E\xi^{2} \lt \infty$
$\D^{2}(\xi)=\E\xi^2-(\E\xi)^2$ (Steiner-tétel)
a szórás: $\D(\xi)=\sqrt{\D^2(\xi)}$
- ez már ugyanolyan skálán van mint a $\xi$

együttes eloszlásfüggvény/sűrűségfv./függetlenség

$F_{\xi,\eta}(x,y)=\P(\xi\lt x,\eta\lt y)$
def: függetlenek, ha $F_{\xi,\eta}(x,y)=F_{\xi}(x) F_{\eta}(y)$
ha létezik egy olyan $f_{\xi,\eta}(x,y)$ melyre $F_{\xi,\eta}(x,y)=\int_{-\infty}^{y}\int_{-\infty}^{x} f_{\xi,\eta}(u,v) {\rm d}u {\rm d}v$ akkor

a $\xi,\eta$ együttes eloszlását abszolút folytonosnak nevezzük.

ha $\xi,\eta$ együttes eloszlása abszolút folytonos akkor a függetlenség: $f_{\xi,\eta}(x,y)=f_{\xi}(x) f_{\eta}(y)$

Csebisev-egyenlőtlenség

$P(\vert \xi - \E\xi\vert \ge \delta) \le \frac{\D^2\xi}{\delta^2}$
spec. eset. (és megfordítás) - $\sigma=\D\xi$ és $\mu=\E\xi$ jelölésekkel:
$P(\vert \xi - \E\xi\vert \ge k\sigma) \le \frac{\sigma^2}{k^2\sigma^2}=\frac{1}{k^2}$
$P(\vert \xi - \E\xi\vert \lt k\sigma) \ge 1-\frac{1}{k^2}$
pl. $k=2$: azaz minden valségi változó az "ideje" legalább 75%-át a várható értékének $2\sigma$ sugarú környezetében tölti

Sztochasztikus konvergencia/Gyenge törvény

$P(\vert \xi_n - \xi\vert \gt \delta) \to 0$ ha $n\to\infty$
ha $\xi_n$ páronként független, azonos eloszlású sorozat és létezik $\mu=\E\xi_1$, akkor $\frac{\xi_1+\ldots+\xi_n}{n}\to \mu$ sztochasztikusan.

Majdnem biztos konvergencia/Erős törvény

$P(\omega: \xi_n(\omega) \to \xi(\omega))=1$
ha $\xi_n$ páronként független, azonos eloszlású sorozat és létezik $\mu=\E\xi_1$, akkor $\frac{\xi_1+\ldots+\xi_n}{n}\to \mu$ majdnem biztosan.

KHT

$\xi_n$ páronként független, azonos eloszlású sorozat és létezik $\sigma^2=\D^2\xi_1$
$P(\frac{S_{n}-n\mu}{n\sigma}\lt x)\to \Phi(x)$ minden $x$-re.
$\mu=\E\xi_1,\ \ \ S_n = \xi_1+\ldots+\xi_n$ és $\ \Phi$ a standard normális eloszlás fv.