az adatsor amit fel kell dolgozni
egy képzeletbeli város eladó ingatlanairól szól
az $Y$ oszlop az ingatlanok árait tartalmazza (millió dollár)
ezenkívül a ingatlanok 2 ismérvéről - típus és teher - van adat
Y | típus | teher |
---|---|---|
2.0 | B | nem |
2.4 | B | igen |
2.5 | B | nem |
2.6 | B | nem |
2.7 | B | nem |
2.8 | B | nem |
3.0 | B | nem |
3.1 | B | nem |
3.1 | B | nem |
3.1 | B | nem |
3.2 | A | igen |
3.3 | A | igen |
3.4 | B | nem |
3.4 | B | igen |
3.5 | B | igen |
3.5 | B | nem |
3.5 | B | nem |
3.6 | B | nem |
3.6 | A | nem |
3.7 | B | nem |
3.7 | B | igen |
3.8 | A | igen |
3.8 | A | igen |
3.8 | B | nem |
3.9 | B | nem |
4.0 | A | nem |
4.1 | A | igen |
4.1 | B | igen |
4.2 | A | nem |
4.2 | A | igen |
4.2 | A | nem |
4.3 | B | igen |
4.3 | A | nem |
4.5 | B | nem |
4.8 | A | nem |
4.9 | B | igen |
5.1 | B | igen |
5.2 | A | igen |
5.3 | A | nem |
5.5 | A | igen |
5.6 | A | igen |
5.7 | A | nem |
6.0 | B | igen |
6.1 | B | igen |
6.8 | B | nem |
7.0 | B | igen |
7.1 | A | nem |
7.6 | B | igen |
ezek a nyers adatsorból (teljes információ birtokában) számolt mutatók:
átlag | szórás | medián | Q1 | Q3 | $\alpha_3$ | $P$ | $H_{\rm{típus}}$ |
---|---|---|---|---|---|---|---|
4.2 | 1.295 | 3.85 | 3.325 | 5.05 | 0.823 | 0.811 | 0.209 |
és néhány ábra (a piros vonal az átlag):
határozzuk meg az adott osztályok gyakoriságait!
itt az $a-b$ jelentése, hogy az ingatlan ára $a$ és $b$ millió közé esik.
osztály |
---|
2.0-2.9 |
3.0-3.9 |
4.0-4.9 |
5.0-5.9 |
6.0-6.9 |
7.0-7.9 |
a fenti (gyakorisági) hisztogram számai:
osztály | f | f' |
---|---|---|
2.0-2.9 | 6 | 6 |
3.0-3.9 | 19 | 25 |
4.0-4.9 | 11 | 36 |
5.0-5.9 | 6 | 42 |
6.0-6.9 | 3 | 45 |
7.0-7.9 | 3 | 48 |
és hasonlítsuk össze a nyers adatsorból számolt értékekkel!
minden osztályban a gyakoriságának megfelelő, osztályközéppel egyenlő értéket képzelhetünk.
a becsült értékösszeg: $6 \cdot 2.45 + 19 \cdot 3.45 + ... + 3 \cdot 6.45 + 3 \cdot 7.45 = 203.6$
a becsült átlag: $\frac{203.6}{48.0} = 4.242$
az előbb számolt átlagot használjuk a szórás képletében (súlyozott) !
a becsült eltérérés négyzetösszeg (SST):
$6 \cdot \left( 2.45 - 4.242 \right)^{2} + 19 \cdot \left( 3.45 - 4.242 \right)^{2} + ... + 3 \cdot \left( 6.45 - 4.242 \right)^{2} + 3 \cdot \left( 7.45 - 4.242 \right)^{2} = 85.917$
tehát a becsült szórás: $\sqrt{\frac{85.917}{48}} = 1.338$
$Y_{j,0} + (\frac{i}{k}N-f^{'}_{j-1})\frac{h_{j}}{f_{j}}$
$i=1,2,3\ \ k=4$
$Q_1 = 3 + \frac{\left( \frac{1}{4} \cdot 48 - 6 \right) \cdot 0.9}{19} = 3.284$
$Q_2 = 3 + \frac{\left( \frac{2}{4} \cdot 48 - 6 \right) \cdot 0.9}{19} = 3.853$
$Q_3 = 4 + \frac{\left( \frac{3}{4} \cdot 48 - 25 \right) \cdot 0.9}{11} = 4.9$
az $\alpha_3$-hoz még az $M_3$ kell, a $P$ mutatóhoz minden megvan
a becsült eltérés köb-összeg ($M_3$ számlálója):
$6 \cdot \left( 2.45 - 4.242 \right)^{3} + 19 \cdot \left( 3.45 - 4.242 \right)^{3} + ... + 3 \cdot \left( 6.45 - 4.242 \right)^{3} + 3 \cdot \left( 7.45 - 4.242 \right)^{3} = 98.046$
tehát a becsült $\alpha_3 =\ \frac{\frac{98.046}{48}}{1.338^{3}} = 0.853$
A Pearson-féle ferdeségi mutatóhoz mar minden megvan, csak helyettesítsünk be:
$P = \frac{3 \cdot \left( 4.242 - 3.853 \right)}{1.338} = 0.872$
használjuk a részátlagok számításához a típus szerinti gyakorisági táblákat:
(feltételezzük hogy a nyers adatsor nem ismert)
osztály (A) | f | f' |
---|---|---|
2.0-2.9 | 0 | 0 |
3.0-3.9 | 5 | 5 |
4.0-4.9 | 7 | 12 |
5.0-5.9 | 5 | 17 |
6.0-6.9 | 0 | 17 |
7.0-7.9 | 1 | 18 |
osztály (B) | f | f' |
---|---|---|
2.0-2.9 | 6 | 6 |
3.0-3.9 | 14 | 20 |
4.0-4.9 | 4 | 24 |
5.0-5.9 | 1 | 25 |
6.0-6.9 | 3 | 28 |
7.0-7.9 | 2 | 30 |
SST-t már a becsült szórásnál kiszámoltuk: 85.917
a becsült (fő)átlagot is: 4.242
a részátlagok becslései (először az értékösszegeket számoljuk):
$0 \cdot 2.45 + 5 \cdot 3.45 + ... + 0 \cdot 6.45 + 1 \cdot 7.45 = 83.1 \ \ \implies \ \ \overline{Y_A} = \frac{83.1}{18.0} = 4.617$
$6 \cdot 2.45 + 14 \cdot 3.45 + ... + 3 \cdot 6.45 + 2 \cdot 7.45 = 120.5 \ \ \implies \ \ \overline{Y_B} = \frac{120.5}{30.0} = 4.017$
amiből:
$SSK = 18 \cdot \left( 4.617 - 4.242 \right)^{2} + 30 \cdot \left( 4.017 - 4.242 \right)^{2} = 4.05$
tehát
$H = \sqrt{\frac{4.05}{85.917}} = 0.217$ (gyenge kapcsolat)
Az osztályközös gyakorisági sorból számoljuk ki a
\[ Y_{\rm{mo},0} + \frac{d_a}{d_a+d_f}h_{\rm{mo}} \]
alapján. (Ha nincs egyértelműen legnagyobb gyakoriság akkor nem számoljuk)
a legnagyobb gyakoriságú osztály a $3.0-3.9$-es
\[ Y_{mo,0}= 13 \\ d_a= 13 \\ d_f=8 \\ h_{mo}=0.99 \\ Mo = 3.0 + \frac{13.0}{13.0 + 8.0} \cdot 0.99 = 3.613 \]