Statystyka T² Hotellinga[1] – uogólnienie rozkładu Studenta, który jest używany do testowania hipotez wielowymiarowych. Nazwa pochodzi od Harolda Hotellinga.
Statystyka Hotellinga jest definiowana jako:
![{\displaystyle t^{2}=n(\mathbf {x} -\mathbf {\mu } )'\mathbf {W} ^{-1}(\mathbf {x} -\mathbf {\mu } ),}](https://amansaja.com/index.php?q=Mfv0Kfa6bO93MqTXLqrCMqiSL3dZb2hQMu9Onpz0p3oPb21BngBFb21FJgGRKArSngrOb3z2nO83ztBAzAvFnjhFythFatnAoqrBnAnDnAw2z2i1o2eNnDJCaqdBaDsP)
gdzie
jest liczbą obserwacji,
jest p-wymiarową kolumną wektorową, a
jest
macierzą kowariancji.
Jeśli
jest zmienną losową z wielowymiarowego rozkładu Gaussa i
(niezależne od
) ma rozkład Wisharta z taką samą macierzą wariancji
oraz z
wówczas rozkład
jest
rozkładem T² Hotellinga z parametrami
i
Można pokazać, że:
![{\displaystyle {\frac {m-p+1}{pm}}T^{2}\sim F_{p,m-p+1},}](https://amansaja.com/index.php?q=Mfv0Kfa6bO93MqTXLqrCMqiSL3dZb2hQMu9Onpz0p3oPb21BngBFb21FJgGRKArSngrOb3z2nO84ngaNoDe0ajJCyqoPaAhCoAzAnDe3aNvDnDFEotC1yqvDoAiOzgsN)
gdzie
jest rozkładem F Snedecora.
Teraz załóżmy, że
![{\displaystyle \mathbf {x} _{1},\dots ,\mathbf {x} _{n}}](https://amansaja.com/index.php?q=Mfv0Kfa6bO93MqTXLqrCMqiSL3dZb2hQMu9Onpz0p3oPb21BngBFb21FJgGRKArSngrOb3z2nO9Ca2aPzgo5otw4zjCNnAvCo2s0nje1njaOzDs5atvEaDaQaqzDo2a5)
jest
kolumną wektorową, której wartościami są liczby rzeczywiste. Załóżmy, że
![{\displaystyle {\overline {\mathbf {x} }}=(\mathbf {x} _{1}+\ldots +\mathbf {x} _{n})/n}](https://amansaja.com/index.php?q=Mfv0Kfa6bO93MqTXLqrCMqiSL3dZb2hQMu9Onpz0p3oPb21BngBFb21FJgGRKArSngrOb3z2nO9FothDzDhBaqw5zgi1aNnDntK3a2i4nDs1ntvEyqsOoteQytw2ygo2)
są ich średnią. Niech
będzie macierzą dodatnie określoną
![{\displaystyle \mathbf {W} =\sum _{i=1}^{n}(\mathbf {x} _{i}-{\overline {\mathbf {x} }})(\mathbf {x} _{i}-{\overline {\mathbf {x} }})'/(n-1)}](https://amansaja.com/index.php?q=Mfv0Kfa6bO93MqTXLqrCMqiSL3dZb2hQMu9Onpz0p3oPb21BngBFb21FJgGRKArSngrOb3z2nO8Naje2ytw3zAi2aje1aNo0aNC4nga1zDi2zAnByjnEoDsOyjw1oDzF)
jest macierzą „przykładowych wariancji”. (Transpozycja jakiejkolwiek macierzy
jest oznaczona jako
). Niech
będzie znanym
wektorem. Wówczas statystyka Hotellinga przyjmuje postać:
![{\displaystyle t^{2}=n({\overline {\mathbf {x} }}-\mathbf {\mu } )'\mathbf {W} ^{-1}({\overline {\mathbf {x} }}-\mathbf {\mu } ).}](https://amansaja.com/index.php?q=Mfv0Kfa6bO93MqTXLqrCMqiSL3dZb2hQMu9Onpz0p3oPb21BngBFb21FJgGRKArSngrOb3z2nO82zAs1zgs0yjdFoDzBytJCoAsQzAi5nto2ytoQaqnBnto1a2eNaNo2)
Warto zauważyć, że
jest blisko powiązona z kwadratem odległością Mahalanobisa.
W szczególności może to być pokazane poprzez[2]:
Jeśli
są niezależne, i
i
są jak zdefiniowano powyżej, wówczas
ma rozkład Wisharta z
stopniami swobody
![{\displaystyle \mathbf {W} \sim W_{p}(V,n-1)}](https://amansaja.com/index.php?q=Mfv0Kfa6bO93MqTXLqrCMqiSL3dZb2hQMu9Onpz0p3oPb21BngBFb21FJgGRKArSngrOb3z2nO80nDe2zNa2z2rDatlAzgrFyjeNotJCoAo5zto4zAe0nAs1ajzFzNFF)
i jest niezależna od
oraz
![{\displaystyle {\overline {\mathbf {x} }}\sim N_{p}(\mu ,V/n).}](https://amansaja.com/index.php?q=Mfv0Kfa6bO93MqTXLqrCMqiSL3dZb2hQMu9Onpz0p3oPb21BngBFb21FJgGRKArSngrOb3z2nO9CyqnBoNdAotBFyjwPzNo0oDeOoNsQoDe4aAhCajBEngs1zjw5zjlC)
To oznacza, że:
![{\displaystyle t^{2}=n({\overline {\mathbf {x} }}-\mathbf {\mu } )'\mathbf {W} ^{-1}({\overline {\mathbf {x} }}-\mathbf {\mu } )\sim T^{2}(p,n-1).}](https://amansaja.com/index.php?q=Mfv0Kfa6bO93MqTXLqrCMqiSL3dZb2hQMu9Onpz0p3oPb21BngBFb21FJgGRKArSngrOb3z2nO9BotC2nqnEaAhDyqrAaNC0zjdFoto5ztFFntwQzNs1otrAajKPyjrB)
Jeśli
oraz
są próbkami niezależnymi wyciągniętymi z dwóch niezależnych wielowymiarowych rozkładów Gaussa o takiej samej średniej oraz kowariancji, i definiujemy
![{\displaystyle {\overline {\mathbf {x} }}={\frac {1}{n_{x}}}\sum _{i=1}^{n_{x}}\mathbf {x} _{i}\qquad {\overline {\mathbf {y} }}={\frac {1}{n_{y}}}\sum _{i=1}^{n_{y}}\mathbf {y} _{i}}](https://amansaja.com/index.php?q=Mfv0Kfa6bO93MqTXLqrCMqiSL3dZb2hQMu9Onpz0p3oPb21BngBFb21FJgGRKArSngrOb3z2nO83ajs4zAvFo2zCytoPa2o5a2o0zNoOo2zBntG0njnFa2wNoNnBzja1)
jako średnie próbek, oraz
![{\displaystyle \mathbf {W} ={\frac {\sum _{i=1}^{n_{x}}(\mathbf {x} _{i}-{\overline {\mathbf {x} }})(\mathbf {x} _{i}-{\overline {\mathbf {x} }})'+\sum _{i=1}^{n_{y}}(\mathbf {y} _{i}-{\overline {\mathbf {y} }})(\mathbf {y} _{i}-{\overline {\mathbf {y} }})'}{n_{x}+n_{y}-2}}}](https://amansaja.com/index.php?q=Mfv0Kfa6bO93MqTXLqrCMqiSL3dZb2hQMu9Onpz0p3oPb21BngBFb21FJgGRKArSngrOb3z2nO9DnDdAzqi0oqnDnDFFaAs3ots0aNo5aqeNaAiNnts1agoQzNG1zDa1)
jako estymator nieobciążonej macierzy kowariancji, wówczas statystyka T² Hotellinga dla dwóch prób wygląda tak:
![{\displaystyle t^{2}={\frac {n_{x}n_{y}}{n_{x}+n_{y}}}({\overline {\mathbf {x} }}-{\overline {\mathbf {y} }})'\mathbf {W} ^{-1}({\overline {\mathbf {x} }}-{\overline {\mathbf {y} }})\sim T^{2}(p,n_{x}+n_{y}-2)}](https://amansaja.com/index.php?q=Mfv0Kfa6bO93MqTXLqrCMqiSL3dZb2hQMu9Onpz0p3oPb21BngBFb21FJgGRKArSngrOb3z2nO8QzjhEnjrFoNrBygoNyqiPagrEzDdEzDe0zqw5atw3agi4ytC4ytiQ)
i może być przedstawiona w postaci rozkładu F Snedecora:
[2].
- ↑ H. Hotelling (1931) The generalization of Student’s ratio, Ann. Math. Statist., Vol. 2, s. 360–378.
- ↑ a b K.V. Mardia, J.T. Kent, J.M. Bibby (1979), Multivariate Analysis, Academic Press.