Z Wikipedii, wolnej encyklopedii
Twierdzenie Riesza – twierdzenie analizy funkcjonalnej noszące nazwisko Frigyesa Riesza , które opisuje strukturę przestrzeni sprzężonej topologicznie do danej przestrzeni Hilberta w daleko bardziej satysfakcjonujący sposób niż ogólniejsze twierdzenie Hahna-Banacha (obowiązujące dla przestrzeni Banacha ). Wśród jego nazw spotyka się oprócz nazwiska Riesza również nazwisko Maurice’a Frécheta oraz nazwy opisowe np. „o reprezentacji (funkcjonału)”, czasami również z zastrzeżeniem „w przestrzeniach Hilberta”.
Stanowi ono odwrócenie następującej obserwacji, iż dla dowolnie wybranego elementu
y
{\displaystyle y}
ustalonej przestrzeni Hilberta odwzorowanie dane wzorem
x
↦
⟨
x
,
y
⟩
{\displaystyle x\mapsto \langle x,y\rangle }
jest (ciągłym ) funkcjonałem liniowym , tj. każdy funkcjonał liniowy można przedstawić w tej postaci. Ponadto zapewnia ono o równoważności struktur unitarnych (m.in. izomorficzności jako przestrzeni liniowych oraz izometryczności jako przestrzeni unormowanych ; zob. przekształcenie unitarne ) przestrzeni Hilberta oraz przestrzeni sprzężonej do niej.
Niech
H
{\displaystyle H}
będzie przestrzenią Hilberta z iloczynem skalarnym
⟨
⋅
,
⋅
⟩
,
{\displaystyle \langle \cdot ,\cdot \rangle ,}
zaś
H
∗
{\displaystyle H^{*}}
będzie przestrzenią sprzężoną do
H
.
{\displaystyle H.}
Wówczas dla każdego funkcjonału liniowego
y
∗
∈
H
∗
{\displaystyle y^{*}\in H^{*}}
istnieje[1] jeden i tylko jeden element
y
∈
H
{\displaystyle y\in H}
spełniający dla wszystkich
x
∈
H
{\displaystyle x\in H}
tożsamość
y
∗
(
x
)
=
⟨
x
,
y
⟩
.
{\displaystyle y^{*}(x)=\langle x,y\rangle .}
Ponadto odwzorowanie
H
→
H
∗
{\displaystyle H\to H^{*}}
dane wzorem
y
↦
y
∗
{\displaystyle y\mapsto y^{*}}
jest wzajemnie jednoznacznym przekształceniem antyliniowym zachowującym normę ; jeśli
H
{\displaystyle H}
określona jest nad ciałem liczb rzeczywistych (a nie liczb zespolonych ), to wspomniane odwzorowanie jest przekształceniem liniowym zachowującym normę (tzn. jest izometrią liniową , a nie antyliniową).
W dalszej części
∅
{\displaystyle \emptyset }
oznaczać będzie funkcjonał zerowy, czyli dany wzorem
∅
(
x
)
=
0
{\displaystyle \emptyset (x)=0}
dla każdego
x
∈
H
.
{\displaystyle x\in H.}
Jeżeli
H
{\displaystyle H}
jest skończonego wymiaru, to istnienie odpowiedniego
y
∈
H
{\displaystyle y\in H}
dla
y
∗
∈
H
∗
{\displaystyle y^{*}\in H^{*}}
wynika z jednoznaczności, gdyż iniektywne przekształcenie
(
⋅
)
∗
:
H
→
H
∗
{\displaystyle (\cdot )^{*}\colon H\to H^{*}}
dane wzorem
y
↦
y
∗
=
⟨
⋅
,
y
⟩
{\displaystyle y\mapsto y^{*}=\langle \cdot ,y\rangle }
jest wtedy suriekcją , a zatem jest izomorfizmem liniowym w przypadku rzeczywistym (zob. dowód ) i antyliniowym w przypadku zespolonym (zob. Antyliniowość niżej); w przeciwnym przypadku dla ogólnej przestrzeni liniowej
V
{\displaystyle V}
jest
dim
V
<
dim
V
∗
,
{\displaystyle \dim V<\dim V^{*},}
ograniczenie przestrzeni sprzężonej do ciągłych funkcjonałów liniowych sprawia jednak, że
dim
H
=
dim
H
∗
{\displaystyle \dim H=\dim H^{*}}
na podstawie izomorfizmu
(
⋅
)
∗
{\displaystyle (\cdot )^{*}}
skonstruowanego niżej.
Istnienie
Dla
y
∗
=
∅
{\displaystyle y^{*}=\emptyset }
wystarczy wziąć
y
=
0
{\displaystyle y=0}
i wtedy
y
∗
(
x
)
=
⟨
x
,
0
⟩
=
0
{\displaystyle y^{*}(x)=\langle x,0\rangle =0}
dla każdego
x
∈
H
;
{\displaystyle x\in H;}
niech więc
y
∗
≠
∅
,
{\displaystyle y^{*}\neq \emptyset ,}
wtedy
ker
y
∗
{\displaystyle \ker y^{*}}
jest właściwą podprzestrzenią
H
.
{\displaystyle H.}
Ponieważ
y
∗
{\displaystyle y^{*}}
jest ciągły, to zbiór
ker
y
∗
{\displaystyle \ker y^{*}}
jest domknięty [2] [3] . Z twierdzenia o rzucie ortogonalnym wynika, że
H
=
ker
y
∗
⊕
(
ker
y
∗
)
⊥
,
{\displaystyle H=\ker y^{*}\oplus (\ker y^{*})^{\perp },}
a skoro
ker
y
∗
≠
H
,
{\displaystyle \ker y^{*}\neq H,}
to
(
ker
y
∗
)
⊥
≠
{
0
}
,
{\displaystyle (\ker y^{*})^{\perp }\neq \{0\},}
a zatem można znaleźć taki element
z
∈
(
ker
y
∗
)
⊥
,
{\displaystyle z\in (\ker y^{*})^{\perp },}
dla którego
‖
z
‖
=
1.
{\displaystyle \|z\|=1.}
Ponieważ
z
∈
(
ker
y
∗
)
⊥
,
{\displaystyle z\in (\ker y^{*})^{\perp },}
to dla każdego
x
∈
H
{\displaystyle x\in H}
zachodzi
y
∗
(
x
)
z
−
y
∗
(
z
)
x
∈
ker
y
∗
,
{\displaystyle y^{*}(x)\ z-y^{*}(z)\ x\in \ker y^{*},}
gdyż na mocy liniowości funkcjonału
y
∗
(
y
∗
(
x
)
z
−
y
∗
(
z
)
x
)
=
y
∗
(
x
)
y
∗
(
z
)
−
y
∗
(
z
)
y
∗
(
x
)
=
0
;
{\displaystyle y^{*}{\big (}y^{*}(x)\ z-y^{*}(z)\ x{\big )}=y^{*}(x)y^{*}(z)-y^{*}(z)y^{*}(x)=0;}
dlatego
0
=
⟨
y
∗
(
x
)
z
−
y
∗
(
z
)
x
,
z
⟩
=
y
∗
(
x
)
⟨
z
,
z
⟩
−
y
∗
(
z
)
⟨
x
,
z
⟩
=
y
∗
(
x
)
−
y
∗
(
z
)
⟨
x
,
z
⟩
{\displaystyle 0={\big \langle }y^{*}(x)\ z-y^{*}(z)\ x,z{\big \rangle }=y^{*}(x)\langle z,z\rangle -y^{*}(z)\langle x,z\rangle =y^{*}(x)-y^{*}(z)\langle x,z\rangle }
a stąd
y
∗
(
x
)
=
⟨
x
,
y
∗
(
z
)
¯
z
⟩
;
{\displaystyle y^{*}(x)=\left\langle x,{\overline {y^{*}(z)}}\ z\right\rangle ;}
aby teza twierdzenia była spełniona, wystarczy przyjąć
y
=
y
∗
(
z
)
¯
z
,
{\displaystyle y={\overline {y^{*}(z)}}\ z,}
gdzie
w
¯
{\displaystyle {\overline {w}}}
oznacza sprzężenie zespolone skalara
w
.
{\displaystyle w.}
Jednoznaczność
Niech
y
1
,
y
2
∈
H
{\displaystyle y_{1},y_{2}\in H}
będą dwoma elementami, które dla każdego
x
∈
H
{\displaystyle x\in H}
spełniają
y
∗
(
x
)
=
⟨
x
,
y
1
⟩
=
⟨
x
,
y
2
⟩
;
{\displaystyle y^{*}(x)=\langle x,y_{1}\rangle =\langle x,y_{2}\rangle ;}
wówczas, z liniowości,
⟨
x
,
y
1
−
y
2
⟩
=
0
{\displaystyle \langle x,y_{1}-y_{2}\rangle =0}
dla każdego
x
∈
H
,
{\displaystyle x\in H,}
biorąc
x
=
y
1
−
y
2
{\displaystyle x=y_{1}-y_{2}}
otrzymuje się
‖
x
‖
=
‖
y
1
−
y
2
‖
=
0
,
{\displaystyle \|x\|=\|y_{1}-y_{2}\|=0,}
co ma miejsce wtedy i tylko wtedy, gdy
y
1
−
y
2
=
0
,
{\displaystyle y_{1}-y_{2}=0,}
czyli
y
1
=
y
2
.
{\displaystyle y_{1}=y_{2}.}
Izometryczność
Iloczyn skalarny jest ciągły ze względu na pierwszą zmienną; zatem funkcjonał liniowy dany wzorem
y
∗
(
x
)
=
⟨
x
,
y
⟩
{\displaystyle y^{*}(x)=\langle x,y\rangle }
jest ciągły, a zatem ograniczony (z charakteryzacji ograniczonych operatorów liniowych ). Z nierówności Cauchy’ego-Schwarza wynika wtedy, że
‖
y
∗
(
x
)
‖
=
‖
⟨
x
,
y
⟩
‖
⩽
‖
x
‖
‖
y
‖
,
{\displaystyle {\big \|}y^{*}(x){\big \|}={\big \|}\langle x,y\rangle {\big \|}\leqslant \|x\|\|y\|,}
a więc
‖
y
∗
‖
=
sup
‖
x
‖
=
1
‖
y
∗
(
x
)
‖
⩽
‖
y
‖
.
{\displaystyle {\big \|}y^{*}{\big \|}=\sup _{\|x\|=1}\;{\big \|}y^{*}(x){\big \|}\leqslant \|y\|.}
Jeżeli
y
=
0
,
{\displaystyle y=0,}
to
‖
y
∗
‖
=
0
,
{\displaystyle \|y^{*}\|=0,}
czyli
y
∗
=
∅
;
{\displaystyle y^{*}=\emptyset ;}
w przeciwnym przypadku dla
z
=
y
‖
y
‖
{\displaystyle z={\frac {y}{\|y\|}}}
otrzymuje się
‖
y
∗
(
z
)
‖
=
‖
⟨
y
‖
y
‖
,
y
⟩
‖
=
1
‖
y
‖
⟨
y
,
y
⟩
=
‖
y
‖
2
‖
y
‖
=
‖
y
‖
,
{\displaystyle {\big \|}y^{*}(z){\big \|}={\Big \|}\left\langle {\tfrac {y}{\|y\|}},y\right\rangle {\Big \|}={\frac {1}{\|y\|}}\langle y,y\rangle ={\frac {\|y\|^{2}}{\|y\|}}=\|y\|,}
co daje
‖
y
∗
‖
=
‖
y
‖
.
{\displaystyle \|y^{*}\|=\|y\|.}
Antyliniowość
Antyliniowość odwzorowania
(
⋅
)
∗
:
H
→
H
∗
{\displaystyle (\cdot )^{*}\colon H\to H^{*}}
wynika wprost z własności iloczynu skalarnego , który jest antyliniowy ze względu na drugą współrzędną:
(
c
y
1
+
d
y
2
)
∗
(
x
)
=
⟨
x
,
c
y
1
+
d
y
2
⟩
=
c
¯
⟨
x
,
y
1
⟩
+
d
¯
⟨
x
,
y
2
⟩
=
c
¯
y
1
∗
(
x
)
+
d
¯
y
2
∗
(
x
)
.
{\displaystyle (cy_{1}+dy_{2})^{*}(x)=\langle x,cy_{1}+dy_{2}\rangle ={\overline {c}}\langle x,y_{1}\rangle +{\overline {d}}\langle x,y_{2}\rangle ={\overline {c}}\ y_{1}^{*}(x)+{\overline {d}}\ y_{2}^{*}(x).}
Jeżeli
H
{\displaystyle H}
jest rzeczywista, to iloczyn skalarny jest dwuliniowy , a nie półtoraliniowy ; w tym przypadku wystarczy w powyższych równościach pominąć sprzężenie zespolone (oznaczane kreską nad elementem).
↑ John B. Conway: A Course in Functional Analysis . Springer, 2007, s. 13.
↑ Z definicji ciągłości (przeciwobrazy zbiorów otwartych są otwarte; zatem z dualności analogiczne stwierdzenie dotyczy zbiorów domkniętych ) wynika, że
ker
y
∗
=
(
y
∗
)
−
1
[
0
]
{\displaystyle \ker y^{*}=(y^{*})^{-1}[0]}
jest domknięty jako przeciwobraz zbioru jednoelementowego (przestrzenie Hilberta są Hausdorffa , które są przestrzeniami
T
1
{\displaystyle T_{1}}
).
↑ Stwierdzenie to można również dowieść, korzystając z ogólniejszego twierdzenia dla przestrzeni unitarnych i ograniczonych operatorów liniowych (w przestrzeniach Hilberta, które są unitarne, ciągłe operatory liniowe są równoważne ograniczonym). Twierdzenie: Niech
X
,
Y
{\displaystyle X,Y}
będą przestrzeniami unitarnymi ,
T
:
X
→
Y
{\displaystyle \mathrm {T} \colon X\to Y}
będzie ograniczonym operatorem liniowym, zaś
(
x
n
)
{\displaystyle (x_{n})}
oznacza ciąg elementów
X
.
{\displaystyle X.}
Wówczas
x
n
→
x
{\displaystyle x_{n}\to x}
pociąga
T
(
x
n
)
→
T
(
x
)
,
{\displaystyle \mathrm {T} (x_{n})\to \mathrm {T} (x),}
a jądro
ker
T
{\displaystyle \ker \mathrm {T} }
jest zbiorem domkniętym . Dowód: Pierwsza część twierdzenia wynika z oszacowania
‖
T
(
x
n
)
−
T
(
x
)
‖
=
‖
T
(
x
n
−
x
)
‖
⩽
‖
T
‖
‖
x
n
−
x
‖
→
0.
{\displaystyle {\big \|}\mathrm {T} (x_{n})-\mathrm {T} (x){\big \|}={\big \|}\mathrm {T} (x_{n}-x){\big \|}\leqslant \|\mathrm {T} \|\|x_{n}-x\|\to 0.}
Jeżeli
x
∈
c
l
(
ker
T
)
,
{\displaystyle x\in \mathrm {cl} (\ker \mathrm {T} ),}
to (z charakteryzacji domknięcia w przestrzeniach metrycznych) można wybrać ciąg
(
x
n
)
{\displaystyle (x_{n})}
elementów
ker
T
{\displaystyle \ker \mathrm {T} }
zbieżny do
x
∈
X
;
{\displaystyle x\in X;}
skoro
T
(
x
n
)
→
T
(
x
)
{\displaystyle \mathrm {T} (x_{n})\to \mathrm {T} (x)}
i ponieważ
T
(
x
n
)
=
0
{\displaystyle \mathrm {T} (x_{n})=0}
dla wszystkich
n
∈
N
,
{\displaystyle n\in \mathbb {N} ,}
to również
T
(
x
)
=
0
,
{\displaystyle \mathrm {T} (x)=0,}
co oznacza
x
∈
ker
T
.
{\displaystyle x\in \ker \mathrm {T} .}