Západočeská univerzita v Plzni Fakulta pedagogická
Bakalářská práce
ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC UŽITÍM PSEUDOINVERZNÍCH MATIC Martina Stehlíková
Plzeň 2012
Prohlášení Prohlašuji, že jsem práci vypracovala samostatně s použitím uvedené literatury a zdrojů informací.
V Plzni, dne 12.4. 2012 Martina Stehlíková
Na třetí nečíslované stránce je uvedena kopie písemného zadání práce.
Poděkování Tímto bych ráda poděkovala vedoucí práce Mgr. Martině Kašparové, Ph.D. za odborné vedení, cenné rady, věcné připomínky a čas, který mi věnovala.
Obsah Úvod
6
1. Řešení soustav lineárních rovnic
7
2. Matice soustavy jako matice homomorfismu
14
3. Pseudoinverzní homomorfismus
21
4. Pseudoinverzní matice
29
5. Příklady
39
Závěr
43
Seznam použité literatury a zdrojů
44
5
Úvod Jedním z nejstarších problémů v matematice je řešení soustav lineárních rovnic. Na tuto úlohu vede řada problémů nejen v matematice, ale i v jiných oborech. Řešení soustav lineárních rovnic má mnoho aplikací např. při předpovědích, odhadování, v lineárním programování. Moje bakalářská práce se právě řešením soustav lineárních rovnic zabývá, konkrétně řešením soustav lineárních rovnic užitím pseudoinverzních matic. V mnoha příkladech řešíme soustavu lineárních rovnic, které jsou popsány maticí soustavy a vektorem pravých stran. K řešení soustavy máme k dispozici mnoho metod řešení, pokud je matice soustavy čtvercová a regulární. Můžeme se však setkat se soustavami, které jsou obecnější. Matice takové soustavy může být obecně obdélníková nebo nemusí mít matice plnou sloupcovou nebo řádkovou hodnost. Řešení takovýchto soustav lineárních rovnic je možné provést právě pomocí pseudoinverzní matice. Na pseudoinverzní matici se můžeme dívat jako na matici pseudoiverzního homomorfismu, proto jsou v práci uvedené pojmy jako homomorfismus, matice homomorfismu,
psedoinvezní
homomorfismus,
navzájem
pseduoinverzní
homomorfismy a k těmto pojmům jsou zavedeny příslušné definice a věty. Nebude-li uvedeno jinak, definice a věty jsou převzaty ze zdrojů, které jsou uvedeny v seznamu použité literatury.
6
Kapitola 1
Řešitelnost soustav lineárních rovnic V této kapitole připomeneme základní pojmy z oblasti týkající se soustav lineárních rovnic a jejich řešitelnosti.
Definice 1.1. Soustavou m lineárních rovnic o n neznámých
nad tělesem T
rozumíme každou soustavu, kterou lze upravit na tvar
Prvky
:
:
:
:
T, i = 1, … , m, j = 1, … , n, nazýváme koeficienty soustavy, pravé
strany
jsou rovněž prvky T. Jestliže
pro k = 1, … , m, pak
soustavu nazýváme soustavou homogenních rovnic, jestliže je alespoň jedno
,
hovoříme o soustavě nehomogenních rovnic. Tn nazveme řešením soustavy, jestliže po
Uspořádanou n-tici dosazení za
v uvedené soustavě platí všech m jejích vztahů.
Označíme-li ,
,
pak se A nazývá matice soustavy, B je sloupec pravých stran a
rozšířená matice soustavy.
7
S ohledem na zavedené označení lze soustavu z předchozí definice psát ve tvaru A.X = B. Podmínky řešitelnosti soustavy lineárních rovnic a počet jejích řešení udává tzv. Frobeniova věta. Věta nese jméno po německém matematikovi Ferdinandovi Georgovi Frobeniusovi (1849 – 1917), který se zabýval teorií diferenciálních rovnic a teorií grup. Byl představitelem tzv. berlínské školy mající v programu aritmetizaci matematiky pomocí vektorového počtu. Frobenius větu ve znění, v němž se často uvádí, vůbec nezavedl, to provedl G. Kowalewski. Připomeňme její znění. Věta 1.2. (Věta Frobeniova) Nechť AX = B je soustava m lineárních rovnic o n neznámých nad tělesem T. Soustava je řešitelná právě tehdy, když . Pokud je hodnost matice A rovna počtu neznámých, tj. právě jedno řešení X = A-1B =
= n, pak má soustava
.
Je-li hodnost matice A menší než počet neznámých, tj.
< n, existuje nekonečně
mnoho řešení, která mají tvar X=
, kde
je libovolně, ale pevně zvolené řešení soustavy AX = B a je nějaké řešení příslušné homogenní soustavy AX = 0. Důkaz: viz. Podle první části Frobeniovy věty má homogenní soustava vždy řešení, neboť . Řešením je vždy n-tice (0, 0, …, 0). Takové řešení je označováno jako triviální. V dalším textu se budeme zabývat pouze nehomogenními soustavami.
8
Uveďme příklady tří soustav ilustrujících všechny situace, které mohou dle věty 1.2 nastat, tj. případ, kdy má soustava právě jedno řešení, příklad, kdy má soustava nekonečně mnoho řešení a konečně příklad neřešitelné soustavy. Jako první budeme řešit situaci, kdy má soustava právě jedno řešení. Příklad 1.1. Pomocí Frobeniovy věty rozhodněte, zda je soustava
nad
řešitelná. Pokud je řešitelná, najděte její řešení.
Rozšířenou matici soustavy,
upravujme elementárními úpravami na trojúhelníkovou matici, z níž už budeme schopni zjistit hodnost rozšířené matice soustavy i hodnost matice soustavy. V matici A|B nejprve vyměníme třetí a druhý řádek: . Nyní vynásobíme první řádek (-1) a přičteme jej k druhému řádku: . Abychom dostali trojúhelníkovou matici, dvojnásobek druhého řádku přičteme k pětinásobku třetího řádku: . Hodnost této matice je rovna třem, a tedy
. Hodnost matice A je rovna
hodnosti matice .
9
Vidíme, že hodnost matice
, a tedy
. Podle
Frobeniovy věty je soustava řešitelná. Navíc platí, že hodnost matice soustavy je rovna počtu neznámých, takže daná soustava má právě jedno řešení. Vypočet řešení lze provést několika způsoby: a) Metoda zpětného dosazování. Zpětné dosazování je postup, kterým se z odstupňované matice vypočte řešení tak, že se nejprve uvažuje poslední řádek , z něho vypočteme neznámou
.
Tuto hodnotu dosadíme do předposledního řádku
Dostáváme
. Do první rovnice dosadíme
Čímž získáme b) Jordanova metoda V upravené matici A|B, , vynulujeme i prvky nad hlavní diagonálou. Přičtením třetího řádku k (-2)násobku druhého řádku dostaneme . Následovně přičteme třetí řádek k (2)násobku prvního řádku. Po této úpravě vynásobíme první řádek (-5) a přidáme k němu trojnásobek druhého řádku: .
10
Aby bylo přehledně vidět řešení soustavy, vydělíme první řádek (-10), druhý řádek (10) a třetí řádek (4):
.
Z matice vidíme, že
,
,
.
Všemi způsoby jsme došli k řešení
.
Příklad 1.2. Řešme soustavu rovnic nad
Je zřejmé , že druhá rovnice soustavy je dvojnásobkem první a třetí je šestinásobkem první. Poslední dvě rovnice lze tedy ze soustavy vynechat. Řešením soustavy jsou řešení rovnice: Rovnici vyhovuje nekonečně mnoho trojic (x, y, z), které splňují podmínku , např.
. Podle Frobeniovy věty
je řešením také trojice , protože vektor
je řešení dané nehomogenní soustavy a vektor
řešení homogenní soustavy. Všechna řešení můžeme napsat ve tvaru
Odtud:
11
je
Příklad 1.3. Pomocí Frobeniovy věty rozhodněte, zda je soustava
daná nad
řešitelná.
Nejprve zapíšeme rozšířenou matici
soustavy.
Nyní, transformací na trojúhelníkovou matici, vyčíslíme hodnost této rozšířené matice soustavy a současně vyčíslíme i hodnost matice soustavy. V první úpravě vynásobíme první řádek (-2) a přičteme jej k druhému řádku a zároveň první řádek vynásobíme (-3) a přičteme jej k třetímu řádu, tím nám vznikne matice: Následně vyměníme druhý řádek za čtvrtý
V dalším kroku vynásobíme druhý řádek (-5) a přičteme jej k třetímu a poté i čtvrtému řádku: . Nyní přehodíme čtvrtý řádek za třetí: . Získali jsme matici, která má hodnost stejnou jako A|B, tj. Zbývá najít hodnost matice A:
12
.
Po provedení elementárních úprav dostaneme matici: . V této matici můžeme vynechat čtvrtý řádek: . Tato matice má hodnosti Pokud se vrátíme k hodnosti rozšířené matice, která je rovna že
. Podle Frobeniovy věty tato soustava nemá řešení.
13
, vidíme,
Kapitola 2
Matice soustavy jako matice homomorfismu Na matici
soustavy AX = B se můžeme dívat jako na matici homomorfismu
, kde V je
prostor uspořádaných n-tic a W je prostor uspořádaných m-tic. Připomeneme si proto základní pojmy. Nejprve zavedeme pojem homomorfismus (lineární zobrazení).
Definice 2.1. Nechť V a W jsou vektorové prostory nad tělesem T. Zobrazení f prostoru V do prostoru W se nazývá homomorfismus, jestliže platí:
Jestliže f je homomorfismus prostoru V do prostoru W, potom se množina nazývá jádro homomorfismu f a množina
je obrazem homomorfismu f. Lze dokázat, že Ker f tvoří podprostor prostoru V a Im f podprostor prostoru W. Pro nalezení obrazu homomorfismu budeme využívat vlastnost, podle níž je Im f generován obrazy vektorů, které generují prostor V. Hodností homomorfismu f se rozumí dimenze Im f , r(f) = Im f.
14
Příklad 2.1. Zobrazení
je dáno vztahem
Zjistěte, zda f je homomorfismus, v kladném případě najděte jeho jádro a obraz. Aby bylo zobrazení f homomorfismem, musí platit vlastnosti, které jsou uvedené v definici homomorfismu, tedy Mějme proto vektory
a číslo
,
potom je Ze zadání je zřejmé, že Podobně platí: Nyní ověříme první
vlastnost z definice, zapíšeme, obraz součtu vektorů x, y
v homomorfismu f
=(
)+(
Tím je dokázáno, že zobrazení f má první definiční vlastnost danou definicí 2.1. Druhou definiční vlastnost dokážeme následovně:
Zadané zobrazení je homomorfismus, proto můžeme najít jak jeho jádro, tak jeho obraz. Z definice víme, že jádro je množina všech vektorů, které se zobrazí na nulový vektor.
15
Můžeme tedy zapsat soustavu:
Z první rovnice soustavy platí
. Z druhé rovnice soustavy dostaneme rovnost
Ve třetí rovnici dosadíme
Jestliže víme, že vidíme, že
za
a přičteme ji ke čtvrté rovnici.
, lehce spočteme, že
, a dále díky rovnosti
. Nalezli jsme jádro homomorfismu ve tvaru:
tedy zadaný homomorfismus f má triviální jádro. Dále určíme obraz zadaného homomorfismu f . Víme, že obraz množiny generátorů je množina generátorů např. kanonickou bázi
prostoru
. Jako množinu generátorů , tj.
můžeme zvolit . Tedy:
Ověříme, zda nejsou vektory lineárně závislé. Nejprve první vektor Im f vynásobíme (1) a přičteme jej k druhému vektoru (výsledek zapíšeme přehledně maticí):
Dále vynásobíme druhý řádek (-1) a přičteme jej k třetímu řádku: . Vektory jsou lineárně nezávislé. Ověřením, že obrazy vektorů kanonické báze jsou lineárně nezávislé, jsme zjistili, že
nejen generují Im
f, ale že do konce tvoří bázi Im f. Došli jsme k závěru, že zadané zobrazení f je homomorfismem s jádrem
a s obrazem
16
Definice 2.2. Nechť V a W jsou vektorové prostory dimenzí n a m nad tělesem T a f je homomorfismus prostoru V do prostoru W. Nechť
je báze prostoru V a
N báze prostoru W. Maticí homomorfismu f vzhledem k bázím M, N budeme rozumět nad tělesem T, ve které na místě ij stojí i-tá souřadnice vektoru
matici typu
vzhledem k bázi N. Věta 2.3. Nechť V a W jsou vektorové prostory dimenzí n a m nad tělesem T a N, M báze těchto prostorů. Nechť f je homomorfismus prostoru V do prostoru W a A matice typu nad tělesem T. Matice A je maticí homomorfismu f vzhledem k bázím M, N právě tehdy, když pro každý vektor
je
Důkaz: viz.
Příklad 2.2. Najděte předpis f(u) pro homomorfismus daný maticí soustavy z příkladu 1.1., kde je soustava lineárních rovnic zadaná nad
a nalezněte řešení soustavy.
Dle věty 2.3. víme, že platí
Proto
Matice soustavy A má tvar
, tedy
).
Úloze: řešit soustavu lineárních rovnic AX = B, odpovídá úloha: najít úplný vzor vektoru B v homomorfismu, který je dán maticí A. Připomeňme, že soustava z příkladu 1.1. měla právě jedno řešení, které bylo proto možné najít Jordanovou metodou. Úpravy matice A, které jsme při výpočtu prováděli, odpovídaly postupu nalezení inverzní matice
.
17
Od soustavy A.X = B reprezentované rozšířenou maticí A|B jsme úpravami dospěli k matici
,
která odpovídá soustavě
, z níž lze řešení snadno
, resp.
vyčíst. Matice A-1 je maticí homomorfismu f–1 inverzního k homomorfismu f, součin A-1.B proto představuje úplný vzor vektoru B. Příklad 2.3. Mějme zadanou soustavu lineárních rovnic:
Nalezněte předpis
pro homomorfismus f daný maticí této soustavy.
Rozšířená matice soustavy je
Matice soustavy má tedy tvar
Předpis
pro homomorfismus f daném maticí soustavy je
Zamysleme se, zda by bylo možné i v tomto případě, kdy je soustava neřešitelná, najít nějakou matici A* tak, aby A*.A = E. (Soustava z příkladu 2.2 měla právě jedno řešení, a tak bylo možné najít čtvercovou matici A* =
, pro kterou je A*.A = E.)
Pak by bylo totiž možné od soustavy AX = B přejít k soustavě (A*.A)X = A*B, resp.
18
X = A*B, která udává nějakou alternativu k řešení X. Matice
nemůže být inverzní
maticí k matici A, protože matice A není maticí čtvercovou. Předpokládáme, že a
A*.A = E.
Pak platí: . Roznásobením dostáváme rovnost: . Dostaneme tedy čtyři rovnice o šesti neznámých:
Nejdříve se budeme zabývat prvními dvěma rovnicemi. Abychom si mohli vyjádřit hodnotu neznámé b, vynásobíme druhou rovnici (-1) a první dvě rovnice sečteme, Z b dosadíme do první rovnice a vypočteme Následovně čtvrtou rovnici vynásobíme (-1) a třetí rovnici sečteme se čtvrtou Tedy víme, že . Dosadíme do třetí rovnice a vypočteme, že
Matice
má tvar: .
K matici soustavy jsme našli jakousi „zobecněnou inverzní matici“, která pro různé hodnoty parametrů a, d dává různě vhodné aproximace řešení dané soustavy. Matice A* je maticí jakéhosi „zobecněného inverzního homomorfismu“ h k homomorfismu f, který každý vektor z Im f
zobrazí do
. Naznačený postup však nefunguje pro
19
všechny obdélníkové matice, navíc nevíme, pro která a, d se získá „nejvhodnější řešení“. V dalším textu zpřesníme naznačené pojmy a uvedeme postupy, které povedou k nalezení nejlepšího přibližného řešení soustav, která řešení nemají.
20
Kapitola 3
Pseudoinverzní homomorfismy V této kapitole zavedeme pojem pseudoinverzního homomorfismu, který bude zpřesňovat označení „zobecněný inverzní homomorfismus“ použité v závěru předchozí části.
Definice 3.1. Nechť U, V jsou vektorové prostory nad tělesem T a f : U Homomorfismus
g
: V
U
se
nazývá
V homomorfismus.
pseudoinverzní
homomorfismus
k homomorfismu f, jestliže f g f = f. Příklad 3.1. Zobrazení
je dáno předpisem:
najděte homomorfismus g, který je pseufoinverzní k homomorfismu f. Z definice vyplývá, že homomorfismus g je pseudoinverzní k homomorfismu f, pokud platí f g f = f. Napišme tento vztah maticově. (Připomeňme, že matice složeného homomorfismu je rovna součinu matic skládaných homomorfismů.)
Po roznásobení matic dostaneme rovnost:
Pokud tuto rovnost převedeme na soustavu rovnic, dostaneme:
21
Rovnice soustavy jsou závislé. To dokážeme lehce, druhá rovnice je (-1)-násobkem první a čtvrtá je dvojnásobkem první. Druhou a čtvrtou rovnici můžeme proto vynechat. Z prvních dvou rovnic vznikne: a z druhých dvou rovnic vznikne:
My budeme volit
. Tedy matice homomorfismu g
má tvar:
Nalezli jsme homomorfismus g, který je pseudoinverzní k homomorfismu f , a to takový: Ověříme, zda platí f g f = f.
Dokázali jsme, že platí f g f = f, tedy homomorfismus g je pseudoinverzní k homomorfismu f. Poznamenejme, že některé volby a, b, c, d splňující podmínku a – 2b – c + 2d =1 nevedou k pseudoinverznímu homomorfismu. Např. pro a = b= c =d = 1, tj. pro
je f g f = f:
V tomto případě není homomorfismus g pseudoinverzní k homomorfismu f. 22
Definice 3.2. Nechť U, V jsou vektorové prostory nad tělesem T. Homomorfismy
a
se nazývají navzájem pseudoinverzní, jestliže je a
Příklad 3.2. Homomorfismus f prostoru
do prostoru
zobrazuje vektor (x,y,z) na vektor:
Najděte takový homomorfismus g, aby byly homomorfismy g, f navzájem pseudoinverzní. Nejprve spočteme jádro homomorfismu f:
Jádro je triviální, tedy obraz množiny generátorů prostoru
Dále nalezneme obraz homomorfismu f jako , tj. např. Im f =
.
a tedy . Vzhledem k tomu, že jádro homomorfismu f je triviální, je jeho direktním doplňkem v podprostor
. Homomorfismus f zobrazí tento podprostor
izomorfně na Im f, můžeme proto sestrojit homomorfismus g tak, že
Aby byl homomorfismus g určen, musíme stanovit, kam se budou zobrazovat vektory z , které neleží v Im f, tj. vektory z direktního doplňku Im f. Připomeňme, že direktním 23
doplňkem podprostoru rozumíme takový podprostor, který s podprostorem,
jenž
doplňje, tvoří prostor, který je direktním součtem. Platí:
(
je direktním doplněk podprostoru
v prostoru V a
je direktním doplňkem
v prostoru V). Direktním doplňkem podprostoru
v prostoru
je např. podprostor
.
V sestrojovaném homomorfismu g proto doplníme
Schéma definující homomorfismus g budeme nadále upravovat tak, abychom z něj zjistili na jaké vektory prostoru
se zobrazí vektory kanonické báze prostoru
První řádek přičteme k (-3)násobku druhého řádku, dále přičteme dvojnásobek třetího řádku k druhému řádku, čímž dostáváme:
Následně vynásobíme poslední řádek (-1) a přičteme jej k prvnímu řádku. Poté přičteme mínus dvojnásobek druhého řádku k pětinásobku prvního řádku. Nyní stačí pouze první řádek vydělit (15) a druhý řádek (5). Odtud víme, že:
Tedy homomorfismus g zobrazí vektor (a,b,c) na vektor:
Nyní se přesvědčíme, že platí rovnosti z definice o navzájem pseudoiverzních homomorfismech,
a
Prověření rovnosti provedeme „maticově“. Matice A bude maticí homomorfismus f a matice B bude maticí homomorfismu g.
24
Vidíme, že podmínka je splněna, a tedy homomorfismy f a g jsou navzájem pseudoinverzní. Věta 3.3. Nechť U, V jsou vektorové prostory nad tělesem T. Ke každému existuje homomorfismus
pseudoinverzní
homomorfismus
, že homomorfismu f a
homomorfismu ,
resp.
takový
jsou navzájem pseudoinverzní.
Důkaz: viz.
Definice 3.4. Nechť U, V jsou (reálné nebo komplexní) homomorfismy Řekneme, že dvojice
nechť jsou navzájem pseudoinverzní.
a
je Mooreova-Penroseova, jestliže je a
Kde
prostory se skalárním součinem,
.
je ortogonálním doplňkem ke
Ortogonální doplněk
obsahuje všechny vektory, které jsou kolmé ke každému
vektoru z prostoru V. Platí
(průnik je nulový), ortogonální doplněk je
tedy direktním doplňkem podprostoru V v prostoru
25
. Ortogonální
doplněk,
hledáme jako řešení homogenní soustavy
k prostoru
rovnic:
Pro výpočet Moore-Penroseovy dvojice homomorfismů použijeme příklad 3.2. Příklad 3.3. Pro homomorfismus f prostoru
do prostoru
, platí:
Najděte takový homomorfismus g, aby tvořil s homomorfismem f MooreovuPenroseovu dvojici navzájem pseudoinverzních homomorfismů. Nejprve spočteme jádro homomorfismu f :
Jádro budeme řešit pomocí matice:
V této matici vynásobíme první řádek (-1) a přičteme jej k druhému řádku ,v zápětí první řádek vynásobíme (-2) a přičteme jej k třetímu řádku. Tím nám vznikne matice, kde jsou druhý a třetí řádek lineárně závislé, proto jeden z nich vynecháme. Dostáváme matici:
Zvolíme parametr
, čímž získáme
a
. Dosazením za parametr
dostáváme jádro Dále vypočítáme
. Jak víme, musí platit
K podprostoru Ker f jsou kolmé všechny vektory (x,y,z), pro které je
26
, proto
Opět musíme volit parametry
Zvolením t, r spočteme,
a tedy
že
.
Tento podprostor se v homomorfismu f zobrazí izomorfně na podprostor Im f. Platí tedy
a Při výpočtu Im f je třeba vzít místo vektorů kanonické báze vektory, které generují doplněk jádra (v případě Mooreovy-Penroseovy dvojice musí být tento doplněk nejen direktní, ale dokonce ortogonální). V takto vytvořeném Im f víme, že obrazy generátorů ortogonálního doplňku jádra jsou generátory Im f a zobrazení f lze odpovídajícím způsobem obrátit a vytvořit pseudoinverzní g. Lze proto sestrojit homomorfismus g
který izomorfně zobrazí Im f na
, tj. bude k homomorfismu f na těchto
prostorech inverzním homomorfismem. K určení homomorfismu g zbývá stanovit, kam zobrazit vektory z ortogonálního doplňku Im f. Spočteme
a
volíme obraz (1,1,-1) v homomorfismu g tak, aby f, g byly navzájem pseudoinverzní, tj. V tomto zobrazení zaměníme první řádek za třetí.
Přičteme mínus trojnásobek prvního řádku k druhému řádku. Poté vynásobíme druhý řádek (2) a přičteme jej k třetímu řádku:
27
V dalším kroku přičteme osminásobek třetího řádku k osmnáctinásobku druhého řádku a třetí řádek přičteme k osmnáctinásobku prvního řádku. Následně pak přičteme druhý řádek k mínus jednonásobku prvního řádku:
Odtud
Dostali jsme tedy homomorfismus g takový, že
[1, str. 421] Věta 3.5. Nechť U, V jsou prostory se skalárním součinem konečných dimenzí. Ke každému homomorfismu že
existuje právě jeden homomorfismus
, takový,
je Mooreova-Penroseova dvojice navzájem pseudoinverzních homomorfismů.
Důkaz: viz. Nyní známe definici pseudoinverzního homomorfismu. Pseudoinverzní matice bude tedy maticí právě zavedeného pseudoinverzního homomorfismu. Pro matice můžeme definovat obdobné pojmy jako pro homomorfismy.
28
Kapitola 4
Pseudoinverzní matice Pseudoinverze
(nazývána
též
zobecněnou
inverzní)
se
používá
na
matice
obdélníkového typu nebo na matice čtvercové singulární (což jsou případy, kdy neexistuje klasická inverzní matice). Na pseudoinverzní matici se mužeme dívat, jako na matici pseudoinverzního homomorfismu, avšak v literatuře se spíše setkáváme s příklady řešenými Moore-Penrosoevou pseudoinverzní maticí, než–li s maticí pseudoinverzního homomorfismu.
Definice 4.1. Nechť
nad tělesm
je matice typu
pseudoinverzní matice k matici =
, pak se matice
a
. Matice
, jestliže
typu
se nazývá
Jestliže platí navíc rovnost
nazývají navzájem pseudoinverzní.
Vraťme se k příkladu 2.3., kde jsme se snažili najít matici „zobecněného inverzního homomorfismu“. My nyní již víme, jaké podmínky musí matice splňovat, aby byla pseudoinverzní maticí k dané matici. Příklad 4.1. Nalezněte pseudoinverzní matici k matici
V příkladu 2.3. jsme hledali matici
, takovou, že
. Zjistili jsme, že matice
závisí na parametrech: . Najděme tedy parametry a, d tak, aby matice a podle definice splňovala podmínku
byla pseudoinverzní maticí k matici .
29
.
Tímto tedy dostáváme:
Vidíme,že matice jsou pseudoinverzní pro libovolné parametry a , d. Příklad 4.2. Nalezněte takovou matici k matici
aby byly matice navzájem pseudoiverzní. V předchozím příkladě jsme si uvedli, že pro libovolné parametry a, d je matice A s maticí
pseudoinverzní. Ověřme, zda jsou při libovolných parametrech matice navzájem pseudoniverzní tedy, že platí
=
.
Ověřili jsme, že pro libovolné parametry a, d jsou matice
navzájem
pseudoinverzní. Pseudoinverzní
matice se nejčastěji objevuje jako tzv. Mooreova-Penroseova
matice pseudoinverze. Mooreovu-Penroseovu matici pseudoinverze by bylo možné zavést jako matici jistého homomorfismus, který tvoří s homomorfismem určeným
30
danou maticí Mooreovu-Penroseovu dvojici homomorfismů, proto se vrátíme k příkladu 3.3., kde jsme tuto dvojici počítali. Příklad 4.3. Nalezněte pseudoinverzní matici k dané matici jako matici jistého homomorfismu, který s homomorfismem daným maticí A tvoří Mooreovu-Penroseovu dvojici homomorfismů.
K tomuto homomorfismus f budeme hledat homomorfismus g, který s ním tvoří Mooreovu-Penroseovu dvojici homomorfismu, tento postup je uveden v příkladě 3.3. My lehce spočteme, že
, jelikož je jádro triviální, je
Tento podprostor se v homomorfismu f zobrazí izomorfně na podprostor Im f. Platí tedy
a V Im f víme, že obrazy generátorů ortogonálního doplňku jádra jsou generátory Im f a zobrazení f lze odpovídajícím způsobem obrátit a vytvořit pseudoinverzní g. Lze proto sestrojit homomorfismus g
který izomorfně zobrazí Im f na
, tj. bude k homomorfismu f na těchto
prostorech inverzním homomorfismem. K určení homomorfismu g zbývá stanovit, kam zobrazit
vektory
a volíme obraz
z ortogonálního
doplňku
Im
f.
Spočteme
v homomorfismu g tak, aby f, g byly navzájem pseudoinverzní,
tj.
31
Máme tedy homomorfismus g zadán:
První řádek zaměníme s třetím řádkem. Poté přičteme mínus dvojnásobek prvního řádku k druhému řádku a mínus jednonásobek prvního řádku k třetímu řádku. Následně přičteme druhý řádek k třetímu řádku
Dále přičteme sedminásobek třetího řádku k mínus jedenáctinásobku druhého řádku a trojnásobek třetího řádku přičteme k jedenáctinásobku prvního řádku. V další úpravě přičteme druhý řádek k prvnímu
Odtud
Dostali jsme tedy homomorfismus g takový, že
Matice homomorfismu g má tvar:
Již známe defininici matice pseudoinverzního homomorfismu. Pokud navíc matice homomorfismus A tvoří s pseudoinverzní maticí homomorfismu Penroseovu dvojici homomorfismů, můžeme o maticí A a
32
mluvit jak o
Mooreovu-
Mooreově-Penroseově dvojici navzájem pseudoinverzních matic. Z uvedených příkladů jsou vidět vlastnosti této dvojice matic.
Definice 4.2. (Moore - Penroseova inverze matice) Nechť A je matice typu
, X je matice typu
. Matice X se nazývá
Moore – Penroseova inverze (nebo též pseudoinverze) matice A, jestliže platí: (i)
AXA = A
(ii)
XAX = X
(iii)
= AX
(iv)
= XA
Podmínky (i) – (iv) se nazývají Penroseovy podmínky. Matice X se nazývá Moore – Penroseova inverze matice A (často se označuje pouze jako pseudoinverze matice A) . V definici Moore-Penroseovy inverze je uveden operátor
(vykřičník). Tento
operátor označuje maticovou operaci, která je definována:
, kde A je
libovolná matice, jejíž prvky
náleží do oboru komplexních čísel a
je
komplexně sdružená matice k matici A. Moore-Penroseovu matici zavedli, nezávisle na sobě, E. H. Moore v roce 1920, Arne Bjerhammar v roce 1951 a Roger Penrose v roce 1955. Dnes je Moore-Penroseova matice nejčastěji používanou pseudoinverzní maticí, ale není jedinou. Jako zobecněnou inverzní matici lze použít tzv. Drazinovu inverzi, grupovou inverzi nebo spektrální inverzi. Viz.
.
Věta 4.3. (věta o jednoznačnosti Moore – Penroseova inverze matice) Ke každé matici existuje právě jedna Mooreova-Penroseova pseudoinverzní matice. Důkaz: viz. Máme tedy pseudoinverzi matice A určenou jednoznačně, a proto pro ni zavedeme i označení. Většinou se tato pseudoinverze označuje symbolem 33
a toto značení
budeme používat i my v následujícím textu, tedy označení matice X bude nahrazeno označením
.
K výpočtům příkladů budeme používat program Matlab. Příklad 4.4. Nalezněte pseudoinverzní matici k matici
Pro výpočet pseudoiverzní matice se pomůžeme programem Matlab, konkrétně příkazem >> pinv(A), čímž dostáváme matici
Zkusme porovnat tento výsledek s výsledkem „klasické“ (čtvercové) inverze.
Elementárními úpravami dostáváme
Příklad 4.5. Pomocí pseudoiverzní matice nalezněte řešení soustavy
. 34
Známe rozšířenou matici soustavy,
i , Nyní pomocí příkazu v programu Matlab: >> X=pinv(A)*B dostáváme řešení zadané soustavy:
Pokud se vrátíme zpět k příkladu 1.1., uvidíme, že naše nalezené řešení se shoduje s řešením soustavy, které jsme spočetli jinými způsoby. Ukázali jsme si, že v případě čtvercové matice se pseudoinverzní matice rovná matici inverzní, právě proto se pseudoinverzní matice používá nejvíce u matic, které jsou jiného typu než čtvercového. Díky tomu, můžeme nalézt nejlepší přibližné řešení soustav, které dle Frobeniovy věty nemají řešení.
Věta 4.4. Nejlepším řešením maticové rovnice
je
.
Důkaz: viz.
Pro
platí, že je nejlepším přibližným řešením rovnice
funkce), jestliže pro každé X příslušného typu platí buď to 35
(kde f je nějaká
nebo a současně kde
je maticová norma a se nazývá nejlepší přibližné řešení systému
. Pokud má systém
řešení je toto řešení rovno A právě řešení
budeme hledat v následujícím příkladu.
Nyní se vrátíme k příkladu 1.3., který dle Frobeniovy věty neměl řešení. Na tento příklad budeme aplikovat řešení pomocí pseudoinverzní matice pomocí programu Matlab. Příklad 4.6. Pomocí pseudoinverzní matice nalezněte řešení soustavy:
Víme, jak vypadá rozšířená matice soustavy:
Lehce tedy zjistíme, že:
Nyní pomocí příkazu v programu Matlab: >> X=pinv(A)*B dostáváme
nejlepší přibližné řešení zadané soustavy:
36
Podívejme se na to, jak bude vypadat řešení rovnic pomocí pseudoinverzní matice za předpokladu, že soustava má řešení. Zkusme aplikovat řešení soustav lineárních rovnic pomocí pseudoinverzní matice na soustavy, které mají nekonečně mnoho řešení. Opět se vrátíme k příkladu z první kapitoly, konkrétně k příkladu 1.2. Příklad 4.7. Řešme soustavu rovnic nad
Známe rozšířenou matici soustavy
i
Opět budeme hledat řešení
pomocí programu Matlab.
>> X=pinv(A)*B
V tomto případě dostáváme pouze jedno z řešení této soustavy. Kdybychom nezjišťovali zda jsou jednotlivé rovnice této soustavy lineárně závislé, nemuseli bychom vůbec dojít k závěru, že soustava má nekonečně mnoho řešení. Tedy při řešení
37
soustavy lineárních rovnic, která má nekonečně mnoho řešení, pomocí pseudoiverzní matice dostáváme pouze jedno řešení.
38
Kapitola 5
Příklady K řešení dalšího příkladu budeme používat program Matlab. Příklad 5.1. Matlabem si necháme vygenerovat náhodnou matici A a náhodnou matici B, určíme pouze jejich velikost:
>> A=round(10*rand(5,4)) >> B=round(10*rand(5,1))
Příkazem >> rank(A), v Matlabu zjistíme
. Tedy dle Frobeniovy věty nemá
a
soustava řešení, proto pro nalezení nejlepšího přibližného řešení využijeme rovnosti . Výpočet této rovnosti lze v matlabu provést jedním příkazem:
>> X=pinv(A)*B
Tímto jsme nalezli řešení náhodně vygenerované soustavy lineárních rovnic pomocí programu Matlab. V Matlabu si opět náhodně vygenerujeme soustavu. Tentokrát bude matice soustavy větší a my budeme rovnou aplikovat výpočet pseudoinverzní matice.
39
Příklad 5.2. Mějme náhodně vygenerované matice A a B.
>> A=round(10*rand(5,10)) >> B=round(10*rand(5,1)) A = 9
9
0
3
5
3
4
7
8
2
2
1
3
5
8
6
8
3
1
10
9
5
4
1
8
1
8
5
1
10
3
4
4
9
4
5
7
1
8
5
3
6
5
1
10
4
9
7
6
0
B = 3 5 6 3 7
>> % Tentokrát se nebudeme přesvědčovat o řešitelnosti. >> % Řešením bude vypočteno rovnou pomocí pseudoinverzní matice. >> X=pinv(A)*B X = -0.0041329 0.0332448 0.2228459 -0.1085067 0.2791803 -0.0030616 0.2670804 0.1118853 -0.0265450 0.0188190
V tomto případě je soustava řešitelná, proto jsme nenalezli její nejlepší přibližné řešení, ale řešení této soustavy. K tomu výsledku bychom došli, i pokud bychom počítali soustavu jinou metodou, než-li metodou pseudoinverzních matic.
40
V následující příkladu budeme porovnávat řešení soustavy lineárních rovnic pomocí Gaussovy eliminační metody a řešení soustavy lineárních rovnic pomocí metody pseudoinverzních matic. Připomeňme si, že Gaussova eliminační metoda řeší problém zadaný maticí tak, že danou matici upraví na trojúhelníkovou matici nebo na „odstupňovanou matici“ (každou matici lze řádkovými úpravami převést na odstupňovanou matici, která je s ní ekvivalentní, tj. má stejnou hodnost). Příklad 5.3. Najděte řešení soustavy
Ze zadání víme, že:
a) Gaussova eliminační metoda Při Gaussově eliminační metodě budeme upravovat matici do trojúhelníkového tvaru. Nejprve přičteme první řádek k mínus dvojnásobku druhého řádku, trojnásobek prvního řádku k mínus dvojnásobku třetího řádku a
mínus dvojnásobek prvního řádku k
čtvrtému řádku. V dalším kroku vynásobíme druhý řádek (-7) a přičteme jej k třetímu řádku a následně druhý řádek vynásobíme (-1) a přičteme k čtvrtému řádku. Dostáváme matici:
Dále v této matici vydělíme třetí řádkem (-2). Následně vynásobíme třetí řádek přičteme jej k čtvrtému řádku. Čímž dostaneme trojúhelníkovou matici: 41
a
Z této matice vidíme, že
. Dále spočteme:
Výsledkem této soustavy je
b) Řešení pomocí pseudoinverzní matice. Víme, jak vypadá matice soustavy A, i jak vypadá matice B. můžeme tedy využít vztah Výpočet tohoto vztahu budeme provádět pomocí programu Matlab, přes příkaz: >> X=pinv(A)*B. Dostáváme tedy řešení:
Vidíme tedy, že řešení přes pseudoinverzní matice je rovno řešení pomocí Gaussovy eliminační metody, tedy za předpokladu, že soustava má řešení.
42
Závěr Tato práce měla za úkol řešit soustavy lineárních rovnic pomocí pseudoinverzní matice. Byl zaveden teoretický základ pro řešitelnost soustav lineárních rovnic. Dále jsme uvedli, že na matici soustavy se můžeme dívat jako na matici homomorfismus. Proto byly připomenuty základní pojmy z této oblasti. Jelikož v úvodu uvedli, že na pseudoinverzní matici lze pohlížet jako na matici pseudoiverzního homomorfismu, byla tato práce takto směřována. Zmínili jsme, že pseudoinverzní
matice
se
nejčastěji
objevuje
jako
Mooreova-Penroseova
pseudoinverze. Za použití
programu Matlab jsme srovnávali metodu pseudoiverzních matic
s Gaussovou eliminační metodou. Ze získaných výsledků bylo zjištěno, že tyto dvě metody určují stejný výsledek, má-li soustava lineárních rovnic řešení. Pokud soustava nemá dle Frobeniovy věty řešení, nabízí nám metoda pseudoinverzních matic nejlepší přibližné řešení soustavy.
43
Seznam použité literatury a zdrojů: Bečvář, Jindřich, Lineární algebra, Praha: Matfyzpress, 2010 Fojt, Michal, Bakalářská práce: Moore – Penroseova inverze matice, Brno,2006 Havel, V., Holenda, J., Lineární algebra, Praha: SNTL, 1984 Tesková,Libuše, Lineární algebra, Plzeň: Západočeská univerzita v Plzni, 2005 Pokorná, Olga, Pseudoinverzní matice, Praha: Státní pedagogické nakladatelství, 1978 Bican, Ladislav, Lineární algebra a geometrie, Praha: Academia, 2009 Ježek, Jaroslav, Univerzální algebra a teorie modelů, Praha: SNTL,1976 Bican, Ladislav, Lineární algebra, Praha: SNTL, 1979 Tlustý, Pavel, Lineární algebra a její aplikace, České Budějovice: Jihočeská univerzita,2003 Míka, Stanislav, Numerické metody algebry, Praha: SNTL, 1985 Výborný, K., Zahradník, M., Používáme lineární algebru – Sbírka řešených příkladů, Praha: Karolinum, 2004 Greville, T. N. E., The Pseudoinverse of a Rectangular or Singular Matrix and its Application to the Solution of Systems of Linear Equations , SIAM Review, 1959 http://en.wikipedia.org/wiki/Moore–Penrose_pseudoinverse http://home.pf.jcu.cz/~hasek/LAG/Pr5/Pr_5_Homomorfismus.pdf http://www.studopory.vsb.cz/studijnimaterialy/MatematikaI/12_MI_KAP%202_5. pdf http://www.karlin.mff.cuni.cz/~vald/Cviceni_11.pdf
44
Název práce: Řešení soustav lineárních rovnic užitím pseudoinverzních matic Autor: Martina Stehlíková Katedra matematiky, fyziky a technické výchovy, Fakulta pedagogická, Západočeská univerzita Vedoucí práce: Mgr. Martina Kašparová, Ph.D. Abstrakt: Tato práce se zabývá řešení soustav lineárních rovnic pomocí metody pseudoinverzních matic. Určování řešitelnosti soustavy lineárních rovnic je zavedeno pomocí
Frobeniovy
věty.
Pseudoinverzní
matice
je
zadaná
jako
matice
pseudoinverzního homomorfismus. Pomocí pseudoinverzní matice je hledáno řešení soustav, které mají právě jedno řešení, mají nekonečně mnoho řešení a které jsou dle Frobeniovy věty neřešitelné. Vše je doplněno o vzorové příklady. Klíčová slova: Soustavy lineárních rovnic, matice soustavy lineárních rovnic, Frobeniova
věta,
homomorfismus,
matice
homomorfismu,
pseudoinverzní
homomorfismus, matice pseudoinverzního homomorfismu, Mooreova-Penroseova matice pseudoinverze.
Title: Solving systems of linear equations using matrix pseudoinverse Author: Martina Stehlíková Department of Mathematics, Physics and Technical Education, Faculty of Education, University of West Bohemia Supervisor: Mgr. Martina Kašparová, Ph.D. Abstract: This work deals with solving systems of linear equations using the pseudoinverse matrix. Determining the solvability of systems of linear equations is introduced by Frobenius theorem. Pseudoinverse matrix is given as a matrix pseudoinverzního homomorphism. Using the pseudoinverse matrix is sought for solving systems that have just one solution, have infinitely many solutions which are, according to Frobenius theorem insoluble. Everything is accompanied by illustrative examples. Keywords: Systems of linear equations, matrix systems of linear equations, Frobenius theorem, homomorphism, homomorphism matrices, pseudoinverse homomorphism, homomorphism pseudoinverse matrix, Moore-Penrose pseudoinverse matrix.
45