ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC UŽITÍM PSEUDOINVERZNÍCH MATIC

Západočeská univerzita v Plzni Fakulta pedagogická

Bakalářská práce

ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC UŽITÍM PSEUDOINVERZNÍCH MATIC Martina Stehlíková

Plzeň 2012

Prohlášení Prohlašuji, že jsem práci vypracovala samostatně s použitím uvedené literatury a zdrojů informací.

V Plzni, dne 12.4. 2012 Martina Stehlíková

Na třetí nečíslované stránce je uvedena kopie písemného zadání práce.

Poděkování Tímto bych ráda poděkovala vedoucí práce Mgr. Martině Kašparové, Ph.D. za odborné vedení, cenné rady, věcné připomínky a čas, který mi věnovala.

Obsah Úvod

6

1. Řešení soustav lineárních rovnic

7

2. Matice soustavy jako matice homomorfismu

14

3. Pseudoinverzní homomorfismus

21

4. Pseudoinverzní matice

29

5. Příklady

39

Závěr

43

Seznam použité literatury a zdrojů

44

5

Úvod Jedním z nejstarších problémů v matematice je řešení soustav lineárních rovnic. Na tuto úlohu vede řada problémů nejen v matematice, ale i v jiných oborech. Řešení soustav lineárních rovnic má mnoho aplikací např. při předpovědích, odhadování, v lineárním programování. Moje bakalářská práce se právě řešením soustav lineárních rovnic zabývá, konkrétně řešením soustav lineárních rovnic užitím pseudoinverzních matic. V mnoha příkladech řešíme soustavu lineárních rovnic, které jsou popsány maticí soustavy a vektorem pravých stran. K řešení soustavy máme k dispozici mnoho metod řešení, pokud je matice soustavy čtvercová a regulární. Můžeme se však setkat se soustavami, které jsou obecnější. Matice takové soustavy může být obecně obdélníková nebo nemusí mít matice plnou sloupcovou nebo řádkovou hodnost. Řešení takovýchto soustav lineárních rovnic je možné provést právě pomocí pseudoinverzní matice. Na pseudoinverzní matici se můžeme dívat jako na matici pseudoiverzního homomorfismu, proto jsou v práci uvedené pojmy jako homomorfismus, matice homomorfismu,

psedoinvezní

homomorfismus,

navzájem

pseduoinverzní

homomorfismy a k těmto pojmům jsou zavedeny příslušné definice a věty. Nebude-li uvedeno jinak, definice a věty jsou převzaty ze zdrojů, které jsou uvedeny v seznamu použité literatury.

6

Kapitola 1

Řešitelnost soustav lineárních rovnic V této kapitole připomeneme základní pojmy z oblasti týkající se soustav lineárních rovnic a jejich řešitelnosti.

Definice 1.1. Soustavou m lineárních rovnic o n neznámých

nad tělesem T

rozumíme každou soustavu, kterou lze upravit na tvar

Prvky

:

:

:

:

T, i = 1, … , m, j = 1, … , n, nazýváme koeficienty soustavy, pravé

strany

jsou rovněž prvky T. Jestliže

pro k = 1, … , m, pak

soustavu nazýváme soustavou homogenních rovnic, jestliže je alespoň jedno

,

hovoříme o soustavě nehomogenních rovnic. Tn nazveme řešením soustavy, jestliže po

Uspořádanou n-tici dosazení za

v uvedené soustavě platí všech m jejích vztahů.

Označíme-li ,

,

pak se A nazývá matice soustavy, B je sloupec pravých stran a

rozšířená matice soustavy.

7

S ohledem na zavedené označení lze soustavu z předchozí definice psát ve tvaru A.X = B. Podmínky řešitelnosti soustavy lineárních rovnic a počet jejích řešení udává tzv. Frobeniova věta. Věta nese jméno po německém matematikovi Ferdinandovi Georgovi Frobeniusovi (1849 – 1917), který se zabýval teorií diferenciálních rovnic a teorií grup. Byl představitelem tzv. berlínské školy mající v programu aritmetizaci matematiky pomocí vektorového počtu. Frobenius větu ve znění, v němž se často uvádí, vůbec nezavedl, to provedl G. Kowalewski. Připomeňme její znění. Věta 1.2. (Věta Frobeniova) Nechť AX = B je soustava m lineárních rovnic o n neznámých nad tělesem T. Soustava je řešitelná právě tehdy, když . Pokud je hodnost matice A rovna počtu neznámých, tj. právě jedno řešení X = A-1B =

= n, pak má soustava

.

Je-li hodnost matice A menší než počet neznámých, tj.

< n, existuje nekonečně

mnoho řešení, která mají tvar X=

, kde

je libovolně, ale pevně zvolené řešení soustavy AX = B a je nějaké řešení příslušné homogenní soustavy AX = 0. Důkaz: viz. Podle první části Frobeniovy věty má homogenní soustava vždy řešení, neboť . Řešením je vždy n-tice (0, 0, …, 0). Takové řešení je označováno jako triviální. V dalším textu se budeme zabývat pouze nehomogenními soustavami.

8

Uveďme příklady tří soustav ilustrujících všechny situace, které mohou dle věty 1.2 nastat, tj. případ, kdy má soustava právě jedno řešení, příklad, kdy má soustava nekonečně mnoho řešení a konečně příklad neřešitelné soustavy. Jako první budeme řešit situaci, kdy má soustava právě jedno řešení. Příklad 1.1. Pomocí Frobeniovy věty rozhodněte, zda je soustava

nad

řešitelná. Pokud je řešitelná, najděte její řešení.

Rozšířenou matici soustavy,

upravujme elementárními úpravami na trojúhelníkovou matici, z níž už budeme schopni zjistit hodnost rozšířené matice soustavy i hodnost matice soustavy. V matici A|B nejprve vyměníme třetí a druhý řádek: . Nyní vynásobíme první řádek (-1) a přičteme jej k druhému řádku: . Abychom dostali trojúhelníkovou matici, dvojnásobek druhého řádku přičteme k pětinásobku třetího řádku: . Hodnost této matice je rovna třem, a tedy

. Hodnost matice A je rovna

hodnosti matice .

9

Vidíme, že hodnost matice

, a tedy

. Podle

Frobeniovy věty je soustava řešitelná. Navíc platí, že hodnost matice soustavy je rovna počtu neznámých, takže daná soustava má právě jedno řešení. Vypočet řešení lze provést několika způsoby: a) Metoda zpětného dosazování. Zpětné dosazování je postup, kterým se z odstupňované matice vypočte řešení tak, že se nejprve uvažuje poslední řádek , z něho vypočteme neznámou

.

Tuto hodnotu dosadíme do předposledního řádku

Dostáváme

. Do první rovnice dosadíme

Čímž získáme b) Jordanova metoda V upravené matici A|B, , vynulujeme i prvky nad hlavní diagonálou. Přičtením třetího řádku k (-2)násobku druhého řádku dostaneme . Následovně přičteme třetí řádek k (2)násobku prvního řádku. Po této úpravě vynásobíme první řádek (-5) a přidáme k němu trojnásobek druhého řádku: .

10

Aby bylo přehledně vidět řešení soustavy, vydělíme první řádek (-10), druhý řádek (10) a třetí řádek (4):

.

Z matice vidíme, že

,

,

.

Všemi způsoby jsme došli k řešení

.

Příklad 1.2. Řešme soustavu rovnic nad

Je zřejmé , že druhá rovnice soustavy je dvojnásobkem první a třetí je šestinásobkem první. Poslední dvě rovnice lze tedy ze soustavy vynechat. Řešením soustavy jsou řešení rovnice: Rovnici vyhovuje nekonečně mnoho trojic (x, y, z), které splňují podmínku , např.

. Podle Frobeniovy věty

je řešením také trojice , protože vektor

je řešení dané nehomogenní soustavy a vektor

řešení homogenní soustavy. Všechna řešení můžeme napsat ve tvaru

Odtud:

11

je

Příklad 1.3. Pomocí Frobeniovy věty rozhodněte, zda je soustava

daná nad

řešitelná.

Nejprve zapíšeme rozšířenou matici

soustavy.

Nyní, transformací na trojúhelníkovou matici, vyčíslíme hodnost této rozšířené matice soustavy a současně vyčíslíme i hodnost matice soustavy. V první úpravě vynásobíme první řádek (-2) a přičteme jej k druhému řádku a zároveň první řádek vynásobíme (-3) a přičteme jej k třetímu řádu, tím nám vznikne matice: Následně vyměníme druhý řádek za čtvrtý

V dalším kroku vynásobíme druhý řádek (-5) a přičteme jej k třetímu a poté i čtvrtému řádku: . Nyní přehodíme čtvrtý řádek za třetí: . Získali jsme matici, která má hodnost stejnou jako A|B, tj. Zbývá najít hodnost matice A:

12

.

Po provedení elementárních úprav dostaneme matici: . V této matici můžeme vynechat čtvrtý řádek: . Tato matice má hodnosti Pokud se vrátíme k hodnosti rozšířené matice, která je rovna že

. Podle Frobeniovy věty tato soustava nemá řešení.

13

, vidíme,

Kapitola 2

Matice soustavy jako matice homomorfismu Na matici

soustavy AX = B se můžeme dívat jako na matici homomorfismu

, kde V je

prostor uspořádaných n-tic a W je prostor uspořádaných m-tic. Připomeneme si proto základní pojmy. Nejprve zavedeme pojem homomorfismus (lineární zobrazení).

Definice 2.1. Nechť V a W jsou vektorové prostory nad tělesem T. Zobrazení f prostoru V do prostoru W se nazývá homomorfismus, jestliže platí:

Jestliže f je homomorfismus prostoru V do prostoru W, potom se množina nazývá jádro homomorfismu f a množina

je obrazem homomorfismu f. Lze dokázat, že Ker f tvoří podprostor prostoru V a Im f podprostor prostoru W. Pro nalezení obrazu homomorfismu budeme využívat vlastnost, podle níž je Im f generován obrazy vektorů, které generují prostor V. Hodností homomorfismu f se rozumí dimenze Im f , r(f) = Im f.

14

Příklad 2.1. Zobrazení

je dáno vztahem

Zjistěte, zda f je homomorfismus, v kladném případě najděte jeho jádro a obraz. Aby bylo zobrazení f homomorfismem, musí platit vlastnosti, které jsou uvedené v definici homomorfismu, tedy Mějme proto vektory

a číslo

,

potom je Ze zadání je zřejmé, že Podobně platí: Nyní ověříme první

vlastnost z definice, zapíšeme, obraz součtu vektorů x, y

v homomorfismu f

=(

)+(

Tím je dokázáno, že zobrazení f má první definiční vlastnost danou definicí 2.1. Druhou definiční vlastnost dokážeme následovně:

Zadané zobrazení je homomorfismus, proto můžeme najít jak jeho jádro, tak jeho obraz. Z definice víme, že jádro je množina všech vektorů, které se zobrazí na nulový vektor.

15

Můžeme tedy zapsat soustavu:

Z první rovnice soustavy platí

. Z druhé rovnice soustavy dostaneme rovnost

Ve třetí rovnici dosadíme

Jestliže víme, že vidíme, že

za

a přičteme ji ke čtvrté rovnici.

, lehce spočteme, že

, a dále díky rovnosti

. Nalezli jsme jádro homomorfismu ve tvaru:

tedy zadaný homomorfismus f má triviální jádro. Dále určíme obraz zadaného homomorfismu f . Víme, že obraz množiny generátorů je množina generátorů např. kanonickou bázi

prostoru

. Jako množinu generátorů , tj.

můžeme zvolit . Tedy:

Ověříme, zda nejsou vektory lineárně závislé. Nejprve první vektor Im f vynásobíme (1) a přičteme jej k druhému vektoru (výsledek zapíšeme přehledně maticí):

Dále vynásobíme druhý řádek (-1) a přičteme jej k třetímu řádku: . Vektory jsou lineárně nezávislé. Ověřením, že obrazy vektorů kanonické báze jsou lineárně nezávislé, jsme zjistili, že

nejen generují Im

f, ale že do konce tvoří bázi Im f. Došli jsme k závěru, že zadané zobrazení f je homomorfismem s jádrem

a s obrazem

16

Definice 2.2. Nechť V a W jsou vektorové prostory dimenzí n a m nad tělesem T a f je homomorfismus prostoru V do prostoru W. Nechť

je báze prostoru V a

N báze prostoru W. Maticí homomorfismu f vzhledem k bázím M, N budeme rozumět nad tělesem T, ve které na místě ij stojí i-tá souřadnice vektoru

matici typu

vzhledem k bázi N. Věta 2.3. Nechť V a W jsou vektorové prostory dimenzí n a m nad tělesem T a N, M báze těchto prostorů. Nechť f je homomorfismus prostoru V do prostoru W a A matice typu nad tělesem T. Matice A je maticí homomorfismu f vzhledem k bázím M, N právě tehdy, když pro každý vektor

je

Důkaz: viz.

Příklad 2.2. Najděte předpis f(u) pro homomorfismus daný maticí soustavy z příkladu 1.1., kde je soustava lineárních rovnic zadaná nad

a nalezněte řešení soustavy.

Dle věty 2.3. víme, že platí

Proto

Matice soustavy A má tvar

, tedy

).

Úloze: řešit soustavu lineárních rovnic AX = B, odpovídá úloha: najít úplný vzor vektoru B v homomorfismu, který je dán maticí A. Připomeňme, že soustava z příkladu 1.1. měla právě jedno řešení, které bylo proto možné najít Jordanovou metodou. Úpravy matice A, které jsme při výpočtu prováděli, odpovídaly postupu nalezení inverzní matice

.

17

Od soustavy A.X = B reprezentované rozšířenou maticí A|B jsme úpravami dospěli k matici

,

která odpovídá soustavě

, z níž lze řešení snadno

, resp.

vyčíst. Matice A-1 je maticí homomorfismu f–1 inverzního k homomorfismu f, součin A-1.B proto představuje úplný vzor vektoru B. Příklad 2.3. Mějme zadanou soustavu lineárních rovnic:

Nalezněte předpis

pro homomorfismus f daný maticí této soustavy.

Rozšířená matice soustavy je

Matice soustavy má tedy tvar

Předpis

pro homomorfismus f daném maticí soustavy je

Zamysleme se, zda by bylo možné i v tomto případě, kdy je soustava neřešitelná, najít nějakou matici A* tak, aby A*.A = E. (Soustava z příkladu 2.2 měla právě jedno řešení, a tak bylo možné najít čtvercovou matici A* =

, pro kterou je A*.A = E.)

Pak by bylo totiž možné od soustavy AX = B přejít k soustavě (A*.A)X = A*B, resp.

18

X = A*B, která udává nějakou alternativu k řešení X. Matice

nemůže být inverzní

maticí k matici A, protože matice A není maticí čtvercovou. Předpokládáme, že a

A*.A = E.

Pak platí: . Roznásobením dostáváme rovnost: . Dostaneme tedy čtyři rovnice o šesti neznámých:

Nejdříve se budeme zabývat prvními dvěma rovnicemi. Abychom si mohli vyjádřit hodnotu neznámé b, vynásobíme druhou rovnici (-1) a první dvě rovnice sečteme, Z b dosadíme do první rovnice a vypočteme Následovně čtvrtou rovnici vynásobíme (-1) a třetí rovnici sečteme se čtvrtou Tedy víme, že . Dosadíme do třetí rovnice a vypočteme, že

Matice

má tvar: .

K matici soustavy jsme našli jakousi „zobecněnou inverzní matici“, která pro různé hodnoty parametrů a, d dává různě vhodné aproximace řešení dané soustavy. Matice A* je maticí jakéhosi „zobecněného inverzního homomorfismu“ h k homomorfismu f, který každý vektor z Im f

zobrazí do

. Naznačený postup však nefunguje pro

19

všechny obdélníkové matice, navíc nevíme, pro která a, d se získá „nejvhodnější řešení“. V dalším textu zpřesníme naznačené pojmy a uvedeme postupy, které povedou k nalezení nejlepšího přibližného řešení soustav, která řešení nemají.

20

Kapitola 3

Pseudoinverzní homomorfismy V této kapitole zavedeme pojem pseudoinverzního homomorfismu, který bude zpřesňovat označení „zobecněný inverzní homomorfismus“ použité v závěru předchozí části.

Definice 3.1. Nechť U, V jsou vektorové prostory nad tělesem T a f : U Homomorfismus

g

: V

U

se

nazývá

V homomorfismus.

pseudoinverzní

homomorfismus

k homomorfismu f, jestliže f g f = f. Příklad 3.1. Zobrazení

je dáno předpisem:

najděte homomorfismus g, který je pseufoinverzní k homomorfismu f. Z definice vyplývá, že homomorfismus g je pseudoinverzní k homomorfismu f, pokud platí f g f = f. Napišme tento vztah maticově. (Připomeňme, že matice složeného homomorfismu je rovna součinu matic skládaných homomorfismů.)

Po roznásobení matic dostaneme rovnost:

Pokud tuto rovnost převedeme na soustavu rovnic, dostaneme:

21

Rovnice soustavy jsou závislé. To dokážeme lehce, druhá rovnice je (-1)-násobkem první a čtvrtá je dvojnásobkem první. Druhou a čtvrtou rovnici můžeme proto vynechat. Z prvních dvou rovnic vznikne: a z druhých dvou rovnic vznikne:

My budeme volit

. Tedy matice homomorfismu g

má tvar:

Nalezli jsme homomorfismus g, který je pseudoinverzní k homomorfismu f , a to takový: Ověříme, zda platí f g f = f.

Dokázali jsme, že platí f g f = f, tedy homomorfismus g je pseudoinverzní k homomorfismu f. Poznamenejme, že některé volby a, b, c, d splňující podmínku a – 2b – c + 2d =1 nevedou k pseudoinverznímu homomorfismu. Např. pro a = b= c =d = 1, tj. pro

je f g f = f:

V tomto případě není homomorfismus g pseudoinverzní k homomorfismu f. 22

Definice 3.2. Nechť U, V jsou vektorové prostory nad tělesem T. Homomorfismy

a

se nazývají navzájem pseudoinverzní, jestliže je a

Příklad 3.2. Homomorfismus f prostoru

do prostoru

zobrazuje vektor (x,y,z) na vektor:

Najděte takový homomorfismus g, aby byly homomorfismy g, f navzájem pseudoinverzní. Nejprve spočteme jádro homomorfismu f:

Jádro je triviální, tedy obraz množiny generátorů prostoru

Dále nalezneme obraz homomorfismu f jako , tj. např. Im f =

.

a tedy . Vzhledem k tomu, že jádro homomorfismu f je triviální, je jeho direktním doplňkem v podprostor

. Homomorfismus f zobrazí tento podprostor

izomorfně na Im f, můžeme proto sestrojit homomorfismus g tak, že

Aby byl homomorfismus g určen, musíme stanovit, kam se budou zobrazovat vektory z , které neleží v Im f, tj. vektory z direktního doplňku Im f. Připomeňme, že direktním 23

doplňkem podprostoru rozumíme takový podprostor, který s podprostorem,

jenž

doplňje, tvoří prostor, který je direktním součtem. Platí:

(

je direktním doplněk podprostoru

v prostoru V a

je direktním doplňkem

v prostoru V). Direktním doplňkem podprostoru

v prostoru

je např. podprostor

.

V sestrojovaném homomorfismu g proto doplníme

Schéma definující homomorfismus g budeme nadále upravovat tak, abychom z něj zjistili na jaké vektory prostoru

se zobrazí vektory kanonické báze prostoru

První řádek přičteme k (-3)násobku druhého řádku, dále přičteme dvojnásobek třetího řádku k druhému řádku, čímž dostáváme:

Následně vynásobíme poslední řádek (-1) a přičteme jej k prvnímu řádku. Poté přičteme mínus dvojnásobek druhého řádku k pětinásobku prvního řádku. Nyní stačí pouze první řádek vydělit (15) a druhý řádek (5). Odtud víme, že:

Tedy homomorfismus g zobrazí vektor (a,b,c) na vektor:

Nyní se přesvědčíme, že platí rovnosti z definice o navzájem pseudoiverzních homomorfismech,

a

Prověření rovnosti provedeme „maticově“. Matice A bude maticí homomorfismus f a matice B bude maticí homomorfismu g.

24

Vidíme, že podmínka je splněna, a tedy homomorfismy f a g jsou navzájem pseudoinverzní. Věta 3.3. Nechť U, V jsou vektorové prostory nad tělesem T. Ke každému existuje homomorfismus

pseudoinverzní

homomorfismus

, že homomorfismu f a

homomorfismu ,

resp.

takový

jsou navzájem pseudoinverzní.

Důkaz: viz.

Definice 3.4. Nechť U, V jsou (reálné nebo komplexní) homomorfismy Řekneme, že dvojice

nechť jsou navzájem pseudoinverzní.

a

je Mooreova-Penroseova, jestliže je a

Kde

prostory se skalárním součinem,

.

je ortogonálním doplňkem ke

Ortogonální doplněk

obsahuje všechny vektory, které jsou kolmé ke každému

vektoru z prostoru V. Platí

(průnik je nulový), ortogonální doplněk je

tedy direktním doplňkem podprostoru V v prostoru

25

. Ortogonální

doplněk,

hledáme jako řešení homogenní soustavy

k prostoru

rovnic:

Pro výpočet Moore-Penroseovy dvojice homomorfismů použijeme příklad 3.2. Příklad 3.3. Pro homomorfismus f prostoru

do prostoru

, platí:

Najděte takový homomorfismus g, aby tvořil s homomorfismem f MooreovuPenroseovu dvojici navzájem pseudoinverzních homomorfismů. Nejprve spočteme jádro homomorfismu f :

Jádro budeme řešit pomocí matice:

V této matici vynásobíme první řádek (-1) a přičteme jej k druhému řádku ,v zápětí první řádek vynásobíme (-2) a přičteme jej k třetímu řádku. Tím nám vznikne matice, kde jsou druhý a třetí řádek lineárně závislé, proto jeden z nich vynecháme. Dostáváme matici:

Zvolíme parametr

, čímž získáme

a

. Dosazením za parametr

dostáváme jádro Dále vypočítáme

. Jak víme, musí platit

K podprostoru Ker f jsou kolmé všechny vektory (x,y,z), pro které je

26

, proto

Opět musíme volit parametry

Zvolením t, r spočteme,

a tedy

že

.

Tento podprostor se v homomorfismu f zobrazí izomorfně na podprostor Im f. Platí tedy

a Při výpočtu Im f je třeba vzít místo vektorů kanonické báze vektory, které generují doplněk jádra (v případě Mooreovy-Penroseovy dvojice musí být tento doplněk nejen direktní, ale dokonce ortogonální). V takto vytvořeném Im f víme, že obrazy generátorů ortogonálního doplňku jádra jsou generátory Im f a zobrazení f lze odpovídajícím způsobem obrátit a vytvořit pseudoinverzní g. Lze proto sestrojit homomorfismus g

který izomorfně zobrazí Im f na

, tj. bude k homomorfismu f na těchto

prostorech inverzním homomorfismem. K určení homomorfismu g zbývá stanovit, kam zobrazit vektory z ortogonálního doplňku Im f. Spočteme

a

volíme obraz (1,1,-1) v homomorfismu g tak, aby f, g byly navzájem pseudoinverzní, tj. V tomto zobrazení zaměníme první řádek za třetí.

Přičteme mínus trojnásobek prvního řádku k druhému řádku. Poté vynásobíme druhý řádek (2) a přičteme jej k třetímu řádku:

27

V dalším kroku přičteme osminásobek třetího řádku k osmnáctinásobku druhého řádku a třetí řádek přičteme k osmnáctinásobku prvního řádku. Následně pak přičteme druhý řádek k mínus jednonásobku prvního řádku:

Odtud

Dostali jsme tedy homomorfismus g takový, že

[1, str. 421] Věta 3.5. Nechť U, V jsou prostory se skalárním součinem konečných dimenzí. Ke každému homomorfismu že

existuje právě jeden homomorfismus

, takový,

je Mooreova-Penroseova dvojice navzájem pseudoinverzních homomorfismů.

Důkaz: viz. Nyní známe definici pseudoinverzního homomorfismu. Pseudoinverzní matice bude tedy maticí právě zavedeného pseudoinverzního homomorfismu. Pro matice můžeme definovat obdobné pojmy jako pro homomorfismy.

28

Kapitola 4

Pseudoinverzní matice Pseudoinverze

(nazývána

též

zobecněnou

inverzní)

se

používá

na

matice

obdélníkového typu nebo na matice čtvercové singulární (což jsou případy, kdy neexistuje klasická inverzní matice). Na pseudoinverzní matici se mužeme dívat, jako na matici pseudoinverzního homomorfismu, avšak v literatuře se spíše setkáváme s příklady řešenými Moore-Penrosoevou pseudoinverzní maticí, než–li s maticí pseudoinverzního homomorfismu.

Definice 4.1. Nechť

nad tělesm

je matice typu

pseudoinverzní matice k matici =

, pak se matice

a

. Matice

, jestliže

typu

se nazývá

Jestliže platí navíc rovnost

nazývají navzájem pseudoinverzní.

Vraťme se k příkladu 2.3., kde jsme se snažili najít matici „zobecněného inverzního homomorfismu“. My nyní již víme, jaké podmínky musí matice splňovat, aby byla pseudoinverzní maticí k dané matici. Příklad 4.1. Nalezněte pseudoinverzní matici k matici

V příkladu 2.3. jsme hledali matici

, takovou, že

. Zjistili jsme, že matice

závisí na parametrech: . Najděme tedy parametry a, d tak, aby matice a podle definice splňovala podmínku

byla pseudoinverzní maticí k matici .

29

.

Tímto tedy dostáváme:

Vidíme,že matice jsou pseudoinverzní pro libovolné parametry a , d. Příklad 4.2. Nalezněte takovou matici k matici

aby byly matice navzájem pseudoiverzní. V předchozím příkladě jsme si uvedli, že pro libovolné parametry a, d je matice A s maticí

pseudoinverzní. Ověřme, zda jsou při libovolných parametrech matice navzájem pseudoniverzní tedy, že platí

=

.

Ověřili jsme, že pro libovolné parametry a, d jsou matice

navzájem

pseudoinverzní. Pseudoinverzní

matice se nejčastěji objevuje jako tzv. Mooreova-Penroseova

matice pseudoinverze. Mooreovu-Penroseovu matici pseudoinverze by bylo možné zavést jako matici jistého homomorfismus, který tvoří s homomorfismem určeným

30

danou maticí Mooreovu-Penroseovu dvojici homomorfismů, proto se vrátíme k příkladu 3.3., kde jsme tuto dvojici počítali. Příklad 4.3. Nalezněte pseudoinverzní matici k dané matici jako matici jistého homomorfismu, který s homomorfismem daným maticí A tvoří Mooreovu-Penroseovu dvojici homomorfismů.

K tomuto homomorfismus f budeme hledat homomorfismus g, který s ním tvoří Mooreovu-Penroseovu dvojici homomorfismu, tento postup je uveden v příkladě 3.3. My lehce spočteme, že

, jelikož je jádro triviální, je

Tento podprostor se v homomorfismu f zobrazí izomorfně na podprostor Im f. Platí tedy

a V Im f víme, že obrazy generátorů ortogonálního doplňku jádra jsou generátory Im f a zobrazení f lze odpovídajícím způsobem obrátit a vytvořit pseudoinverzní g. Lze proto sestrojit homomorfismus g

který izomorfně zobrazí Im f na

, tj. bude k homomorfismu f na těchto

prostorech inverzním homomorfismem. K určení homomorfismu g zbývá stanovit, kam zobrazit

vektory

a volíme obraz

z ortogonálního

doplňku

Im

f.

Spočteme

v homomorfismu g tak, aby f, g byly navzájem pseudoinverzní,

tj.

31

Máme tedy homomorfismus g zadán:

První řádek zaměníme s třetím řádkem. Poté přičteme mínus dvojnásobek prvního řádku k druhému řádku a mínus jednonásobek prvního řádku k třetímu řádku. Následně přičteme druhý řádek k třetímu řádku

Dále přičteme sedminásobek třetího řádku k mínus jedenáctinásobku druhého řádku a trojnásobek třetího řádku přičteme k jedenáctinásobku prvního řádku. V další úpravě přičteme druhý řádek k prvnímu

Odtud

Dostali jsme tedy homomorfismus g takový, že

Matice homomorfismu g má tvar:

Již známe defininici matice pseudoinverzního homomorfismu. Pokud navíc matice homomorfismus A tvoří s pseudoinverzní maticí homomorfismu Penroseovu dvojici homomorfismů, můžeme o maticí A a

32

mluvit jak o

Mooreovu-

Mooreově-Penroseově dvojici navzájem pseudoinverzních matic. Z uvedených příkladů jsou vidět vlastnosti této dvojice matic.

Definice 4.2. (Moore - Penroseova inverze matice) Nechť A je matice typu

, X je matice typu

. Matice X se nazývá

Moore – Penroseova inverze (nebo též pseudoinverze) matice A, jestliže platí: (i)

AXA = A

(ii)

XAX = X

(iii)

= AX

(iv)

= XA

Podmínky (i) – (iv) se nazývají Penroseovy podmínky. Matice X se nazývá Moore – Penroseova inverze matice A (často se označuje pouze jako pseudoinverze matice A) . V definici Moore-Penroseovy inverze je uveden operátor

(vykřičník). Tento

operátor označuje maticovou operaci, která je definována:

, kde A je

libovolná matice, jejíž prvky

náleží do oboru komplexních čísel a

je

komplexně sdružená matice k matici A. Moore-Penroseovu matici zavedli, nezávisle na sobě, E. H. Moore v roce 1920, Arne Bjerhammar v roce 1951 a Roger Penrose v roce 1955. Dnes je Moore-Penroseova matice nejčastěji používanou pseudoinverzní maticí, ale není jedinou. Jako zobecněnou inverzní matici lze použít tzv. Drazinovu inverzi, grupovou inverzi nebo spektrální inverzi. Viz.

.

Věta 4.3. (věta o jednoznačnosti Moore – Penroseova inverze matice) Ke každé matici existuje právě jedna Mooreova-Penroseova pseudoinverzní matice. Důkaz: viz. Máme tedy pseudoinverzi matice A určenou jednoznačně, a proto pro ni zavedeme i označení. Většinou se tato pseudoinverze označuje symbolem 33

a toto značení

budeme používat i my v následujícím textu, tedy označení matice X bude nahrazeno označením

.

K výpočtům příkladů budeme používat program Matlab. Příklad 4.4. Nalezněte pseudoinverzní matici k matici

Pro výpočet pseudoiverzní matice se pomůžeme programem Matlab, konkrétně příkazem >> pinv(A), čímž dostáváme matici

Zkusme porovnat tento výsledek s výsledkem „klasické“ (čtvercové) inverze.

Elementárními úpravami dostáváme

Příklad 4.5. Pomocí pseudoiverzní matice nalezněte řešení soustavy

. 34

Známe rozšířenou matici soustavy,

i , Nyní pomocí příkazu v programu Matlab: >> X=pinv(A)*B dostáváme řešení zadané soustavy:

Pokud se vrátíme zpět k příkladu 1.1., uvidíme, že naše nalezené řešení se shoduje s řešením soustavy, které jsme spočetli jinými způsoby. Ukázali jsme si, že v případě čtvercové matice se pseudoinverzní matice rovná matici inverzní, právě proto se pseudoinverzní matice používá nejvíce u matic, které jsou jiného typu než čtvercového. Díky tomu, můžeme nalézt nejlepší přibližné řešení soustav, které dle Frobeniovy věty nemají řešení.

Věta 4.4. Nejlepším řešením maticové rovnice

je

.

Důkaz: viz.

Pro

platí, že je nejlepším přibližným řešením rovnice

funkce), jestliže pro každé X příslušného typu platí buď to 35

(kde f je nějaká

nebo a současně kde

je maticová norma a se nazývá nejlepší přibližné řešení systému

. Pokud má systém

řešení je toto řešení rovno A právě řešení

budeme hledat v následujícím příkladu.

Nyní se vrátíme k příkladu 1.3., který dle Frobeniovy věty neměl řešení. Na tento příklad budeme aplikovat řešení pomocí pseudoinverzní matice pomocí programu Matlab. Příklad 4.6. Pomocí pseudoinverzní matice nalezněte řešení soustavy:

Víme, jak vypadá rozšířená matice soustavy:

Lehce tedy zjistíme, že:

Nyní pomocí příkazu v programu Matlab: >> X=pinv(A)*B dostáváme

nejlepší přibližné řešení zadané soustavy:

36

Podívejme se na to, jak bude vypadat řešení rovnic pomocí pseudoinverzní matice za předpokladu, že soustava má řešení. Zkusme aplikovat řešení soustav lineárních rovnic pomocí pseudoinverzní matice na soustavy, které mají nekonečně mnoho řešení. Opět se vrátíme k příkladu z první kapitoly, konkrétně k příkladu 1.2. Příklad 4.7. Řešme soustavu rovnic nad

Známe rozšířenou matici soustavy

i

Opět budeme hledat řešení

pomocí programu Matlab.

>> X=pinv(A)*B

V tomto případě dostáváme pouze jedno z řešení této soustavy. Kdybychom nezjišťovali zda jsou jednotlivé rovnice této soustavy lineárně závislé, nemuseli bychom vůbec dojít k závěru, že soustava má nekonečně mnoho řešení. Tedy při řešení

37

soustavy lineárních rovnic, která má nekonečně mnoho řešení, pomocí pseudoiverzní matice dostáváme pouze jedno řešení.

38

Kapitola 5

Příklady K řešení dalšího příkladu budeme používat program Matlab. Příklad 5.1. Matlabem si necháme vygenerovat náhodnou matici A a náhodnou matici B, určíme pouze jejich velikost:

>> A=round(10*rand(5,4)) >> B=round(10*rand(5,1))

Příkazem >> rank(A), v Matlabu zjistíme

. Tedy dle Frobeniovy věty nemá

a

soustava řešení, proto pro nalezení nejlepšího přibližného řešení využijeme rovnosti . Výpočet této rovnosti lze v matlabu provést jedním příkazem:

>> X=pinv(A)*B

Tímto jsme nalezli řešení náhodně vygenerované soustavy lineárních rovnic pomocí programu Matlab. V Matlabu si opět náhodně vygenerujeme soustavu. Tentokrát bude matice soustavy větší a my budeme rovnou aplikovat výpočet pseudoinverzní matice.

39

Příklad 5.2. Mějme náhodně vygenerované matice A a B.

>> A=round(10*rand(5,10)) >> B=round(10*rand(5,1)) A = 9

9

0

3

5

3

4

7

8

2

2

1

3

5

8

6

8

3

1

10

9

5

4

1

8

1

8

5

1

10

3

4

4

9

4

5

7

1

8

5

3

6

5

1

10

4

9

7

6

0

B = 3 5 6 3 7

>> % Tentokrát se nebudeme přesvědčovat o řešitelnosti. >> % Řešením bude vypočteno rovnou pomocí pseudoinverzní matice. >> X=pinv(A)*B X = -0.0041329 0.0332448 0.2228459 -0.1085067 0.2791803 -0.0030616 0.2670804 0.1118853 -0.0265450 0.0188190

V tomto případě je soustava řešitelná, proto jsme nenalezli její nejlepší přibližné řešení, ale řešení této soustavy. K tomu výsledku bychom došli, i pokud bychom počítali soustavu jinou metodou, než-li metodou pseudoinverzních matic.

40

V následující příkladu budeme porovnávat řešení soustavy lineárních rovnic pomocí Gaussovy eliminační metody a řešení soustavy lineárních rovnic pomocí metody pseudoinverzních matic. Připomeňme si, že Gaussova eliminační metoda řeší problém zadaný maticí tak, že danou matici upraví na trojúhelníkovou matici nebo na „odstupňovanou matici“ (každou matici lze řádkovými úpravami převést na odstupňovanou matici, která je s ní ekvivalentní, tj. má stejnou hodnost). Příklad 5.3. Najděte řešení soustavy

Ze zadání víme, že:

a) Gaussova eliminační metoda Při Gaussově eliminační metodě budeme upravovat matici do trojúhelníkového tvaru. Nejprve přičteme první řádek k mínus dvojnásobku druhého řádku, trojnásobek prvního řádku k mínus dvojnásobku třetího řádku a

mínus dvojnásobek prvního řádku k

čtvrtému řádku. V dalším kroku vynásobíme druhý řádek (-7) a přičteme jej k třetímu řádku a následně druhý řádek vynásobíme (-1) a přičteme k čtvrtému řádku. Dostáváme matici:

Dále v této matici vydělíme třetí řádkem (-2). Následně vynásobíme třetí řádek přičteme jej k čtvrtému řádku. Čímž dostaneme trojúhelníkovou matici: 41

a

Z této matice vidíme, že

. Dále spočteme:

Výsledkem této soustavy je

b) Řešení pomocí pseudoinverzní matice. Víme, jak vypadá matice soustavy A, i jak vypadá matice B. můžeme tedy využít vztah Výpočet tohoto vztahu budeme provádět pomocí programu Matlab, přes příkaz: >> X=pinv(A)*B. Dostáváme tedy řešení:

Vidíme tedy, že řešení přes pseudoinverzní matice je rovno řešení pomocí Gaussovy eliminační metody, tedy za předpokladu, že soustava má řešení.

42

Závěr Tato práce měla za úkol řešit soustavy lineárních rovnic pomocí pseudoinverzní matice. Byl zaveden teoretický základ pro řešitelnost soustav lineárních rovnic. Dále jsme uvedli, že na matici soustavy se můžeme dívat jako na matici homomorfismus. Proto byly připomenuty základní pojmy z této oblasti. Jelikož v úvodu uvedli, že na pseudoinverzní matici lze pohlížet jako na matici pseudoiverzního homomorfismu, byla tato práce takto směřována. Zmínili jsme, že pseudoinverzní

matice

se

nejčastěji

objevuje

jako

Mooreova-Penroseova

pseudoinverze. Za použití

programu Matlab jsme srovnávali metodu pseudoiverzních matic

s Gaussovou eliminační metodou. Ze získaných výsledků bylo zjištěno, že tyto dvě metody určují stejný výsledek, má-li soustava lineárních rovnic řešení. Pokud soustava nemá dle Frobeniovy věty řešení, nabízí nám metoda pseudoinverzních matic nejlepší přibližné řešení soustavy.

43

Seznam použité literatury a zdrojů: Bečvář, Jindřich, Lineární algebra, Praha: Matfyzpress, 2010 Fojt, Michal, Bakalářská práce: Moore – Penroseova inverze matice, Brno,2006 Havel, V., Holenda, J., Lineární algebra, Praha: SNTL, 1984 Tesková,Libuše, Lineární algebra, Plzeň: Západočeská univerzita v Plzni, 2005 Pokorná, Olga, Pseudoinverzní matice, Praha: Státní pedagogické nakladatelství, 1978 Bican, Ladislav, Lineární algebra a geometrie, Praha: Academia, 2009 Ježek, Jaroslav, Univerzální algebra a teorie modelů, Praha: SNTL,1976 Bican, Ladislav, Lineární algebra, Praha: SNTL, 1979 Tlustý, Pavel, Lineární algebra a její aplikace, České Budějovice: Jihočeská univerzita,2003 Míka, Stanislav, Numerické metody algebry, Praha: SNTL, 1985 Výborný, K., Zahradník, M., Používáme lineární algebru – Sbírka řešených příkladů, Praha: Karolinum, 2004 Greville, T. N. E., The Pseudoinverse of a Rectangular or Singular Matrix and its Application to the Solution of Systems of Linear Equations , SIAM Review, 1959 http://en.wikipedia.org/wiki/Moore–Penrose_pseudoinverse http://home.pf.jcu.cz/~hasek/LAG/Pr5/Pr_5_Homomorfismus.pdf http://www.studopory.vsb.cz/studijnimaterialy/MatematikaI/12_MI_KAP%202_5. pdf http://www.karlin.mff.cuni.cz/~vald/Cviceni_11.pdf

44

Název práce: Řešení soustav lineárních rovnic užitím pseudoinverzních matic Autor: Martina Stehlíková Katedra matematiky, fyziky a technické výchovy, Fakulta pedagogická, Západočeská univerzita Vedoucí práce: Mgr. Martina Kašparová, Ph.D. Abstrakt: Tato práce se zabývá řešení soustav lineárních rovnic pomocí metody pseudoinverzních matic. Určování řešitelnosti soustavy lineárních rovnic je zavedeno pomocí

Frobeniovy

věty.

Pseudoinverzní

matice

je

zadaná

jako

matice

pseudoinverzního homomorfismus. Pomocí pseudoinverzní matice je hledáno řešení soustav, které mají právě jedno řešení, mají nekonečně mnoho řešení a které jsou dle Frobeniovy věty neřešitelné. Vše je doplněno o vzorové příklady. Klíčová slova: Soustavy lineárních rovnic, matice soustavy lineárních rovnic, Frobeniova

věta,

homomorfismus,

matice

homomorfismu,

pseudoinverzní

homomorfismus, matice pseudoinverzního homomorfismu, Mooreova-Penroseova matice pseudoinverze.

Title: Solving systems of linear equations using matrix pseudoinverse Author: Martina Stehlíková Department of Mathematics, Physics and Technical Education, Faculty of Education, University of West Bohemia Supervisor: Mgr. Martina Kašparová, Ph.D. Abstract: This work deals with solving systems of linear equations using the pseudoinverse matrix. Determining the solvability of systems of linear equations is introduced by Frobenius theorem. Pseudoinverse matrix is given as a matrix pseudoinverzního homomorphism. Using the pseudoinverse matrix is sought for solving systems that have just one solution, have infinitely many solutions which are, according to Frobenius theorem insoluble. Everything is accompanied by illustrative examples. Keywords: Systems of linear equations, matrix systems of linear equations, Frobenius theorem, homomorphism, homomorphism matrices, pseudoinverse homomorphism, homomorphism pseudoinverse matrix, Moore-Penrose pseudoinverse matrix.

45

ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC UŽITÍM PSEUDOINVERZNÍCH MATIC

Recommend Documents