Maticová kombinatorika a algebra

Milan Kunz

 

Předmluva

S překvapením jsem zjistil, že o mé vědecké fejetony, které původně vycházely v internetovém časopise Natura, je v Palmknihách poměrně slušný zájem.

Proto jsem oprášil serii statí o kombinatorice a lineární algebře, které také vycházely v Natuře. Byly původně míněny jako český komentář ke knize Matrix Combinatorix and Algebra, která tam byla prezentována ve formátech ESO a TEX. ESO byl DOSovský český editor, který měl umožňovat matematickou sazbu. Formát TEX je určen pro matematiku. Ve formátu TEX je Matrix Combinatorix and Algebra dostupná na mé stránce mujweb.cz/veda/kunzmilan , případně ji mohu poskytnout ve formátu dvi či pdf.

Domnívám se, že i bez vzorců může být Maticová kombinatorika a algebra užitečná pro mnoho čtenářů.

Omlouvám se za některá opakování určitých informací v různých kapitolách.

Čtenáře musím předem varovat, k sepsání této knihy nemám žádné úřední oprávnění, bývalý předseda Akademie věd dokonce zpochybnil moje názory na určité problémy. Opírám se však o originální výsledky, které byly zveřejněny ve vědeckých časopisech a prošly důkladnou recenzí.

 

Obsah

1. Trochu nematematický úvod

2. Hilbertův prostor 9

3. Partitio numerorum 12

4. Grupy symetrie 20

5. Hrátky s Pascalovými trojúhelníky 24

6. Kniha Přírody 32

7. Hrátky s kostkami 37

8. Teorie grafů 43

9. Enumerace grafů 48

10. Vlastní hodnoty a vlastní vektory matic 52

11. Inverzní matice 62

12. Matice vzdáleností 71

13. Zenonovy grafy 76

14. Diferenciální rovnice 81

15. Entropie 86

16. Výpočet binárního logaritmu a entropie informace 101

 

1. Trochu nematematický úvod

Čtete scifi časopis a v těch se to jenom hemží samými hyperprostory čtvrté a vyšší dimenze, singularitami, v nichž zmizí hladce celé vesmírné koráby včetně osádky a palubních koček, a mnoha dalšími termíny, které jste ve škole vůbec neslyšeli a pokud jste je slyšeli, tak jste jim nerozuměli, a když se vám zdálo, že jste jim porozuměli, tak jste si je nedovedli představit. Jasný obraz o nich nemají ani sami matematici, kteří si je vymysleli. Když se pokusíte namalovat třeba jen čtyřrozměrnou krychli, pak vypadá, jako kdyby jste se dívali na obyčejnou trojrozměrnou krychli opilí. Uvidíte všechno rozmazaně dvakrát a mimo normálních čar ještě další hrany a plochy takže, dá dost přemýšlení, abyste se v té změti čar vyznali.

Existuje však ještě jiný způsob, jak do vyšších prostorů proniknout. Předem si však musíme připravit žebřík, který nám to umožní. Tím žebříkem budou definice termínů: plocha a těleso. Oba termíny jsou zaměnitelné vzhledem k následující definic

Definice zní: n rozměrné těleso je plocha v (n + 1) rozměrném prostoru.

Začneme bodem, což je bezrozměrné těleso. Tím míníme, že bod je těleso v prostoru o rozměru nula. Tento prostor jsem si tak trochu vymyslel, ale prostě jsem jej potřeboval jako úplný počátek

Toto těleso, tedy tento bod, by měl být podle definice plochou v jednorozměrném prostoru.

Co však je jednorozměrné těleso? To si můžeme nejjednodušeji představit jako přímku (kdybychom toto přímé těleso zakřivili, tak bychom si všechny úvahy hned od počátku zkomplikovali).

Bod dělí jednorozměrné těleso na dvě části. Když si bod představíme jako řez, tak rozdělí bod přímku na dvě části. Dva různé body přímku omezí. Tím nám vznikne omezené jednorozměrné těleso.

Dvojrozměrné těleso je plocha v trojrozměrném prostoru. Opět si budeme tuto plochu nejjednodušeji představovat jako rovinu. Přímka je v dvojrozměrném prostoru jenom plochou a dělí dvojrozměrné těleso na dvě části. Tři přímky omezují dvojrozměrné těleso, vytvoří se trojúhelník.

Tady jsme dospěli k prvému závěru: Plochu v n-rozměrném prostoru omezuje (n + 1) hran.

Dvojrozměrné těleso je plocha v trojrozměrném prostoru a dělí tento prostor na dvě části. Abychom vymezili trojrozměrné těleso, potřebujeme o jednu o jednu plochu více než má těleso rozměrů, tedy čtyři. Čtyři trojúhelníky vytvoří čtyřstěn, což je trojrozměrné těleso s nejmeším počtem hran (pokud neuvažujeme o kouli a jiných sférických tělesech).

Zatím je vše docela jednoduché, ale teď nás indukce vede k závěru že trojrozměrné těleso by mělo být plochou v čtyřrozměrném prostoru!

Ten vykřičník by v odborném textu neměl vyskytovat, ale tvrzení je překvapující. Je třeba jej dokázat.

Označíme vrcholy pravidelného čtyřstěnu koordinátami

(4, 0, 0, 0)

(0, 4, 0, 0)

(0, 0, 4, 0)

(0, 0, 0, 4).

Pak už snadno budeme hledat body (3, 1, 0, 0), ten leží na jedné ze šesti dvojrozměrných hran. Bod (2, 1, 1, 0) leží uvnitř čtyřstěnu asi v polovině jeho výšky a bod (1, 1, 1, 1) leží ve středu čtyřstěnu. Všimněte si, že součet koordinát je vždy čtyři. I kdybychom hledali body s neceločíselnými koordinátami, bude jejich součet opět vždy čtyři. Zavedli jsme také čtyři čísla určující polohy bodů, a vidíme tedy plochu z čtyřrozměrného prostoru.

Jestli mému tvrzení nevěříte, pokuste se nalézt bod s koordinátami (0, 0, 0, 0). Měl by být ve stejné vzdálenosti od všech vrcholů čtyřstěnu. Takový bod uvnitř čtyřstěnu sice existuje, ale má koordináty (1, 1, 1, 1). Bod (0, 0, 0, 0) musí existovat mimo čtyřstěn a my jej prostě v našich třech rozměrech nevidíme, leda bychom do hry zapojili čas a čtyřstěn odsunuli z jeho původního místa.

Než postoupíme dále, měli bychom si všimnout, co se stane, když čtyřstěn sklopíme do dvojrozměrného prostoru, tedy když jej promítneme na rovinu. Buď jej můžeme stlačit a pak se zkrátí tři hrany a deformují se tři stěny.

Nebo se dvě hrany prodlouží a čtyřstěn uvidíme jako čtverec s oběma úhlopříčkami. Takový čtverec je znám jako úplný graf K4, trojúhelník je úplný graf K3. Při sklopení čtyřstěnu do dvojrozměrného prostoru se nám jeho stěny překryly, buď v poměru 3:1 (3 trojúhelníky a trojúhelníková základna) nebo v poměru 2:2 (vždy dva pravoúhlé trojúhelníky nad oběma úhlopříčkami).

Podobný úkaz se projeví, když se pokusíme nahlédnout do pátého rozměru. Použijeme konstrukci vyššího rozměru, která nám přikazuje najít bod ležící mimo daný prostor a spustit z něj spojnice k základnímu prostoru.

Začneme čtyřstěnem rovnoměrně stlačeným na trojúhelník. Z bodu ležícího mimo rovinu spustíme spojnice k jeho všem čtyřem vrcholům. Čtyřstěn vytvoří jednu stěnu nového tělesa. Čtyřrozměrné těleso bude mít tvar trojboké pyramidy. Bude to opět čtyřstěn, který může být pravidelný. Bude nám překrývat další tři čtyřstěny, které objevíme uvnitř tohoto čtyřstěnu kolem přímky spuštěné na prostřední vrchol základního čtyřstěnu.

V případě čtyřstěnu deformovaného na čtverec, vznikne čtyřboká pyramida. Základ pyramidy tvoří jednu stěnu čtyřrozměrného tělesa, další čtyři objevíme po dvojicích nad oběma úhlopříčkami čtverce.

Konečně můžeme spustit spojnice k čtyřem vrcholům nedeformovaného čtyřstěnu. Dostaneme šestistěn, trojstrannou bipyramidu. Dva čtyřstěny k sobě přilehnou jednou dvojrozměrnou stěnou. V tomto případě leží uvnitř tělesa jen jedna přímková spojnice vrcholů. Ta tvoří společnou dvojrozměrnou hranu zbývajících tří čtyřstěnů

Ve všech třech případech vidíme jen stěny tělesa. Ty nám překrývají vnitřek tělesa.

Posledně ukázané čtyřrozměrné těleso doslova sevřete do obou dlaní. Aby jste jej mohli lépe prostudovat, připravte si tužku a list tužšího papíru.

Postavte ruku na rovnou plochu stolu tak, aby se desky dotýkaly palec, ukazováček a prostředníček, které by měly vytvořit vrcholy trojúhelníku. Jeho hrany si musíte jen představit, pokud to nedovedete, tak si je nakreslete na papír. A teď si všimněte, že vaše tři prsty tvoří, vždy po dvou, hrany dalších tří trojúhelníků. Ke třem bodům tvořenými konečky prstů si představte čtvrtý někde v dlani mezi prsty. Prostor mezi deskou a vaší dlaní je dost nepravidelný čtyřstěn. Jestli se vám nelíbí, můžete si udělat lepší ze špejlí.

Teď se na ten prázdný prostor mezi svými prsty znovu podívejte. S trochou fantazie vidíte čtyřrozměrnou rovinu, i když trochu hrbolatou.

Sepněte obě dlaně, aby se opět dotýkaly jen tři prsty. Spolu s pomyslnými dvěma body v dlaních máte pět vrcholů, které se obyčejným smrtelníkům, odsouzeným žít v trojrozměrném prostoru jeví jako trojstranný dvojitý jehlan omezený 6 trojúhelníky. My se však přesvědčíme, že je to pětirozměrná plocha, tedy čtyřrozměrné těleso. Napřed vezměte mezi prsty list papíru a snadno uvidíte dva čtyřstěny, spojené jednou dvojrozměrnou stěnou představovanou listem papíru. Jsou tvořené oběma dlaněmi. Pak stiskněte mezi dlaně tužku, aby se její konce opíraly o pomyslné vrcholy čtyřstěnů. Teď to chce trochu představivosti, uvědomit si, že tužka je společná hrana tří čtyřstěnů, jejichž další čtyři hrany tvoří vždy dvojice spojených prstů a šestou hranou je pomyslná spojnice špiček prstů.

Abyste si ty imaginární hrany lépe představili, propíchněte papír uprostřed tužkou a sevřete jej znovu mezi prsty. Teď tu máte pohromadě pět čtyřstěnů, dva oddělené papírem a tři tužkou.Jenom je nemůžete vidět najednou, protože na to v našem prostoru nemáme dost místa. Musíte si je představovat střídavě, protože se vám v dlaních překrývají. Ale to střídavé představování si jednotlivých ploch čtyřrozměrného tělesa, které se děje v čase, nám doplňuje tři geometrické rozměry čtvrtým. Ten má však docela jiné vlastnosti než 3 geometrické rozměry. Naše tělo v něm existuje jako ohnisko unášené jeho proudem, ale naše mysl se v něm může pohybovat docela snadno a vnikat do libovolné dimenze.

Ostatně, ani ostatní osy našeho trojrozměrného prostoru nejsou vzájemně zcela rovnocenné. Jen to zkuste, běžet do strany nebo pozpátku. Stoupat po žebříku je mnohem namáhavější než chůze po rovině.

Jestli se vám chce, můžete pokračovat ve studiu vícerozměrných těles stejným způsobem do omrzení. Tužku a papír máte po ruce, nakreslete si 6 bodů, spojte všechny body hranami a najděte všech 6 čtyřrozměrných ploch, které vymezují pětirozměrné těleso.

V teorii grafů jsou vícerozměrná tělesa známá jako úplné grafy (viz kapitolu Grafy).

Teorie grafů se obvykle obejde bez určení rozměru grafu. Zabývá se však možností kreslit grafy, aniž by se jejich dvojrozměrné hrany protínaly. Úplný graf K5 je jedním ze dvou základních nerovinných grafů.

Vícerozměrná tělesa se promítnou do našeho prostoru vždy deformovaně. Jednou z možností je, aby se střídavě objevovaly různé aspekty tělesa. Pokud by mikročástice byly vícerozměrná tělesa, potom by měla v trojrozměrném prostoru kmitat, aby si udržela svůj tvar. Nebo úvahu můžeme obrátit: když se nám něco jeví jako vlna, potom se může jednat o vícerozměrný objekt, který se snaží promítnout do našeho prostoru. Něco podobného předpokládá i teorie strun.

Chtělo by se poznamenat: “It is elementary, dear Watson.”

V matematice se pro vícerozměrné prostory používají předpony hyper- nebo nad-, tedy třeba nadrovina. Jiné termíny používané pro vztah plochy a tělesa jsou simplex a komplex.

Nakonec si uděláme přehled:

Pokud máte ve zvyku sepnout k meditaci všechny prsty, tak si občas uvědomte co vše vlastně máte v těch chvílích ve svých dlaních. Jestli se vám dostane osvícení jako zasvěcencům zen budhismu, pak se vám snad podaří nahlédnout dovnitř prostoru, který se jen zdá být prázdný.

V následujících kapitolách se budeme zabývat vlastnostmi prostoru podrobněji.

 

 

2. Hilbertův prostor

V úvodu jsme se zabývali vícerozměrnými prostory a potížemi, když se snažíme představit si vícerozměrná tělesa či plochy. Pokud se je pokusíme vměstnat do našeho trojrozměrného prostoru, musíme je deformovat.

Tento nedostatek nemusí vůbec znamenat, že by naše smysly byly nerozvinuté a že jednou se nám rozvinou nějaké nové orgány pro tyto rozměry, nebo že se vyvine nějaký enhled (jako dalekohled nebo drobnohled), který umožní pohled do n-rozměrných prostorů mikrokosmu nebo makrokosmu.

S mnohorozměrným Euklidovým prostorem je isomorfní (shodný) prostor s daleko měkčí podmínkou pro vztahy mezi jednotlivými vektory. Všechny vektory nemusí být vzájemně kolmé, zcela postačuje, aby každý vektor byl kolmý k součtu všech ostatních vektorů. Tak se nám každý vícerozměrný vektor vejde dokonce na dvojrozměrnou plochu. Tento prostor se v učebnicích označuje jako Hilbertův prostor.

Vektor je na rozdíl od čísla charakterizován dvěma údaji, svou velikostí a směrem. Pokud si určíme jednotku délky vektoru (příklad 1 metr, 1 milimetr, 1 palec, 1 litr, 1 kilogram), pak velikost vektoru je číslo, kterým musíme jednotkovou délku násobit. Nu a směr vektoru je prostě směr úsečky, která vektor představuje.

Vektory sečítáme tak, že ke konci prvého vektoru (obvykle se konec označuje šipkou udávající současně směr vektoru) přiložíme počátek druhého vektoru, ke konci druhého vektoru přiložíme počátek třetího vektoru a tak dále.

Pokud si představíme číselnou osu (pravítko) potom i obyčejné sečítání čísel je vlastně vektorovým sečítáním, v tomto případě vektorů stejného směru a odčítání je sečítání vektorů opačného směru.

V Hilbertově prostoru potřebujeme k sečítání čísel pravoúhlý trojúhelník. Vezměte si jej k ruce a zkuste sečíst dvě odvěsny (strany trojúhelníku svírající pravý uhel) jednotkové délky. Přepona se shoduje s úhlopříčkou jednotkového čtverce a její délka je druhá odmocnina ze dvou. Přiložte trojúhelník k přeponě a vztyčte na jednom jejím konci další odvěsnu jednotkové délky. Tato přepona má délku druhé odmocniny ze 3, což je délka úhlopříčky krychle. Úhel mezi prvými dvěma odvěsnami a třetí odvěsnou není pravý. Ovšem pokyn doslova zněl “vztyčte na jednom jejím konci další odvěsnu jednotkové délky”! To jste si měli tu krychli představit a vést třetí odvěsnu kolmo k rovině prvých dvou.

Nyní tento výsledný vektor opět otočíte do roviny a získáte místo pro čtvrtý vektor kolmý k součtu prvých tří vektorů. Je zřejmé, že s Pythagorovými trojúhelníky lze pokračovat do nekonečna a že délka výsledné odvěsny bude vždy druhou odmocninou součtu čtverců všech vektorů. V řadě případů lze operovat přímo se součtem čtverců.

Zmínili jsme nekonečno. Toto číslo je důležité. Pokud to nebude nekonečno, mělo by to být hodně velké číslo, asi takové, jako je Avogadrovo číslo (počty molekul). Pokud máme tolik trojrozměrných vektorů různého směru, pak si můžeme být skoro jisti, že mezi nimi najdeme dva na sebe kolmé. Ani třetí vektor kolmý k rovině prvých dvou, čtvrtý vektor kolmý k rovině prvých tří atd..

Jestli si myslíte, že je to sice hezké, ale že Hilbertův prostor v denním životě k ničemu nepotřebujete, tak si ukážeme něco jiného.

V každém bodu kružnice opsané kolem průměru lze vytvořit pravoúhlý trojúhelník, v němž průměr je přeponou. Mezi všemi páry odvěsen určitě existuje zvláštní dvojice, která má tyto vlastnosti:

Pokud čtverec přepony je součtem čtverců n čísel, potom čtverec jedné z odvěsen má plochu nm2 a čtverec druhé odvěsny je součet rozdílu čtverců. Tomu tučnému m (bývá označeno většinou jinak, často jako m s čárou nad písmenem) se říká aritmetický průměr a najde se sečtením všech velikostí vektorů a podělením jejich počtem n.

Druhá odvěsna dá aritmetický průměr m násobený druhou odmocninou čísla n. O tomto číslu jsme si řekli, že je to délka úhlopříčky n-rozměrné krychle. Abychom mohli porovnávat délku druhé odvěsny s aritmetickým průměrem, musíme také tuto délku normalizovat na jednotkovou délku dělením číslem n, respektive po odmocnění druhou odmocninou čísla n. Tento výraz je znám jako rozptyl.

Tak jsme se dostali k výpočtům, které jako prvý provedl Gauss dávno před Hilbertem, když hledal nejlepší způsob, jak vyhodnotit trigonometrická měření. Položil tak základ teorie pravděpodobnosti, která si s geometrickými vztahy mezi svými daty starosti obvykle nedělá.

Teď ponechejme stranou matematiku a ponořme se do Hilbertova prostoru neviditelných částic vzduchu, které nás obklopují. Součet rychlostí jednotlivých molekul plynu se rozpadá na dvě složky, které můžeme přímo vnímat bez jakýchkoliv výpočtů a přístrojů. Aritmetický průměr rychlostí molekul vzduchu vnímáme jako vítr, jeho sílu danou rychlostí, a veličinu odpovídající rozptylu rychlostí molekul pociťujeme jako teplotu vzduchu.

 

12. Partitio numerorum

Na zasedání AMS (American Mathematical Society) řekl slavný fysik, nositel Nobelovy ceny, Steve Weinberg toto:

“V roce 1970, v počátcích teorie strun, jsme spolu s Kersonem Huangem pustili do řešení problému, jak určit počet stavů, které se objeví v kmitající struně při dané hmotě. ke je důležitý problém v termodynamice, chcete-li např. znát hustotu energie prázdného prostoru se strunovými fluktuacemi. Zjistili jsme, že počet stavů je ve velmi úzké souvislosti s počtem způsobů, kterými lze celé číslo napsat jako součet celých čísel. Např. 2 lze napsat jedním způsobem jako 1 + 1. 3 lze napsat dvěma způsoby, jako 1 + 1 + 1 nebo 2 + 1 atd. (Weinberg vynechal samotná čísla, která jsou též rozklady čísla). Tento počet se nazývá partitio numerorum a my jsme potřebovali znát, jak vypadá pro velmi velká čísla, což odpovídá velkým hmotám. Problém partitio numerorum byl vyřešen v roce 1918 G. H. Hardym a jeho kolegou Ramanujanem a mne udělalo velkou radost je citovat, neboť Hardy byl znám jako matematik, který byl pyšný na to, že jeho práce nebudou mít nikdy fyzikální aplikace (1).”

Steve Weinberg se mýlil, když se považoval za pionýra použití partitia numerorum ve fyzice a protože jej nikdo z fyziků přítomných na přednášce neopravil, tak jeho chyba svědčí o tom, že prvé použití partitio numerorum ve fyzice bylo dokonale zapomenuto. Došlo k němu dokonce před rokem 1918 a tak o tom nevěděl ani Hardy, protože ke by měl odmítnout se problémem zabývat, když genius Ramanujan přišel s tvrzením, že existuje analytická rovnice pro výpočet tohoto čísla (Hardy Ramanujana především kontroloval a učil jej matematickou techniku).

K zavedení partitio numerorum došlo dokonce před rokem 1905, kdy Planck rozluštil problém světelného záření černého tělesa pomocí kvantové teorie. Primát zavedení kvantové hypotézy má jiný fyzik Ludvík Boltzmann a ke už v roce 1870 (2). Ve snaze dokázat svou rovnici pro termodynamickou entropii, uvedl příklad rozdělení 7 kvant energie mezi 7 částic. Existuje 15 možných rozdělení, které napíšeme jako vektory s klesajícími čísly:

(7, 0, 0, 0, 0, 0, 0)

(6, 1, 0, 0, 0, 0, 0)

(5, 2, 0, 0, 0, 0, 0)

(4, 3, 0, 0, 0, 0, 0)

(5, 1, 1, 0, 0, 0, 0)

(4, 2, 1, 0, 0, 0, 0)

(3, 3, 1, 0, 0, 0, 0)

(3, 3, 1, 0, 0, 0, 0)

(4, 1, 1, 1, 0, 0, 0)

(3, 2, 1, 1, 0, 0, 0)

(2, 2, 2, 1, 0, 0, 0)

(3, 1, 1, 1, 1, 0, 0)

(2, 2, 1, 1, 1, 0, 0)

(2, 1, 1, 1, 1, 1, 0)

(1, 1, 1, 1, 1, 1, 1).

Boltzmann říkal těmto rozdělením komplexiony. Toto slovo se neujalo a proto budeme mluvit o orbitách. Každá orbita odpovídá jednomu rozdělení čísel. Orbity

mají ve fázovém prostoru sférický tvar. Poloměr orbity je určen Euklidovou délkou vektoru. Objem orbity však na této délce nezávisí, protože je určen všemi možnými permutacemi vektorů (u prvé orbity je jich 7, u poslední jen 1). Tyto permutace odpovídají symetrii orbity. Jejich počet se určí poměrně snadno pomocí Newtonova polynomického koeficientu (o tom až později).

O správnosti uvedených tvrzení se můžeme přesvědčit na rovnostranném trojúhelníku nebo pravidelném čtyřstěnu, se kterým jsme si hráli v Úvodu.

Částice termodynamické soustavy si vyměňují energii při vzájemných srážkách. Výměna energie může být symetrická, třeba když částice A má před srážkou energii 4 a částice B má před srážkou energii 3 a po srážce má částice A energii 3 a částice B energii 4, nebo asymetrická, třeba když částice A má před srážkou energii 4 a částice B má před srážkou energii 3 a po srážce má částice A energii 5 a částice B energii 2. Taková srážka změní stav soustavy, a soustava se ocitne na jiné orbitě. Příští srážka může soustavu vrátit na původní orbitu, nebo ji poslat na další orbitu. V termodynamických soustavách je velmi mnoho molekul, ke srážkám dochází téměř současně, takže řada simultánních srážek může termodynamickou soustavu udržovat v prakticky stejném stavu. Boltzmann předpokládal, že termodynamická soustava bude nejdéle na orbitě s největším objemem (nikoliv nejdelší, tam bude prakticky jen na počátku). Pokud bychom uvažovali o celém vesmíru, pak se stavu, kdy jediná částice soustředí celou energii soustavy říká “big bang”).

Logaritmickou míru objemu jednotlivých orbit Boltzmann považoval za ekvivalentní s termodynamickou entropii. K tomuto problému se vrátíme v poslední kapitole.

Je pravda, že Boltzmanna nezajímal počet možných stavů termodynamických soustav, takže partitio numerorum přímo nepotřeboval, také nemluvil o symetrii, jen o pravděpodobnosti, ale nesporně se problémem zabýval a je nespravedlivé, že se na ke zapomnělo. K jeho rovnici se vrátíme jindy.

Partitio numerorum zasluhuje pozornost samo o sobě.

Rovnice Ramanujan - Hardyho, je velmi složitá. Existují však jednoduché rekurzivní vzorce, jejichž původcem je Euler, který se tímto problémem soustavně zabýval.

Ve svém přístupu proti všeobecně přijatým konvencím se jako části rozkladu připouštím nuly (a dokonce záporná celá čísla). ke vychází z Boltzmannova příkladu a vede k některým zajímavým vztahům. Boltzmannův příklad jsem rozvinul do dvojrozměrných tabulek, které ukazují vztahy orbit v mnohorozměrných prostorech. Tyto tabulky jsou velmi užitečné při výpočtech téměř všech kombinatorických identit. Vzhledem k tomu, že jsem je nenašel v encyklopedii (3), jsou asi neznámé, nebo je matematici považují za tak triviální, že se je ani nenamáhají vysvětlovat.

Andrews uvedl ve své monografii o rozkladech tři identita:

Prvá je

p(m, n, M) = p(n, m, M)

Počet rozkladů čísla M na přesně n částí s největší částí m je stejný jako počet rozkladů na n částí majících největší část n. Tato identita je dokázaná transponováním rozdělení matic F, známých jako Ferrerovy grafy. F(m,n) obsahuje M prvků f(i,j) = 1, jiné prvky jsou nula a f(i,j) > f(i+1,j) nebo f(i,j+1). A transponované rozdělení matice F(n,m) odpovídá rozdělení p(n,m,M).

Odečtením matice F od matice obsahující pouze jednotkové prvky, dostaneme komplementární matici

1

1

-

1

0

=

0

1

1

1

0

0

1

1

Takto dostaneme vztah mezi počtem omezených rozkladů dvou různých počtů, druhou identitu

p(m, n, M) = p(n, m, mn - M)

Třetí identita, pro kterou Andrews neznal žádný jednoduchý kombinatorický důkaz je

p(m, n, M) - p(m, n, M-1) > buď= 0 pro M < nebo= mn/2.

V důkazu třetí identity použijeme operaci velmi užitečnou pro odvození prvků schémat rozdělení a omezených rozdělení všeho druhu. U omezených rozdělení na přesně n částí majících m jako největší část má (m + n - 1) jednotek vázaných prvky tvořících prvý řádek a sloupec odpovídajících Ferrerových grafů. Jen (M - m - n + 1) prvků jsou volné pro různé rozkladyů v omezeném rámci (m-1) a (n- 1). Tedy

p(m, n, M) = p(m-1, n-1, M-m- n+1)

Například: p(4, 3, 8) = p(3, 2, 2) = 2. Rozklady jsou 4, 3, 1 a 4, 2, 2, nebo 2, 0 a 1,1.

Tento vzorec lze použít pro nalezení všech omezených rozkladů. ke je dosti snadné, pokud rozdíl (M-m-n+1) je menší než omezující hodnoty m, n, nebo alespoň jedna z nich. Řádkové a sloupcové součty částečně omezených rozkladů majících jiné omezující konstanty, kde buď n nebo m může být 1 až M:

p(m, * ,M) = p(m, j, M)

p(*, n, M) = p(i, n, M)

Schémata rozdělení jsou v důsledku transposic symmetrické. Řádkové a sloupcové součty jsou stejné. Zavedeme tabulky omezených rozkladů s použitím rekursivního vzorce pro počet rozkladů jako součet of dvou rozkladů

p(*, N, M) = p(*, N-1, M-1) + p(*, N, M-1)

Rozdělíme všechna rozdělení na přesně N částí na dvě části. V jedné části jsou rozklady mající v posledním sloupci 1, jejich počet je počítán členem p(*, N-1, M-1), což je počet rozkladů čísla (M-1) na přesně (N-1) částí, ke kterým se přidala 1 na n-tém místě a jiné množině jsou rozklady, které mají v posledním sloupci 2 a více. Dostaly se přidáním 1 ke všem n prvkům rozkladů (M-N) na N částí.

Podobný vzorec lze odvodit pro rozklady M na nejvíce N částí. Tyto rozklady mohou mít nulu alespoň v posledním sloupci nebo jsou rozděleny na přesně n částí:

p(*, * = N, M) = p(*, * = N-1, M) + p(*, * = N, M-N)

Abychom definovali oba rekursivní vzorce přesněji, musíme definovat zdánlivě paradoxní rozdělení : p(0, 0, 0) = 1. Co to znamená? Rozdělení nuly na žádnou nulovou část. Toto rozdělení představuje prázdný prostor rozměru nula. Ten lze oprávnit jako limitu. S použitím generující funkce píšeme n = 0 a nalezneme její limitu

lim 00 = lim (1/x)0x›? = 1/x0 = 1.

Dostaneme tabulku rozkladů

Tabulka 1. Rozklady na přesně n částí

n

0

1

2

3

4

5

6

S  

m=0

1

         

1

1

 

1

       

1

2

 

1

1

     

2

3

 

1

1

1

   

3

4

 

1

2

1

1

 

5

5

 

1

2

2

1

1

7

6

 

1

3

3

2

1

1

11

Prvky mají jednu důležitou vlastnost. Počty v následujících řádcích jsou neklesající. Nyní rozmístíme rozklady na dvoj-rozměrnýou tabulku. Tyto tabulky budeme nazývat schémata rozdělení.

Ve sloupci se klasifikace provádí podle počtu nenulových částí rozkladů. Pro řádky potřebujeme jiný klasifikační příznak. Tím bude délka nejdelšího jednotkového vektoru sloupce m1. Od všech vektorů rozdělení majících stejný rozměr je nejdelší vektor s nejdelším prvým vektorem. Takové rozmístění jsou ukázány Tabulkách 2 a 3.

Počet of nenulových vektorů v rozkladech bude ukázán jako n, rozměr prvého vektoru jako m. Nuly nebudou zapisovány, aby se ušetřila práce. Závorka (m, n) znamená všechny rozklady čísla m na nejvíce n částí. Poněvadž píšeme rozdělení jako vektor, dovolujeme žádnou část v rozdělení.

Schéma rozdělení lze rozdělit na čtyři bloky. Diagonalní bloky opakují tabulka 1, jednou napsanou v transponované formě pro n > m/2. Lichá a sudá schémata se chovají různě, jak lze vidět na Tabulkách 2 a 3

6.2 Schéma rozdělení m = 9

a

1

2

3

4

5

6

7

8

9

m=9

1

               

8

 

1

             

7

 

1

1

           

6

1

1

1

5

 

1

2

1

1

       

4

   

2

1

1

1

     

3

     

2

2

1

1

   

2

       

1

1

1

1

 

1

               

1

 S

1

4

6

5

5

3

2

1

1

6.2 Schéma rozdělení m = 10

a

1

2

3

4

5

6

7

8

9

10

m=10

1

                 

9

 

1

               

8

1

1

           

7

1

1

1

   

     

6

1

2

1

1

       

5

 

1

2

2

1

1

       

4

 

2

3

2

1

1

     

3

     

2

2

2

1

1

   

2

       

1

1

1

1

1

 

1

                 

1

 S

1

5

8

9

7

5

3

2

1

1

V n-tém levém spodním bloku lze umístit nenulové prvky jen nad čárou, která dává dostatečně velký součin mn na místě všech jednotek odpovídajících Ferrerových grafů a jejich součty musí souhlasit s řádkovými a sloupccovými součty.

Prvých m/2 řádků a posledních n/2 sloupců následujících schémat jsou stejné, tak musí být jejich příslušné součty. Poněvadž celkové sloupcové nebo řádkové součty následujících schémat jsou neklesající, rozdíly, které počítají omezené rozklady musí být také neklesající. Toto je důkaz třetí identity. Jednoduchost ukazuje, že schémata rozdělení jsou dosti užitečným kombinatorickým nástrojeml. Počítají orbity rovin orthogonálních k jednotkovému diagonálnímu vektoru I v přirozeném vektorovém prostoru.

Tabulka 5.10 Orbity v 3-rozměrných krychlích

Rozměr hrany

0

1

2

3

m=0

000

000

000

000

1

100

100

100

2

 

110

200,110

210,110

3

 

111

210, 111

300,210,111

4

   

220, 211

310,220,211

5

   

221

320,311,221

6

   

222

330,321,222

7

     

331,322

8

     

332

9

     

333

Rovnici 5.2 lze aplikovat na krychli. Ukazuje jejich důležitou vlastnost, krychle jsou symetrické podél hlavní diagonály. Vycházeje z centra koordinát, simplex n až nejvzdálenější vrchol krychle, kde všechny n- koordináty jsou (m-1). Diagonála krychle je představena v Tabulce 5.10 k indexy, mimo to krychle je convexní, proto pokud

M   mn/2 p(m, n, M)   p(m, n, M-1) (5.9)

a pokud

M   mn/2 p(m, n, M)   p(m, n, M-1) (5.9a)

Zde vidíme důležitost omezených rozkladů. Z tabulky 5.10 můžeme nalézt rekurenci, která je dána factem, že ve větší krychli je vždy přítomna menší krychle jako její základna. K ní se přidávají nové orbity, které jsou na jejích rozšířených stranách. Avšak je dostatečné znát orbity jedné rozšířené strany, poněvadž jiné strany jsou tvořeny těmito orbitami. Rozšířená strana n-é krychle je (n - 1) rozměrnou krychlí.

Rekurentní vztah pro rozklady v krychlích je tedy

p(m,n,M) = p(m-1,n,M) + p(m,n-1,M) (5.10)

Tato rekurence bude později vysvětlena podrobněji.

Literatura

Matematika - jednotící prvek vědy, Pokroky matematiky, fyziky a astronomie, 34 (1989) č.4, str. 202.

L. Boltzmann, Über die Beziehung zwischen dem zweiten Hauptsatze der mechanishen Wärmetheorie und die Wahrscheinlichkeitsrechnung, Wiener Berichte 1877, 76, 373.

G. E. Andrews, The Theory rozkladů, Addison-Wesley Publ. Comp., Reading, MA, 1976, rusky Teoria razbijenij, Nauka, Moskva, 1982.

 

4. Grupy symetrie

Každý má svou představu o symetrii. Toto slovo se často zaměňuje s pojmem krásy. Symetrie nabývá stále většího významu v přírodních vědách. Fyzika elementárních částic je spojena téměř úplně s hledáním jejich symetrie, symetrie má velký význam i v chemii.

Obvykle se symetrie vysvětluje na geometrických tělesech.

Představte si rovnostranný trojúhelník. Každou jeho stranu můžete rozpůlit a střed strany spojit s protilehlým vrcholem. Dostaneme tak tři roviny (to jsou v ploše pouhé čáry) symetrie, pravá strana odpovídá levé, podobně jako u lidského těla, pokud nezkoumáme vnitřnosti, které jsou nepárové. Mimo to existuje osa (to je v ploše pouhý bod) ve středu trojúhelníku, podle které lze trojúhelník otáčet. Vždy po otočení o 1,047 radiánů (120 stupňů) se trojúhelník dostane do stejné polohy jako měl dříve, pouze se změní poloha označení vrcholů.

U čtverce existují dvě dvojice rovin symetrie, jedna půlí strany a druhou tvoří úhlopříčky, a čtyřčetná osa otáčení.

Kruh má nekonečně mnoho rovin symetrie a osu otáčení, která umožňuje nekonečně mnoho poloh.

Obecně se dá říci, že čím více prvků symetrie a čím vyšší je jejich řád, tím je symetrie obrazce vyšší. Takže symetrii můžeme měřit a porovnávat.

Vedle geometrické symetrie existují i jiné druhy symetrie. Tak třeba věta “kobyla má malý bok” se dá číst stejně od předu tak od zadu. Zdá se, že tento příklad nemá s geometrií nic společného. Spojitost se však najde. Spojovací můstek tvoří teorie grup cyklických permutací, kdy přesmykům číslic (nebo ekvivalentně písmen) lze přiřadit operace s geometrickými tělesy.

Označíme si vrcholy pravidelného čtyřstěnu (a, b, c, d) a umístíme si čtyřstěn tak, aby vrchol a směřoval k nám. Potom permutace (b, c,d, a) je příkaz k otočení čtyřstěnu tak, aby k nám směřoval vrchol b, vrchol d se otočil na místo původního vrcholu c a vrchol a se přesunul na místo původně zaujímané vrcholem d. Permutace (a, c,d, b) bude otáčet čtyřstěn kolem osy procházející vrcholem a, který při operaci zůstane na svém místě.

Všechny permutace n prvků dostaneme tak, že najdeme n- tou mocninu součtu n prvků. V našem příkladě čtvrtou mocninu součtu (a+b+c+d). V 256 členech součinu je 24 členů, které obsahují všechny čtyři prvky. Permutace odpovídají těmto členům součinu, pořadí násobení prvků.

Cyklické permutace se zapisují různými způsoby. Úplný zápis uvádí důvodní stav a cílový stav, zkrácený zápis uvádí pouze cílový stav, protože důvodní stav se předpokládá v přirozeném pořadí. Při tom se rozumí, že operace se může opakovat tolikrát, až se soustava dostane do původního stavu. Tak na příklad:

0. = 1 2 3 4 5 6

1. = 2 3 1 4 6 5

2. = 3 1 2 4 5 6

3. = 1 2 3 4 6 5

4. = 2 3 1 4 5 6

5. = 3 1 2 4 6 5

6. = 1 2 3 4 5 6

Prvé tři prvky tvoří cykl délky tři, čtvrtý prvek, který stále zůstává na svém místě, je cykl délky jedna a pátý a šestý prvek tvoří cykl délky dva. Soustava dostane do původního stavu až po nejmenším společné násobku délky všech cyklů, tedy 3x1x2 = 6.

Technicky výhodné je spojení permutací s permutačními maticemi. Tyto matice není nic jiného než tabulka, jejíž řádky tvoří prvky permutace v přirozeném pořádku (index i) a indexy sloupců odpovídají původnímu číslu prvku j. Druhá možná konvence je přehození významu řádků a sloupců. Obě konvence se liší v tom, zda působí při násobení vektoru na vektor řádek zprava, nebo na vektor sloupec zleva. Konvence jsou vzájemně transponované.

Shodu prvků označíme jednotkou v příslušném poli, ostatní pole mají hodnotu nula.

Tedy pro případ shora máme:

0

1

0

0

0

0

0

0

1

0

0

0

1

0

0

0

0

0

0

0

0

1

0

0

0

0

0

0

0

1

0

0

0

0

1

0

Zápis matice se zpravidla ohraničuje úvozovkami nebo dvojitými čarami. V případě permutačních matic zápis obsahuje mnoho zdánlivě nadbytečné informace, protože čtvercová matice obsahuje jen n stejných prvků, v každém řádku i sloupci jediný.

Zdánlivá nevýhoda se však promění ve výhodu, když se pokusíme spočítat, kolik existuje permutačních matic. V prvém řádku máme n možností, jak umístit nenulový prvek, v druhém řádku o jednu méně, v třetím řádku o dvě méně. V předposledním řádku nám zbudou jen dvě možnosti a v posledním řádku jediná. Možnosti se vzájemně násobí, takže dostaneme součin po sobě následujících čísel

1x2x3x...xn = n!.

Zkráceně se zapisuje číslicí s vykřičníkem a říká se mu faktoriál. Matematikové definovali i faktoriál 0!. Není to nula, ale

n! = 1.

Nejjednodušší permutace jsou ty, ve kterých si vymění místo vždy jen dva prvky. Můžeme si je představit jako jednoduchá telefonní spojení, kdy spolu mluví vždy dva účastníci. Takovým permutacím se říká konvoluce. Jejich počet se dá určit různým číslováním buněk Ferrerových grafů. Tak se dostanou Youngovy tabulky. Ostatní typy permutací získáme násobením Youngových tabulek stejného typu.

Permutace se dají spočítat i podle jednotlivých typů cyklů. Takové počítání je složitější, nejdříve bylo nutné určit tak zvaný index grupy. Pak se jednotlivé typy cyklů setřídí podle počtu nenulových cyklů. Sloupcové součty dávají Stirlingova čísla prvého druhu.

Stirlingova čísla druhého druhu se dostanou při počítání jednotkových matic v dolním trojúhelníkovém tvaru, které mají v každém řádku jediný nenulový prvek, ale ve sloupcích počet prvků není omezen. Matice v dolním trojúhelníkovém tvaru mohou mít nenulové prvky jen po hlavní diagonálu (index řádku i se rovná indexu sloupce j). Počet těchto matic je stejný jako počet permutačních matic. Důkaz je podobný. V prvém řádku máme pouze 1 možnost, jak umístit nenulový prvek, v druhém řádku o jednu více, v třetím řádku o dvě více. V předposledním řádku je (n -1) možností a v posledním řádku n možností.

Posloupnosti odpovídající těmto maticím dostaneme jako prvky součinu

a(a + b)(a + b + c)...(a + b + .. + n).

Z těchto matic lze vyloučit takové, které nemají obsazeny souvisle všechny sloupce, třeba odpovídající posloupnosti aabd, kde je nulový třetí sloupec tabulky. Potom součty matic, které dávají Stirlingova čísla druhého druhu neodpovídají faktoriálu, ale jsou menší.

Tabulky, které se dostanou při počítání obou typů Stirlingových čísel, tvoří opět matice, které jsou, pokud se vynásobí alternativně znaménky plus/minus, vzájemně inversní, což znamená, že jejich součin se rovná incidenční matici I, kde jednotkové prvky jsou pouze na diagonále.

 

5. Hrátky s Pascalovými trojúhelníky

Jestli si myslíte, že v nadpisu je chyba, tak můžete při čtení přeskakovat, protože o tématu něco víte (pokud si ovšem nepletete Pascalovy trojúhelníky s Rubikovou kostkou). Pro jistotu začneme od počátku.

Když se umocňuje dvojčlen (binom) (a + b), dostávají se postupně výsledky:

a + b

aa + (ab + ba) + bb

aaa + (aab + aba + baa) + (abb+ bab + bba) + bbb.

Před prvý řádek předřadíme jednotku jako mocninu binomu na nultou (nultá mocnina jakékoliv čísla je jedna) a členy v závorkách sečteme, protože jejich prvky se liší jen pořadím, v jakém se provádělo násobení. Pro poslední řádek tak dostaneme čísla: 1 3 3 1.

Teď si vypíšeme počty prvků a doplníme chybějící prvky do tabulky nulami:

1

0

0

0

0

1

1

0

0

0

1

2

1

0

0

1

3

3

1

0

1

4

6

4

1

Když si všimneme, že každý prvek v tabulce je součtem dvou prvků z předchozího řádku (samozřejmě s vyjímkou prvého řádku, který musí být daný, což jsme dosáhli tou nultou mocninou) potom dostaneme další řádky v tabulce bez násobení. Takovému rozšiřování odvozováním prvků z předcházejících se říká rekurentní vzorec. Prvky v tabulce se nazývají binomické koeficienty.

Samotné tabulce se říká Pascalův trojúhelník. Pascalův trojúhelník se obvykle vypisuje ve formě rovnoramenného trojúhelníka. My jsme zvolili formu tabulky (matematikové říkají takovým tabulkám matice), protože to umožňuje psát Pascalův trojúhelník v jiném tvaru:

1

1

1

1

1

0

1

2

3

4

0

0

1

3

6

0

0

0

1

4

0

0

0

0

1

Druhý Pascalův trojúhelník dostaneme z prvého maticovou operací, které se říká transpozice. Každý sloupec matice přepíšeme jako řádek transponované matice, případně každý řádek jako sloupec transponované matice. Podle konvence by matice měla být v závorkách nebo ohraničena dvojitou čarou. Prvky obou tabulek můžeme dostat i bez rekurentního vzorce přímo. V minulé kapitole jsme se zabývali permutacemi n prvků. Jejich počet určuje faktoriál n!.

Binomické koeficienty počítají podobné permutace, pouze místo n různých prvků máme jen dva různé prvky a každý se opakuje a nebo b krát. Permutace jednotlivých a nebo b mezi sebou neumíme rozlišit, proto musíme faktoriál n! podělit faktoriály a! a b!. Součet a + b = n. Binomický koeficient, který se obvykle označuje závorkami se dvěma čísly napsanými nad sebou (to na Internetu nevyjde). Je to vlastně podíl n!/a!b!, třeba 5!/3!2! = 120/6x2 = 10.

Pole matice se označují podobně jako adresy domů. U nás není zvykem číslovat ulice jako třeba v USA, ale i název ulice se promění v pořadové číslo v nějakém, třeba abecedním seznamu ulic. Takže adresa pole matice je pořadové číslo řádku i a pořadové číslo sloupce j. Matice má m řádků a n sloupců (někdy se setkáte s transponovanou konvencí, je to podobné jako desetinné čárky nebo tečky, lidé se nedokážou shodnout na nejjednodušších věcech).

Indexy i a j začínají zpravidla od 1. Tato konvence je někdy nevýhodná, jak nám dokazují trampoty s rokem 2000. V případě Pascalových trojúhelníků je výhodné počítat indexy od nuly, nebo musíme od normálních indexů i a j odečítat 1.

Matice je vlastně seznam vektorů, buď vektorů řádek, nebo vektorů sloupců. Vektory se píšou v závorkách a jejich prvky se oddělují čárkami. Třeba (4,1) nebo (1,4) znamenají souřadnice na nějaké dvojrozměrné ploše.

Vektory a matice se dají násobit. Existuje několik možností. Nejjednodušším násobkem dvou matic je přímý součin. V tom případě se vynásobí jednoduše vždy pouze prvky ve stejném poli.

Při násobení vektorů se musí násobit vektor řádek vektorem sloupcem, nebo vektor sloupec vektorem řádkem. V prvém případě dostaneme jako výsledek jediné číslo, kterému se říká skalární součin. V druhém případě dostaneme jako výsledek celou matici. Součet prvků na diagonále matice se rovná onomu jedinému číslu. Součiny se nazývají vnitřní a vnější. Například:

4

1

4

1

=

17

4x4 + 1x1 = 17.

4

1

4

16

4

1

4

16

Při běžném součinu matic se násobí jednotlivé řádky levé matice se sloupci pravé matice tak, že odpovídající prvky v řádcích se násobí odpovídajícími prvky v sloupci, výsledek se sečte a tvoří prvek součinu. Vzniknou tedy všechny možné vnitřní součiny vektorů matice.

Výsledek násobení u obyčejných čísel (skalárů) nezávisí na pořadí v jakém se čísla násobí. Například 5x4 = 4x5. U matic výsledek závisí na pořadí v jakém se matice násobí.

Podmínkou pro násobení matic je, aby levá matice měla tolik řádků, kolik má pravá matice sloupců.

Při násobení matice stejnou maticí se dostane její kvadratická forma. Pokud matice není symetrická (což znamená, že se při transponování nezmění, dostanou se dvě kvadratické formy.

Teď se můžeme přesvědčit, že součin dvou Pascalových trojúhelníků shora

dá opět Pascalův trojúhelník, pokud si matici na trojúhelník doplníme:

1

1

1

1

1

1

2

3

4

5

1

3

6

10

15

1

4

10

20

35

1

5

15

35

70

Řádky (sloupce) jsou teď na vedlejší diagonále matice. Tato forma ukazuje, že prvky tabulky jsou součty nejen dvou předcházejících prvků, ale celého předcházejícího řádku (sloupce).

Pokud začínají indexy od nuly, pak výsledek, což je horní hodnota binomického koeficientu, je součet indexů minus jedna, dolní hodnoty binomického koeficientu jsou index i a (j -1).

Tuto formu Pascalova trojúhelníka dostaneme jako také složitěji, jako součet polynomických koeficientů pro n permutace.

Ve shora uvedeném binomu se jednalo o změnu pořadí prvků. Tomu budeme říkat m permutace, protože se mění pořadí v posloupnosti, což je prvý implicitní index, jako pořadí vektorů řádků v matici.

Polynomický koeficient je podobně jako binomický koeficient výsledek násobení polynomu, třeba (a + b + c + d). V součinech se objevují posloupnosti jako aaab, aaac, bbbc, ccca. Tyto n permutace jsou dosažitelné jako substituce. V případě binomu byly triviální, jednalo se vždy jen o dvě možnosti, odpovídající n permutacím vektorů, třeba (3,1) na (1,3), nebo jediné možnosti, jako (2,2).

Polynomický koeficient pro n permutace však neodpovídá binomickému koeficientu, ale výsledku, který má u binomu triviální formu 2!/1!1! = 2, třeba prvku aab odpovídá prvek bba. Pro tři prvky už je to zajímavější, třeba 3!/1!1!1! = 6 dá šest členů (3aab + 3abb + 3aac + 3acc + 3bbc + 3bcc).

Polynomický koeficient se dostane jako postupný součin binomických koeficientů, například 6!/4!2!x4!/3!2! = 6!/3!2!1! = 60.

Polynomický koeficient pro n permutace počítá počty lineárních vektorů s n prvky s konstantními součty m. Například pro rozklady čísla 4 na 5 prvků jsou to tato čísla:

(4, 0, 0, 0, 0) = 5!/4!1! = 5

(3, 1, 0, 0, 0) = 5!/3!1!1! = 20

(2, 2, 0, 0, 0) = 5!/3!2! = 10

(2, 1, 1, 0, 0) = 5!/2!2!1! = 30

(1, 1, 1, 1, 1) = 5!/4!1! = 5

Celkem 70

Pokud se polynomické koeficienty uspořádají do tabulek rozkladu čísla m na n sčítanců, třeba shora uvedený součet se rozepíše do čtyř sloupců jako

5

     
   

20

   
   

10

30

 
       

5

S

5

30

30

5

Tak dostaneme kombinatorické identity. Součty ve sloupcích se dají vypočítat přímo bez výpočtu jednotlivých polynomických koeficientů.

Hodnoty třetí formy Pascalova trojúhelníku jsou známy v literatuře jako počty rozdělení m nerozlišitelných prvků do n buněk. Všimněte si, prosím jedné důležité okolnosti. Z vektorového zápisu plyne, že známe pouze součty a o prvcích nevíme nic bližšího.

Existuje ještě další formy Pascalova trojúhelníku, které se dostanou inverzí matic Pascalova trojúhelníku, ale to už patří do jiné kapitoly.

Diference Pascalova trojúhelníku.

Vezměte třetí formu Pascalova trojúhelníku, kterou jsme dostali jako součin dvou Pascalových trojúhelníků. Opište prvý řádek. Pak opisujte další řádky, ale před prvé číslo napište vždy (n - k) nul. Těmto tabulkám budeme říkat k-tá diference Pascalova trojúhelníku. Prvá diference odpovídá transponované formě Pascalova trojúhelníku. Druhá diference transponované formy Pascalova trojúhelníku má tvar

 

1

1

1

1

1

1

1

 

0

0

1

2

3

4

5

 

0

0

0

0

1

3

6

 

0

0

0

0

0

0

1

S

1

1

2

3

5

8

13

Součty sloupců jsou známy jako Fibbonacciova čísla. Každé takové číslo je součtem dvou předcházejících čísel. Ve středověku to byla odpověď na zajímavou otázku o rozmnožovacích schopnostech králíků, dnes je známo mnoho dalších aplikací těchto čísel.

Vedle tohoto typů diference všech rozkladů vektoru můžeme vektory rozlišovat podle velikosti jediného vektoru, bez ztráty obecnosti třeba a. Pro shora uvedený příklad:

Hodnota vektoru a:

4

3

2

1

0

Celkem

Počet vektorů:

1

4

10

20

30

70

Tato diference je shora uvedená identita součtu předchozího řádku.

Kombinatorika a fyzika

Matematika se zdá být čistě abstraktní záležitost, avšak shora uvedené problémy vedly k životní tragedii, která skončila sebevraždou.

Maxwell a Boltzmann v minulém století ukázali, že rozdělení energie tepelného pohybu molekul plynu je exponenciální (tomu odpovídá vzhledem k závislosti energie na rychlosti normální rozdělení rychlostí).

Boltzmann spojil rozdělení energie s polynomickým koeficientem pro n permutace. Za předpokladu, že energie je kvantována, pak se dá rozdělení energie popsat vektorem. Vzhledem k velkým počtům molekul postačí k popisu stavu soustavy plynu jen počty molekul, které mají určitou energii. Při srážkách si molekuly vyměňují energii. Pokud výměna energie je symetrická, třeba 10 + 5 = 5 + 10, soustava se přemístí ve fázovém prostoru na stejné orbitě.

Když je výměna energie asymetrická, třeba 10 + 5 = 8 + 7, soustava se přemístí ve fázovém prostoru na jinou orbitu. Vzhledem k velkým počtům molekul (vzpomeňte si, že Avogadrovo číslo má přes dvacet nul) dochází k simultánním srážkám, kdy se asymetrické výměny energie vzájemně vyrovnávají, takže se soustava plynu v rovnovážném stavu udržuje na stejné orbitě (nebo pásu orbit).

Boltzmann měl se svým vysvětlením velké potíže. Jeho kolegové si vymýšleli paradoxy, které měly jeho ideu diskreditovat. Ačkoliv byl Boltzmann bodrý Vídeňák (po návratu z cesty do Ameriky si s gustem zašel na pivo), nevydržel pochybnosti a spáchal sebevraždu, paradoxně ve stejné době, kdy Planck potvrdil kvantovou hypotézu její aplikací na vysvětlení rozdělení energie záření černého tělesa.

Černé těleso je černá dutina s malým otvorem, kterým lze pozorovat vnitřek dutiny. Z tělesa vychází při různých teplotách fotony, jejichž energii změřili Lummer a Pringsheim a vztah mezi zářivostí a teplotou odvodili Stefan a Boltzmann. Rovnici pro spektrální zářivost našel Wien, radiační zákon pak Raleygh a Jeans. Oba vztahy vyhovují pro různé teploty. Sloučil je Planck za předpokladu, že energie je kvantovaná.

Rozdělení energie je trochu odlišné od rozdělení energie molekul plynu. Fotony vyletující z dutiny černého tělesa odpovídají diferenci plošného podle velikosti jediného vektoru. To by se mohlo interpretovat tak, že v dutině černého tělesa soustava probíhá v širším pásu orbit vzhledem k rozdílné rychlosti obou procesů. Bose a Einstein vysvětlili rozdíl tím, že fotony jsou nerozlišitelné. Jak jsme už ukázali, známe jen počet věcí uvnitř buněk, v tomto případě počet fotonů s daným kmitočtem. Zda jsou nerozlišitelné, to není vůbec důležité (1). Tomu nerozlišitelnému odpovídá rychlost molekuly nebo kmitočet fotonu.

Rozdělení rozlišitelných věcí vedlo také k určitému nedorozumění. Ale to už je zase jiná kapitola.

Literatura

M. Kunz: How to distinguish distinguishability: Physical and combinatorial definitions, Physics Letters A 135 (1989) 421-424.

 

6. Kniha Přírody

V Bibli se tvrdí, že na počátku bylo slovo. Moderní kosmologie se domnívá, že to počáteční slovo byla singularita, ve které se soustředil celý budoucí vesmír. Tato singularita se při velkém třesku rozprskla a od té doby se neustále rozpíná. Počátku se říká podle prvého písmena řecké abecedy alfa, a jestli se bude Vesmír jednou smršťovat, potom koncem bude slovo omega, jediné písmeno ve kterém se soustředí veškerá energie i informace. Také se mluví o knize Přírody, kterou se máme naučit číst.

V Bibli chybí jakékoliv údaje, jak to singulární slovo znělo a jak bylo velké, i když pro slovo je přesnějším výrazem dlouhé nebo hlasité. Při troše dobré vůle by bylo možné to tajemné slovo ztotožnit s knihou Přírody.

Knihu Přírody si můžeme představit v mnoha měřítcích. Když začneme s tím největším, tak se jedná o atlas galaxií, kde na x- tém listu na y-tém řádku je 5 galaxií a dva oblaky vesmírného prachu, na dalším řádku je 10 galaxií a podobně.

V menším měřítku by se jako slova nebo písmena v knize Přírody vyskytovaly hvězdy různého typu a v tom nejmenším měřítku by to byly nukleony, elektrony a fotony či kvarky a jiné trosky získané rozbitím elementárních částic.

Vzhledem k tomu, že ve všech měřítcích se písmena neustále pohybují, tak se kniha Přírody neustále přepisuje. V každém okamžiku je ta kniha jiná. Pokud si představíme okamžitý stav jako svazek knihy, potom vlastně neexistuje jediná kniha Přírody, ale celá knihovna. Vesmír přeskakuje z jednoho svazku na druhý. Lze předpokádat, že při tom přeskakování se Vesmír musí pohybovat vždy k některému nejbližšímu svazku.

Knihy známe jako listy papíru, na které se podle určitých pravidel láme posloupnost slov. Posloupnost slov se může zapisovat vodorovně či svisle. Vodorovné psaní může začínat vlevo nebo vpravo s tím, že sekáme posloupnost slov na přibližně stejné kousky, řádky. Kdysi se zkoušelo skládat slova na stránku souvisle, střídavě od leva a pak od prava a opět od leva. Když si uvědomíme, že kniha je jediný řádek, pak různé texty jsou jako Adrianina nit, nebo odborněji vektor, který vede od počátku k určitému bodu.

Počty slov

Po trochu lyrickém úvodu si pro jednoduchost vezměme k ruce čtverečkovaný papír, na kterém si můžeme snadno nakreslit všechny vektory, posloupnosti slov, z abecedy dvou symbolů. Všechna slova délky m budou končit na úhlopříčných přímkách. Pro m = 3 to budou slova:

aaa (aab, aba, baa) (bba, bab, abb) bbb.

Posloupnosti slov si můžeme zobrazit ještě pro tři symboly, ale pro více písmen nám chybí místo a musíme se spolehnout jen na úsudek. Posloupnosti slov si symbolicky představíme jako matici s n sloupci a m řádky. Sloupce označíme alfabetickým indexem (písmeny abecedy) a řádky budou souhlasit s pořadím symbolu v posloupnosti.

Pro abecedu n symbolů máme v každém řádku n možností výběru symbolu, který označíme jednoduše jednotkou. Ostatní sloupce zůstanou prázdné, tomu odpovídá nula. Jednotlivé možnosti jsou na sobě nezávislé, takže možnosti se vzájemně násobí

n x n x n x ...

Počet různých posloupností je tedy m-tou mocninou n.

Posloupnosti se mohou měnit dvěma operacemi symetrie:

Substitucemi, které zaměňují symboly:

aaa > bbb

aab > bba

aba > bab

baa > abb.

Vzhledem k formálnímu zápisu symbolů do matice, lze substituce dosáhnout permutacemi sloupců matice. Proto můžeme mluvit o n-permutacích, které jsme už probrali.

Zápis:

1

0

>

0

1

0

1

>

1

0

1

0

>

0

1

odpovídá substituci aba - bab.

Pořadí symbolů mění permutace řádků matice. Proto to jsou m-permutace. Všechna slova, která lze získat m-permutacemi vedou ke stejnému bodu v prostoru. n-permutace přesunují slova v prostoru na sférických orbitách.

Permutacemi nelze dosáhnout přeměnu slova aaa na slovo aab. Oba typy slov patří na různé orbity.

Oba typy permutací jsou nezávislé a proto se násobí. Počty posloupností na jednotlivých orbitách se určí pomocí polynomických koeficientů pro n- permutace a m-permutace.

Posloupnosti pro m = 7 a n = 7 na orbitě (3, 2, 1, 1, 0, 0, 0), tedy třeba aaabbcd, mají oba polynomické koeficienty stejné. Polynomický koeficient pro n-permutace počítá se 3 symboly s nulovou frekvencí, se 2 symboly s jednotkovou frekvencí a po jednom symbolu s frekvencí 2 a 3: 7!/3!2!1!1! = 420. Polynomický koeficient pro m-permutace počítá frekvenci 3 jednoho symbolu, frekvenci 2 jednoho symbolu a frekvenci 1 dvou symbolů: 7!/3!2!1!1! = 420. Ve výrazu by se měly objevit i tři faktoriály 0! pro symboly s nulovou frekvencí. Vzhledem k tomu, že 0! = 1, nemění se hodnota a tak se tyto faktoriály vynechávají.

Pro n-permutace je tento polynomický koeficient maximálně dosažitelný pro m = 7 a n = 7. Pro m-permutace je maximálně dosažitelný polynomický koeficient 7!, pokud se každý symbol v posloupnosti objeví pouze jedenkrát: abcdefg.

Pokud by nebyla hodnota m omezená nebo daná, potom by se dosáhla stejná hodnota i u tohoto polynomického koeficientu, ovšem hodnota m by musela být alespoň 18.

Počty sekvencí na jednotlivých orbitách se opět dají seřadit do tabulek. Součty prvků v tabulkách dávají mocniny nm. Jsou to velmi rychle rostoucí čísla, která se dají rozložit na součin dvou matic. Jednu tvoří matice binomických koeficientů, druhou maticí jsou diference, které se získávají operátorovou algebrou. S odpovídajícími čísly se opět dají provádět různé operace a tak se získají různé kombinatorické identity, jako jsou třeba Lahova čísla.

Identity spojené s mocninami jsou známy v literatuře jako rozdělení m rozlišitelných věcí do n buněk. Toto označení je nepřesné. Ve skutečnosti jsou věci, lépe řečeno objekty, nerozlišitelné. Pouze víme, že na i-tém místě je objekt v j-té buňce (poli matice). Samotné objekty nejsou nijak označeny a proto jejich vzájemné permutace nemají význam. Pokud objekty opravdu označíme, nejlépe třetím indexem k, potom dostaneme jiné rozdělení a místo mocnin dostaneme rostoucí faktoriál, což je podíl dvou faktoriálů.

Nadbytečnost informace

Pro elektronický přenos zpráv by bylo optimální, kdyby se všechny symboly vyskytovaly v textu stejně často. Tehdy by přenos mohl být nejekonomičtější.

Shannon nazval rozdíl mezi optimálním stavem, teoreticky maximální možností, a skutečnou četností symbolů, měřenou pomocí informační entropie, nadbytečností (redundací). Přirozené soustavy se však vůbec neřídí teorií komunikace. V přirozených jazycích se některá písmena vyskytují v textu velmi často jiná jsou poměrně řídká.

Tato vlastnost není charakteristická jen pro lidskou řeč. I v DNA se různé kombinace nukleových kyselin kódující sekvence aminokyselin vyskytují s různou frekvencí. To umožňuje vytvoření daleko většího počtu kombinací.

Faktoriál sedmi je 5040. To je počet slov vzniklých permutacemi abcdefg. Jak jsme už ukázali, slov se sedmi písmeny typu aaabbcd je 176400 (při substitucích na různé kombinace, třeba eeeffgb). A na orbitě (2, 2, 1, 1, 1, 0, 0) je slov se sedmi písmeny (typu aabbcde) dokonce 264600. Nadbytečnost je spojena s větší rozmanitostí.

Tuto skutečnost využil jako prvý Morse. Při kódování abecedy kombinacemi teček a čárek přidělil nejčastěji se vyskytujícím písmenům nejkratší kombinace. Pro anglickou abecedu vystačil maximálně se čtyřmi tečkami či čárkami. Kdyby se snažil, aby všechny kódy byly stejně dlouhé, musel by použít kódování s pěti tečkami či čárkami.

Počty posloupností jsou nepředstavitelně velké. Vezmeme-li jako knihu jen dvě stě stran textu s asi 2000 symboly na stránce, vychází jako počet různých knih číslo s 700 tisíci nulami. Mezi těmito knihami by byly všechny knihy (delší rozdělené do svazků) ve všech jazycích psané nebo transkribované latinkou. Nebo jinak, ke každé knize by existovalo asi 24 milionů výtisků, které by se lišily jedinou tiskovou chybou od originálu, pokud by se vůbec mohlo rozhodnout, co je originál.

Mocninová funkce se obvykle spojuje s představou krychlí a jejich objemem. S touto formou této funkce si budeme hrát jako s Rubikovou kostkou příště.

Literatura

M. Kunz: How to distinguish distinguishability: Physical and combinatorial definitions, Physics Letters A 135 (1989) 421-424.

 

7. Hrátky s kostkami

Zatím jsme se zabývali v našich statích o kombinatorice posloupnostmi symbolů, třeba baba (1). Protože jsme si symboly ztotožnili s jednotkovými vektory, mohli jsme si posloupnost symbolů představit jako dráhu v n-rozměrném prostoru (naše představivost ovšem velmi rychle narazila na fyzikální bariéru našich tří rozměrů).

Když jsme použili formální zápis posloupnosti symbolů jako matice, formalizovali jsme změny posloupností symbolů jako permutace sloupců a řádků takové matice.

S maticemi lze provádět i další operace. Jednou z nich je transpozice. Transpozice otočí matici podél hlavní diagonály, zamění se při tom indexy řádků a sloupců.

Tedy pro náš jednoduchý příklad baba: Matice s dvěma sloupci a čtyřmi řádky

0

1

1

0

0

1

1

0

se přemění na matici s dvěma řádky a čtyřmi sloupci

0

1

0

1

1

0

1

0

Takto transformované matice už nejsou naivní, protože mají v řádcích různý počet jednotkových symbolů. Tím se dostává naše naivní interpretace matice jako posloupnosti jednoduchých základních vektorů do těžkostí a musíme si najít nějaké jiné jednoduché vysvětlení, co transponovaná matice znamená.

Systematicky bychom se mohli zabývat případy, kdy řádky obsahují vždy dva jednotkové symboly, to však uděláme až později. Teď si najdeme alternativní, obrácené vysvětlení významu transponovaná matice.

Sloupce původně znamenaly symboly tedy vektory. Tak jim tento význam ponechme. Řádky matice odpovídaly pořadí symbolu v posloupnosti což je vzdálenost symbolu od počátku posloupnosti: prvý, druhý až n-tý. To by také vyhovovalo, jen musíme změnit začátek počítání a počítat index od středu souřadnic, tedy od nuly. Tento posun bude mít za následek, že se nám ve vzorcích objeví u čísla m hodnota -1.

Jednotkové symboly budeme považovat za konec příslušného vektoru a jejich poloha nám bude označovat délku tohoto vektoru.

Tedy matice

0

1

0

1

1

0

1

0

odpovídá polohovému vektoru (1, 0, 1, 0)

Posloupnosti symbolů jsme vytvořili (generovali) jako součiny:

(a + b)(a + b)(a + b) = aaa + aab + aba + baa + bba + bab + abb + bbb.

Pro transponované posloupnosti použijeme obměněnou funkci. Počet symbolů jednotlivých členů součinu budou odpovídat délce jednotlivých os m (původně to byl rozměr prostoru n), počet členů součinu n bude totožný s rozměrem prostoru n).

Vzhledem k nulovému indexu si také upravíme význam čísel na osách n. Normální

pravítko

0

1

2

3

nám bude představovat logaritmickou stupnici o základu 1. To je nutné, aby zůstala zachována původní interpretace posloupností

1

a

aa

aaa

jednotka odpovídá nulté mocnině daného symbolu x0 = 1 (nultá mocnina všech čísel se rovná jedné, tedy také 00 = 1).

Logaritmická transformace zmenšuje transformované hodnoty a to tím více, čím větší je základ logaritmů. Při základu 10 transformovaná hodnota 3 odpovídá základu 1000, základu 2 transformovaná hodnota 3 odpovídá základu 8 a 1000 odpovídá asi 10. Čím bude základ logaritmů menší, tím větší bude logaritmus jakéhokoliv čísla.

Logaritmická stupnice, která je stejně dlouhá jako stupnice základní, má základ 1. Jsou s tím spojeny velké problémy, ale ty nás teď nemusí zajímat.

Teď si prostě napíšeme vytvořující funkci trojrozměrné krychle s jednotkovou hranou. Dostaneme 23, osm členů součinu:

(1 + a)(1 + b)(1 + c) = 0 + a + b + c + ab + ac + bc + abc

ve kterých jednotky prostě vynecháváme 0 = (111).

Tyto členy se snadno identifikují se souřadnicemi vrcholů krychle. Pokud se Vám nelíbí názvy body a krychle, použijte název prvky a množiny, 111 je prázdná množina, abc je množina s třemi prvky. Jedná se tedy o Booleovu algebru. Nás však bude zajímat kombinatorika krychlí a počty objektů v nich.

V plošném simplexu jsme počítali počty tří objektů: orbit, bodů na jednotlivých orbitách a posloupností vedoucích k jednotlivým bodům.

V krychlovém simplexu počet bodů odpovídá počtu posloupností a počet orbit odpovídá počtu bodů v plošném simplexu. Počty různých naivních matic se transponováním nemění, takže příslušné hodnoty známe.

To znamená, že je nutné vypočítat pouze počty posloupností vedoucích k jednotlivým bodům jako hodnoty nové kombinatorické funkce.

V n rozměrné krychli s jednotkovou hranou existuje vždy (n + 1) orbit. K tomuto jednoduchému výsledku se dostaneme složitým výpočtem přes polynomický koeficient.

K počátku koordinát se dostaneme jediným způsobem, k bodům ležícím na koordinátách také jediným způsobem, k bodům se dvěma koordinátami vždy dvěma způsoby (ab či ba) a k bodům s třemi koordinátami šesti způsoby. Počet způsobů odpovídá faktoriálu n!.

Celkový počet posloupností pro n = 3 bude tvořit řadu: 1, 3, 6, 6. To je funkce rostoucího faktoriálu, kterou snadno získáme jako podíl dvou faktoriálů m!/(m - i)! tedy

1 = 6/6

3 = 6/2

6 = 6/1

6 = 6/1

V posledním případě jedna v čitateli je ve skutečnosti faktoriál nuly: 1 = 0!. Funkci rostoucího faktoriálu lze sečíst a součty tvoří řadu:

1, 2, 5, 16, 65,

jejíž členy Pn se dostanou podle jednoduchého receptu:

Pn = nPn-1 +1.

Krychle s jednotkovou hranou můžeme použít k registraci nehod. Každou nehodu poznamenáme čárkou. Když počítáme s maximálně m nehodami pro jednotlivce, pak může být v našem registru pouze jeden takový smolař. Nešiků s (m-1) nehodami může být m, osob s (m-2) nehodami m(m-1) a šťastlivců s 1 nebo žádnou nehodou vždy m!.

Toto rozdělení objevil už dávno pan Poisson, když se zabýval statistikou pádů z koně u francouzského královského jezdectva. Náš registr je určen pro průměrný počet nehod 1, zpravidla je tento průměr mnohem menší a naše počítadlo by bylo příliš velké, takže by se muselo upravit. To lze udělat poměrně snadno násobením nehod koeficientem.

Einstein prohlásil, že nevěří v Boha hrajícího v kostky. Mínil tím interpretaci kvantové teorie. Jenomže Poissonovo rozdělení je jakási kostka. A jestli považujeme třeba pády z koně za náhodné, tak švarní husaři a kyrysníci vlastně rajtovali v jakési kostce.

U krychlí s delší hranou jsou příslušné výpočty složitější. Známe jen celkový počet prvků, avšak jejich rozdělení uvnitř krychlí je třeba určovat odlišně.

Tak například trojrozměrná krychle s hranou (0, 2) má hladiny (součet hodnot koordinát):

0 1 2 3 4 5 6

Odpovídající orbity:

0 (0, 0, 0),

1 (1, 0, 0),

2 (1, 1, 0), (2, 0, 0),

3 (1, 1, 1), (2, 1, 0),

4 (2, 1, 1), (2, 2, 0),

5 (2, 2,1),

6 (2, 2, 2)

Celkem: 10.

Vektory: 1, 3, 6, 7, 6, 3, 1. Celkem: 27.

Počet posloupností je třeba počítat podobně jako pro rostoucí faktoriál. Na jednotlivých hladinách jsou to tato čísla:

0 1

1 3

2 (3+6)

3 (18+6)

4 (18+36)

5 90

6 90.

Tady se dostáváme k zajímavým, ale nudným výpočtům. Raději se vrátíme k celkovému počtu posloupností v jednotkových krychlích, součtu funkce m!/(m - i)! v případě, že m se blíží nekonečnu. Poslední členy by měly být faktoriály nekonečně velkých čísel, což znamená, že by byly mnohem větší, než nekonečno.

Úlohu musíme obrátit. Budeme hledat součet nekonečné řady funkce (m -k)!/m! a začneme od konce. Tím se dostaneme k součtu inversního faktoriálu 1/k!, který označíme symbolem e:

e = 1 + 1 + 1/2 + 1/6 + 1/24 + ... = 2,71828...

Tento symbol e je znám jako číslo e, což je základ přirozených logaritmů a zároveň jakýsi klíč k vyšší matematice.

Závěr

Tady někde končí klasická kombinatorika.

S číslem e jsme se přesunuli do pruského Královce, kde měli přes řeku a kanál sedm mostů. Někdo si položil otázku, zda je možné si vyjít v neděli na procházku a přejít po všech mostech jen jednou. Odpověď na tento hlavolam našel matematik Euler, s jehož jménem jsme se už setkali. Založil tak nový obor matematiky, teorii grafů.

My si najdeme ještě další matematické problémy spojené s naivními maticemi, přesněji řečeno s jejích součty a rozdíly, které budeme interpretovat jako incidenční matice grafů.

A tak se dostaneme k problémům zdánlivě velmi jednoduchým, za které však byla udělena Nobelova cena.

Existence dvou polynomických koeficientů a jejich součinu a jejich spojení se symetrií orbit má dalekosáhlé důsledky pro interpretaci fyziky i pro matematiku samotnou, kde došlo před půl stoletím k dost zásadní chybě, o které dodnes nechce nikdo slyšet.

 

8. Teorie grafů

Osobní úvod

V předešlých statích jsme se zabývali kombinatorikou. Spojil jsem klasickou kombinatoriku s pojmem přirozeného vektorového prostoru, který jsem chtěl definovat v analogii s přirozenými čísly, což je vlastně jednorozměrný přirozený komplex.

Při brouzdáním Internetem jsem byl přesvědčován, že mezi přirozená čísla rozhodně nepatří nula, což vlastně není žádné číslo. Byl bych ochoten souhlasit s tím, že nula je zástupný symbol za bod, za “nic”, či za bezrozměrný simplex. Kdysi se pro nulu tento symbol”.” (bod) opravdu používal.

Na druhé straně jsem na Internetu našel tabulku rozkladů přirozených čísel, která začínala od nuly jako moje. Takže i v matematice si můžete vybrat, čemu chcete věřit.

Svoji geometrickou (topologickou) interpretaci kombinatoriky jsem si nechával mnoho let pro sebe, protože nemám formální matematické školení. To neplatí o následujících statích, týkající se teorie grafů. Zde se mi většinu výsledků podařilo publikovat v prestižních vědeckých časopisech.

Jako kluk jsem se rozhodl, že se nechci zabývat vědou (konkretně chemií), protože jsem se mylně domníval, že všechny jednoduché a zajímavé chemické sloučeniny už byly objeveny. Že jsem se pak chemií živil, za to mohla poválečná situace. Chemie, pomineme-li tažení proti vlnové mechanice (a tu jsem nestudoval) byla klidný kout.

Když jsem byl v rámci normalizace vyhozen z laboratoře, dostal jsem se pomocí dobrých lidí do oddělení informací. Tam jsem se musel nějak zaměstnávat a tak jsem se začal postupně zajímat o teorií grafů. Mimochodem, mojí prvou publikací o grafech jsem zveřejnil v rámci polemiky s mentionovou teorií profesora Kahudy (1).

V Královci žil a pracoval geniální matematik Euler. Pod jeho úroveň nebyl zdánivě triviální problém, zda při nedělní procházce Královcem se dá přejít po všech sedmi mostech v Královci jenom jednou a vrátit se do výchozího místa. Pokud byste neměli dost času, abyste obešli prameny řeky, tak to možné není. Euler založil touto studií nový obor, k jehož významnému uplatnění došlo prakticky až v posledním půlstoletí.

K rozvoji teorie grafů přispěla i chemie. Vzorce chemických sloučenin mají formu grafů. Existují však mnohem hlubší souvislosti. Jedna Nobelova cena za chemii byla udělena Hueckelovi, který ukázal, že fyzikální vlastnosti konjugovaných molekul (určité uhlovodíky s dvojnými vazbami) odpovídají vlastním hodnotám matic spojitosti grafu molekuly.

To je však problém už dost abstraktní a vyžaduje hlubší znalosti. Mnohem zajímavější je problém Harry Wienera (nepleťte si jej s jeho slavným jmenovcem Norbertem). Ten koreloval body varů alkanů (methan, ethan, propan, atd.) se součty topologických vzdáleností (počty vazeb) mezi uhlíkovými atomy.

To jsou opravdu základní kupecké počty. Nakreslíte si uhlíkovou kostru (to je technický termín, teorie grafů je názorná disciplína, tak zná jako pojmy kostry, stromy, kořeny, kmeny, větve, listy, cesty) a spočítáte počty vazeb mezi všemi páry atomů. Potom je sečtete a výsledné číslo porovnáte s teplotou, při které alkan vře.

Takové počítání je tak elementární, že zcela uspokojilo můj smysl pro jednoduchost. Až do té doby, když jsem dokázal, že Wienerova čísla jsou součty vlastní hodnot jistých inverzních matic dané molekuly, případně se objeví i jako vlastní hodnota zobecněné inverzní matice k matici molekuly známé pod jménem Laplace-Kirchhoffova (Laplace ji použil jako prvý pro nebeskou mechaniku, Kirchhoff ji využil k řešení vodivosti elektrických obvodů). Při tomto problému by se měla Laplace-Kirchhoffova matice invertovat. Potíž je v tom, že matice je singulární a tedy neexistuje její normální inversní protiklad. Za mých mladých let se Kirchhoffovův problém řešil (a možná stále řeší) rozkladem sítě na stromy. Počty vazeb mezi všemi páry atomů se dají sestavit do matic vzdáleností. To jsou však vzdálenosti abstraktní, topologické. Skutečné geometrické vzdálenosti v molekulách jsou však jiné. Takže se dají vypočítat geometrické analogy Wienerova čísla. Jenomže matice vzdáleností mají ještě jinou zajímavou vlastnost. Z porovnání vzdáleností se dá určit úhel mezi hranami. A z této interpretace plyne, že topologické vzdálenosti jsou čtverci skutečných vzdáleností a grafy se najednou objeví jako objekty v n-rozměrném prostoru. Tento výsledek je důkaz správnosti mé koncepce plošných simplexů. V literatuře se vyskytují názory, že grafy jsou bezrozměrné objekty (abstraktní), či jednorozměrné objekty. Obecně lze říci, že se nikdo tímto problémem vážně nezabýval. Grafy se dají barvit, třeba tak, že dva vrcholy spojené hranou nesmí mít stejnou barvu. Nejmenší počet barev nutných o obarvení grafu jsou dvě. Grafy, které se dají tímto způsobem obarvit, jsou známy jako dvojdílné. Mají některé zajímavé vlastnosti.

Incidenční matice a grafy

Posloupnost symbolů, třeba aaba, se dá formálně zapsat jako naivní matice A. Jiná posloupnost symbolů, třeba babb, se dá formálně zapsat jako naivní matice B.

Teď se budeme zabývat problémem, jak matici A převést na matici B.

Jedna možnost je násobení základní matice A zleva a zprava vhodnými (jednotkovými prmutačními) maticemi. To se dá provést jen v případě, že výchozí i konečná matice jsou stejného typu a leží na stejné orbitě.

Druhou možností je konstrukce additivního operátoru S

s těnito vlastnostmi:

A + S = B

Co tento operátor musí provést? Nejprve musí vynulovat matici A a zapsat na volné místo matici B. V našem příkladu operátor má tvar

- 1

1

0

0

0

0

1

- 1

Obecně operátor má tvar:

S = B - A

Když si nakreslíme dva body s koordinátami (1, 0) a (0, 1), pak vektor řádek (-1, 1), bude paralelní se spojnicí této dvojice bodů a můžeme si jej představovat a zakreslovat jako vektor směřující přímo z bodu a do bodu b. Při zakreslování vektoru řádku (-1, 1) jde vektor nejprve z bodu a do počátku koordinát a odtud do bodu b. Proto jeho ztotožnění s orientovanou spojnicí bodů, hranou, je zcela oprávněné.

Řádky operátoru S (0, 0) představují smyčku vracející původní stav. V teorii grafů se někdy tyto operátory připouštějí a značí se kruhovou šipkou. Jindy jsou definičně vyloučeny.

K operátoru můžeme zkonstruovat analogicky additivní operátor G, který má tvar:

G = B + A.

Pro náš příklad operátor G má tvar

1

1

2

0

0

2

1

1

Vektor (1, 1) je kolmý na spojnici bodů a s b, neorientovanou i orientovanou hranu grafu. Můžeme si klidně představit, že neorientovanou hranu grafu zastupuje. Vektory (2, 0) a (0, 2) odpovídají smyčkám. Prozatím se s nimi nebudeme zabývat.

Po této jednoduché definici incidenčních matic jenom připomeneme, že do našeho grafového prostoru budou patřit i obě kvadratické formy incidenčních matic a G (STS, SST, GTG a GGT) a také kombinace typu STG a GTS.

Pro jednoduchost můžeme nejprve definičně připustit, že se každá hrana může v incidenčních maticích objevit pouze jedenkrát. Tak dostaneme prosté grafy. Opět se budeme zabývat kombinatorickými problémy, jako je počet různých grafů s n vrcholy a m hranami. Tento problém bude jednodušší, když si vrcholy označíme. Neoznačené grafy vytvoří v novém prostoru orbity a jejich počty se musí složitě určovat. Obecně jsou problémy spojené s enumerací grafů mnohem složitější než klasické kombinatorické

Úplné grafy Kn mají podobu plošných simplexů. N vrcholů je spojeno hranami se všemi ostatními hranami.

Jako kanonický tvar incidenčních matic Sn úplných grafů Kn zvolíme ten, který odpovídá postupnému přidávání vrcholů a hran k menším grafům:

Sn- 1

0

In-1

J

kde 0 je nulový vektor sloupec, I je jednotková diagonální matice a J je jednotkový vektor sloupec.

Incidenční matice Sn a Gn úplných grafů Kn, které mají n sloupců a n(n- 1)/2 řádků, jsou důležité operátory, které zobrazí n(n-1)/2 rozměrnou čtvercovou matici M na čtvercovou matici jen n rozměrnou:

STMS nebo GTMG.

Každý prvek matice M se objeví v matici STMS nebo GTMG dvakrát. Jednou na diagonále, podruhé jako mimodiagonální prvek, který je kladný u matice GTMG a záporný u matice STMS.

Vedle těchto matic je možné grafům přiřadit i tak zvané Petrieho matice.

Na závěr si dovolím jednu otázku. V Athénách bylo zvykem se při filozofických disputacích procházet. Jak jsem uvedl, základy teorie grafů jsou názorné a elementární. Proč nenapadlo athénské matematiky zabývat se grafy? Co jim chybělo, aby přišli na základy této teorie? Těch sedm mostů z Královce, nebo to bylo něco jiného?

Literatura

Kunz M.: Psychoenergetika nebo psychoenergetismus?, Čas. Lék. čes., 118, 1979, 1592-1955.

Sedláček J.: Úvod do teorie grafů, Akademia, Praha, 1981.

M. Kunz: Path and walk matrices of trees, Coll. Czech. Chem. Commun., 54 (1989) 2148- 2155.

M. Kunz: A Moebius inversion of the Ulam subgraphs conjecture, J. Math. Chem., 9 (1992) 297-305.

M. Kunz: Inverting Laplace-Kirchhoff matrices from their roots, J. Chem. Inform. Comput. Sci., 1996, 36, 822-824.

M. Kunz: Distance matrices yielding angles between arcs of the graphs, J. Chem. Inform. Comput. Sci., 34, (1994) 957-959.

 

9. Enumerace grafů

Enumerace je ošklivé slovo pro zajímavý problém počítání různých objektů, samozřejmě i grafů. V tomto případě znamená počítání všech různých možností existence grafů různě definovaných. Je to poměrně mladý obor teorie grafů (1) a podnětem pro jeho rozvoj byly z počátku praktické problémy chemie.

Existují různé chemické sloučeniny se stejným zastoupením základních atomů a stejným souhrnným vzorcem, které se liší svou strukturou, tedy tím, jak jsou atomy v molekule uspořádány. Takovým sloučeninám se říká isomery. Určitou výhodou při hledání počtů isomerů, jak se takovým sloučeninám říká, je omezení vaznosti atomů, které isomerní sloučeniny tvoří, nejčastěji na čtyři vazby u sloučenin uhlíku, kde je tento problém nejčastější. Toto omezení však na druhé straně může komplikovat nalezené matematické vztahy, místo obecně platných vzorců je třeba hledat specifické tvary.

Počty isomerů se nejprve zjišťovaly jednoduchým postupem, badatel si kreslil všechny možnosti, jak kombinovat atomy, a po nalezení všech isomerů pro počátky různých řad se pokoušel nalézt pravidelnosti v rozvoji řad a potom je dokázat. Tento postup je stále aktuální, jen se do podobného hledání zapojují počítače.

Podobně jako v klasické kombinatorice, existují při počítání počtů grafů různé možnosti, jaké prvky grafu budeme považovat za rozlišitelné či shodné.

Základem jsou počty různých grafů, u nichž ani vrcholy, ani hrany nejsou nijak označeny. Tyto počty odpovídají orbitám v přirozeném vektorovém prostoru, rozkladům čísla m na n sčítanců. Číslo n je počet vrcholů grafu. Číslo m představuje počet hran nebo jinak chemických vazeb. Vzhledem k tomu, že u každého vrcholu počítáme většinou všechny incidentní hrany, počítá se každá hrana dvakrát a proto číslo m je v tomto případě dvojnásobek skutečného počtu hran. U orientovaných grafů se můžeme zajímat zvláště o počty orientovaných hran vcházejících a vycházejících z jednotlivých vrcholů. Takovým grafům se říká turnaje, protože znázorňují vztahy mezi účastníky turnajů.

Součet počtu incidentní hran u jednotlivých vrcholů je vždy sudé číslo. Na jednom rozkladu může být umístěno více různých grafů. Tak třeba rozklad (2, 2, 2, 2, 2, 2) může znamenat jeden cykl délky 6, nebo dva cykly délky 3, pokud uvažujeme jen prosté grafy (s jednoduchými vazbami).

Další možnosti počítání různých kombinací jsou grafy, u nichž jsou označeny buď vrcholy nebo hrany, nebo oba prvky. Při tom označení může být úplné, ke každému prvku se přiřadí zvláštní symbol, nebo částečné, kdy vždy několik prvků má stejné označení (různé chemické prvky).

Pro částečné značení se někdy užívá pojem barvení grafu. Tak třeba se můžeme pokusit označit vrcholy grafu dvěma (případně třemi a více) barvami takovým způsobem, aby nikdy dva vrcholy se stejnou barvou neměly společnou hranu, jinak řečeno, aby spolu nesousedily. Pokud se nějaký graf podaří takto označit, říká se mu potom dvojdílný (trojdílný atd.). Takové grafy mají určité specifické vlastnosti.

Problém značení hran barvami je znám také jako problém map, protože u rovinného grafu udává nejmenší počet potřebných barev pro vybarvení grafu, aby se nikdy nesetkaly dvě různá území se stejnou barvou.

Některé příklady

Nejjednodušším případem enumerace grafů je nalezení počtu prostých grafů s indexovanými vrcholy. V tom případě jsou všechny hrany rozlišitelné a stačí jen hledat možnosti, kolika způsoby lze vybrat k objektů (hran) z n(n - 1)/2 objektů. Tyto možnosti jsou dány binomickými koeficienty (viz 1, 2) takže počty všech takto označených grafů jsou mocniny čísla 2.

Dalším jednoduchým případem je enumerace stromů s indexovanými vrcholy. Strom s n vrcholy má (n-1) hran.

Důkaz našel Prüfer. Stromy se algoritmicky osekají na základní větev se dvěma vrcholy a postup osekávání určuje označení stromu: Každý strom má alespoň dva listy, což jsou vrcholy s hodnotou 1. Vybere se list s nejnižším indexem, odsekne se a poznamená se index vrcholu, ke kterému byl odseknutý list připojen. Tak se postupuje k posledním dvěma vrcholům. Dostanou se všechny posloupnosti n symbolů délky (n-2).

Příklady: Hvězda S(5) s kořenem 3 dá posloupnost 3,3,3. Lineární řetězec L(5) 1-5-4-3-2 dá posloupnost 5, 3, 4, protože nejprve odsekneme vrchol 1 připojený k vrcholu 5, potom vrchol 2 připojený k vrcholu 3 a nakonec vrchol 3 připojený k vrcholu 4. Řetězec 2-1-4-3-5 dát podobně posloupnost 1, 4, 3.

Stromy můžeme také spočítat podobně jako naivní matice, když vezmeme v úvahu, že počet hran u všech vrcholů je (2n-2), přičemž n jednotek je vázáno podmínkou vaznosti stromu, takže jen (n- 2) jednotek je volných pro rozdělování. Zde je nevýhodou, že na jednotlivých orbitách se počítají různé stromy.

Zde pro zajímavost můžeme zmínit obrácený postup, že se naivní matice N mohou rozšířit na incidenční matice grafu G nebo S, tím, že k naivní matici N přidáme jako blok jednotkovou diagonální matici I. Takové incidenční matice jsou matice hvězdných lesů, kde kořeny jednotlivých stromů jsou představované n symboly a jednotlivé výskyty symbolů jsou listy stromu (2).

Pokud se budeme zabývat enumerací grafů hlouběji, pak můžeme vycházet ze základního schématu, které jsme použili u naivních matic. Matice se násobí zprava i zleva jednotkovými permutačními maticemi potřebného rozměru (n zprava a m zleva) představujícími symetrické grupy S(n) a S(m). Postačí násobení jen představiteli jednotlivých podgrup. Pokud hrany nejsou označeny, násobení grupou S(m) je nadbytečné a postačuje jen násobení grupou S(n).

Po provedení všech násobení se najdou počty rozlišitelných výsledků. Tento počet ukazuje symetrii daného grafu představovaného maticí sousedství grafu G (neorientovaný graf) a S (orientovaný graf). V obou maticích jsou v každém řádku dva jednotkové prvky, u orientovaného grafu jeden z nich má kladné a druhý záporné znaménko. Vzhledem k tomu nejsou výsledky násobení zcela nezávislé, ale jedná se o spletenec grup symetrie.

Nebo se problém pokusíme vysvětlit jinak. Permutace n sloupců působí na hrany grafu, což je až n(n-1)/2 prvků. Délka cyklu však nemůže být větší než n. To vede k tomu, že symetrie grafu je omezená jen na některé prvky grupy S(n(n-1)/2). Nesmí obsahovat cykly delší než s n prvky a také cykly s délkou, která není dělitelem n.

Výsledky násobení lze předvídat, protože byla odhalena pravidla určující výsledky násobení. Zasloužili se o to v třicátých letech dva matematici, Polya (3) a Redfield (4). Redfield měl smůlu. Jeho prvá práce zcela zapadla, druhou se mu vůbec nepodařilo uveřejnit. Redfieldovy články byly znovu objeveny a jejich význam oceněn až po padesáti letech.

Odhalení těchto vztahů umožnilo použít pro enumeraci grafů podobné vztahy jako pro enumeraci prvků grupy.

Dosazení do těchto vztahů opět není zcela jednoduché, ale dává po vyčíslení požadované počty neznačených grafů.

Literatura

1. F. Harary, E. M. Palmer, Graphical Enumeration, Academic Press, New York, 1973.

2. M. Kunz: Entropies and information indices of star forests, Coll. Czech. Chem. Commun., 51 (1986) 1856-1863.

3. F. Harary, E. M. Palmer, R. W. Robinson, R.C. Read: Polya‘s contribution to chemical enumeration. V: Balaban AT (Ed.) Chemical applications of graph theory, Academic Press, New York, str. 1211.

4. E. K. Lloyd” Redfield‘s papers and their relevance to counting isomers and isomerisation, Discrete Appl. Math., 19 (1988) 289-304.

 

10. Vlastní hodnoty a vlastní vektory matic

V této kapitole se dostáváme k oblasti, kterou můžeme označit za obtížnou. Její obtížnost je hned dvojího druhu, technická a koncepční.

Technické nesnáze spojené s výpočty vlastních hodnot a vlastních vektorů matic větších rozměrů než tři jsou veliké a s opravdu velkými maticemi i počítače mají mnoho práce. Technické potíže s výpočty však vedly k objevení řady zajímavých vztahů umožňujících výpočty vlastních hodnot některých typů matic jednoduchými triky. Tyto triky jsou však založeny na hlubokých souvislostech.

Koncepční nesnáze jsou dány tím, že se jedná o vztahy skryté až tajemné. Podobně jako kapky deště rozkládají sluneční světlo na spektrum světel různé vlnových délek, které se nám objeví jako duha, tak vlastní hodnoty tvoří spektrum matice. Přirovnání může má hlubší smysl. Na konci duhy se prý skrývá poklad, spektra matic jsou často klíčem pro řešení vědeckých a technických problémů. Chvění hudebních nástrojů a technických konstrukcí, jako jsou mosty, je příkladem, kdy vlastní hodnoty přímo vnímáme, aniž bychom je museli počítat. U hudebních nástrojů slyšíme tóny, u technických konstrukcí může kmitání vést k destrukci staveb. I naše těla jsou vlastně konstrukcemi plnými kmitů molekul.

Podobně jako se fyzikové nespoléhají na náhodný vznik duhy, ale používají k rozkladu světla hranoly, tak se i matematikové naučili rozkládat matice, nebo je upravovat na průzračný tvar.

Permanent a determinant

Matice s m řádky a n sloupci obsahuje nm prvků. Na šachovnici můžeme umístit figury šachové hry podle určitých pravidel, třeba lze řešít úlohu, aby se koně vzájemně neohrožovali. Analogicky můžeme vybírat prvky matice, třeba aby nenulové prvky matice nebyly ve stejném sloupci.

Při výpočtu permanentu vybíráme v každém řádku matice jeden prvek a ten násobíme prvkem v dalším řádku, ale jiném sloupci. Pokud je matice čtvercová, potom existuje n! takových součinů. Tyto součiny jsou permutace prvků matice. Součet všech permutací se nazývá permanent.

Existuje celá teorie permanentů, kdy se hledají permanenty různých typů matic. V některých případech jsou výsledky shodné s klasickými kombinatorickými identitami.

Jen pro ukázku několik jednoduchých matic:

Matice

(1 1 1)

Permanent je 3, součet 1 + 1 + 1 = 3.

Matice

(1 2 3)

Permanent je 6, součet 1 + 2 + 3 = 6.

Matice

1

1

1

1

1

1

Permanent je 6, poněvadž součet má šest jednotkových členů. Prvek (1,1) se kombinuje s prvky (2,2) a (2,3).

Matice

1

1

1

1

1

1

1

1

1

Permanent je opět 6. Počet členů permanentu se už proti předešlému příkladu nezvětšil. Prodloužení řetězce ze dvou prvků na tři nemá vliv na výsledek vzhledem k jednotkovým hodnotám prvků.

Matice

1

2

3

1

2

3

Permanent je 22, součet je dán prvky 1*2 + 1*3 + 2*1 + 2*3 +3*1 3*2.

Matice

1

2

3

3

2

1

Permanent je 26.

Matice

1

2

3

2

1

3

Permanent je 23.

V posledních třech případech uspořádání prvků v matici má vliv na hodnotu permanentu. Pokud by matice obsahovala záporné prvky, může být hodnota permanentu i nulová či záporná.

S permanentem souvisí úzce jiná charakteristika matice, její determinant. Determinant má mnohem větší praktický význam. Determinant se počítá podobně jako permanent, pouze s tím rozdílem, že polovina permutací prvků dostane záporné znaménko podle inverzního pořadí násobení prvků. Pokud matice není čtvercová, determinant je automaticky nulový. To si můžeme vysvětlit tak, že si představíme matici rozšířenou na čtvercovou o nulové prvky. Ty se objeví v každém členu součtu tvořícího determinant, takže součet je nulový. Determinant matice (2,2) s prvky

a

b

c

d

 je rozdíl součinů ad - bc.

Determinant matice (3,3) s prvky

a

b

e

c

d

f

g

h

i

je rozdíl adi + bfg + ech - afg - bci - edg. Pro jeho výpočet existuje technická úprava matice jejím rozšířením o dva řádky, aby se snadněji odečetly všechny prvky a b e

a

b

e

c

d

f

g

h

i

a

b

e

c

d

f

Šikmo odečítané prvky zleva doprava jsou kladné, šikmo odečítané prvky zprava do leva jsou záporné.

Hledání determinantů matic větších rozměrů byla před zavedením počítačů zdlouhavá matematická operace vyžadující značnou technickou zručnost při hledání faktoriálně rostoucího počtu prvků determinantu. Ani dnes nejsou výpočty determinantů velkých matic záležitosti pro běžné počítače.

Na druhé straně nalezení determinantu matic určitého typu může být zcela snadné. Nejsnadnější je to v případě, že matice je diagonální, protože potom rozvoj determinantu má pouze jeden nenulový člen. To platí i v případě, že matice má trojúhelníkový tvar.

Zjistilo se, že určité operace s maticemi, jako je přičtení některého řádku či sloupce k jiným, nemění hodnotu determinantu. Taková změna mění všechny kladné i záporné prvky determinantu stejným způsobem, takže se změny vzájemně vyruší. Těmito operacemi lze převést matici na trojúhelníkový tvar v méně krocích, než při hledání všech permutací. Proto je snazší výpočet determinantu tímto způsobem.

Determinant je důležitý pro další operace s maticemi, především pro otázku existence inversní matice k dané matici. Aby existovala inversní matice, nesmí být determinant nulový. Toto tvrzení však není zcela přesné.

I když je determinant nulový, mohou existovat zobecněné inversní matice, pokud ta “nulovost” není příliš hluboká. Abychom toto tvrzení mohli vysvětlit, musíme nejprve objasnit, co determinant vlastně je.

Charakteristický polynomiál

Matice jsou operátory působící na vektory, buď sloupce, nebo řádky v závislosti na tom v jakém pořadí se operace násobení provádí. K matici M můžeme přičíst nebo odečíst jinou matici. Pokud zvolíme jako tuto matici diagonální prvky x (xI), dostane se při výpočtu determinantu matice (xI - M) výraz obsahující mocniny prvku x od 0 do n, přičemž některé z nich mohou chybět, poněvadž se vynulují.

Pro shora uvedenou matici

a

b

c

d

má upravená matice tvar

x-a

b

c

x-d

a výsledek je (x -a)(x - d) - bc.

Pro matici

x-a

b

e

c

x- d

f

g

h

x- i

je výsledek (x -a)(x - d)(x - i) + bfg + ech - (x- a)fg - bc(x -i) - e(x -d)g. Po provedení všech naznačených operací se dostane výraz obsahující různé mocniny x. Tento polynom se nazývá charakteristický polynomiál. Pokud tento charakteristický polynomiál položíme rovný nule, lze vzniklou rovnici n-tého stupně řešit nalezením hodnot x, které rovnici vyhovují. Tyto hodnoty jsou známy jako vlastní hodnoty matice.

V případě matice

2

1

1

2

je charakteristický polynomiál x2 - 4x -3. Ten lze rozložit na součin (x -3)(x -1) a vlastní hodnoty dané matice jsou 3 a 1.

Tento příklad umožňuje najít vlastní hodnoty přímo. Matici lze rozložit na jednotkovou matici a jednotkovou diagonální matici. Vlastní hodnoty tohoto součtu jsou rovné součtu vlastních hodnot matic součtu. Jednotková matice má jednu nenulovou vlastní hodnotu rovnou rozměru matice, tedy její spektrum je 2, 0. K tomu se přičtou vlastní hodnoty jednotkové diagonální matice 1, 1.

Součet vlastních hodnot se rovná stopě matice (součtu diagonálních prvků matice) a součin vlastních hodnot se rovná determinantu matice.

Vlastní vektory

Vlastní vektory jsou vektory, pro které daná matice působí jako skalár, což znamená, že při násobení určité matice jejím vlastním vektorem matice násobí každý prvek vlastního vektoru vlastní hodnotou

V posledním příkladě jsou základem vlastních vektorů hodnoty (1, 1) a (-1, 1), protože 2x1 + 1x1 = 3 i 1x1 + 2x1 = 3 a 2x(-1) + 1x1 = -1 a 1x(-1) + 2x1 = 1. Použil jsem výraz základ vlastních vektorů, protože na vlastní vektory je kladena další podmínka, jejich skalární součin musí být rovný 1, takže oba vektory musíme dělit odmocninou ze dvou.

Takové normalizované vlastní vektory promění svou vlastní matici, pokud ji sevřou do skalárního součinu v diagonální matici vlastních hodnot. Lze tedy přirovnat matice vlastních vektorů ke krystalům dvojlomného vápence, které brání průchodu polarizovaného světla, ale při správném nastavení polarizovaného světlo (spektrum) propouštějí.

Pokud matice M není čtvercová, mají podobný význam jako vlastní hodnoty hodnoty singulární, což jsou vlastní hodnoty vnitřních a vnějších skalárních součinů MMT a MTM. Pokud matice M je symetrická, pak jsou oba skalární součiny MMT a MTM shodné a singulární hodnoty jsou druhé mocniny vlastních hodnot matice M. Tím jsme vlastně prozradili další pravidlo, vlastní hodnoty mocnin matic jsou příslušnými mocninami vlastních hodnot. Tento vztah lze využít i pro výpočet vlastních hodnot některých matic.

Vnitřní skalární součin jednotkového sloupce J je n. To je singulární hodnota tohoto sloupce a také jediná nenulová hodnota matice tvořené samými jednotkami, což je vnější skalární součin jednotkového sloupce J.

Pokud k matici přičteme nebo od ní odečteme nějaký násobek k jednotkové diagonální matice I, potom se změní všechny vlastní hodnoty o tuto hodnotu k.

Počítačové programy často vypočítají vlastní hodnoty současně s vlastními vektory.

Jak jsme se už zmínili, někdy lze vypočítat vlastní hodnoty zcela jednoduchými postupy. Zvláště v případě, kdy řešená matice je vnitřním nebo vnějším skalárním součinem incidenční matice orientovaného grafu S, pak pro výpočet vlastních hodnot lze použít celou řadu vztahů, které zdánlivě nemají s maticí nic společného.

Skalární součin STS je znám jako Laplace-Kirchhoffova matice. Samotné pojmenování napovídá, že takové matice nalézají uplatnění v nebeské mechanice (Laplace) a v elektrotechnice při výpočtu elektrických obvodů (Kirchhoff). A největší uplatnění nalezly v chemii, kde se ukázalo, že fyzikální vlastnosti molekul odpovídají maticím tyto molekuly popisujících, ať jsou to přímo Laplace-Kirchhoffovy matice, nebo její mimodiagonální části, matice sousedství.

Skalární součin Laplace-Kirchhoffovy matice STS má tvar (V - A), kde V je diagonální matice registrující počet hran sousedících s vrcholy j a A je matice sousedství, ve které nenulové prvky ukazují počet hran spojujících dva vrcholy (při tom není nutné, aby tyto prvky byla celá čísla, postačující podmínka je, aby součty prvků matice v řádcích a sloupcích byly nulové).

Charakteristický polynomiál matic sousedství acyklických grafů (bez cyklů a smyček) se počítá velmi snadno (pokud graf není příliš veliký, pak se opět objeví technický problém). Najdou se všechny možné obrazce jednotlivých hran, nesousedících dvojic hran, trojic hran a tak dále. Tyto počty se střídavými znaménky plus a minus tvoří koeficienty u sudých mocnin x (v případě grafů se sudým počtem vrcholů) nebo u lichých mocnin x (v případě grafů se lichým počtem vrcholů).

Tak u lineárního řetězce se čtyřmi vrcholy a třemi hranami jsou to tři hrany a jedna dvojice, u lineárního řetězce se šesti vrcholy a pěti hranami je to pět hran, šest dvojic a jedna trojice.

U grafů s cykly se takto vypočtený acyklický polynomiál musí opravit koeficienty počítajícími dvakrát počet všech cyklů různých délek.

U jednoduchých cyklů charakteristický polynomiál matic sousedství má jednoduchý tvar

xn -1 = 0.

Hledání vlastních hodnot se změní na problém řešení tohoto typu rovnic pomocí substitucí, vedoucí k součtu sinu a kosinu.

Matice sousedství prostých grafů mají nulovou diagonálu. Na diagonále se však může zaznamenávat existence smyček. Charakteristický polynomiál matic sousedství grafů se smyčkami se dá vypočítat podobně jako u prostých grafů. Smyčky tvoří obrazce samostatně jako hrany, avšak také obrazce v kombinaci s hranami. Počet jednoduchých smyček se objeví jako koeficient u vynechané mocniny x, kombinace smyčky s jednou hranou u další vynechané mocniny x.

Vzhledem k tomu, že Laplace-Kirchhoffova matice STS má tvar (V - A), a jak jsme řekli, pokud diagonální matice V má všechny hodnoty stejné, existuje vztah mezi vlastními hodnotami této matice a vlastními hodnotami matice sousedství. Vztah je jednoduchý v případě pravidelných grafů, kde všechny vrcholy mají stejnou hodnotu incidence.

Laplace-Kirchhoffovy matice STS úplných grafů mají hodnotu diagonální matice V (n - 1). Mimodiagonální prvky jsou -1. To je stejné, jako kdyby hodnota diagonální matice V byla n a od této matice se odečetla čtvercová jednotková matice. To dá (n-1) vlastních hodnot rovných n a jednu nulovou vlastní hodnotu. A podobně jako se úplný graf rozštěpí na dvojici komplementárních grafů, tak se rozštěpí spektrum úplného grafu.

Jednoduchý příklad:

Matice

1

-1

0

-1

2

- 1

0

-1

1

má vlastní hodnoty 3, 1, 0. Matice

1

0

-1

0

0

0

-1

0

1

má vlastní hodnoty 2, 0, 0. Po příslušném přiřazení vlastních hodnot se dostane součet 3, 3, 0, což je spektrum matice

2

-1

-1

-1

2

- 1

-1

-1

2

Důkaz tohoto tvrzení je založen na vlastnostech zobecněných inverzních matic. Matici komplementárního grafu lze získat snadno ze znalosti zobecněné inverzní matice.

Roubování stromů a rekonstrukce charakteristického polynomiálu

U matic sousedství stromů lze při hledání charakteristického polynomiálu použít techniku roubování. Při přidání nového listu je charakteristický polynomiál součtem součinu charakteristického polynomiálu původního stromu násobeného členem x a charakteristického polynomiálu původního stromu osekaného o všechny větve sousedící s vrcholem, ke kterému byl list přidán. Takové osekání odstraní z matice grafu i-tý sloupec a řádek (sloupec z matice incidence), což lze považovat za diferenci příslušného grafu a jeho matice.

Tyto diference grafu jsou známy jako Ulamovy podgrafy. Ulam vyslovil domněnku, že ze znalosti všech takových podgrafů lze rekonstruovat původní graf. Pokud nejsou vrcholy označeny, tak to není u velkých grafů snadná záležitost. Velkým problémem je identifikace vrcholů v různých podgrafech.

Rekonstrukce charakteristického polynomiálu ze znalostí charakteristických polynomiálů všech Ulamových podgrafů je však snadná operace. Charakteristické polynomiály všech Ulamových podgrafů se jednoduše sečtou a výsledek se považuje za diferenciál charakteristického polynomiálu vytvořený podle pravidel diferenciace. Člen nx(n- 1) diference odpovídá původnímu členu xn atd.

U stromů lze provést rekonstrukci polynomiálů i pro diferenciaci podle hran.

Existuje ještě řada dalších pravidel a vztahů, které lze využít pro výpočet nebo odhad charakteristických polynomiálů. Tak třeba matice sousedství linkových cyklických grafů (graf tvořený mimodiagonálními prvky matice SST) obsahují vlastní hodnoty -2, aby se eliminovalo (m - n) diagonálních prvků matice SST s hodnotou 2.

Nejobecnější metodou výpočtu charakteristických polynomiálů je technika, jejímiž autory jsou La Verrier, Frame a Fadějev. Tito matematikové žili v různých dobách. To svědčí o tom, že tato technika byla znovu objevena, zapomenuta a znovu objevena několikrát.

Metoda spočívá v opakujícím se odečítání stopy matice nebo jejích násobků a násobení takto získaných matic původní maticí. Stopa matice se rovná součtu vlastních hodnot a v násobcích se násobí každá vlastní hodnota těmito součty. Postupně se tak dostávají součiny dvojic, trojic a obecně n-tic vlastních hodnot a rekonstruuje se charakteristický polynomiál.

Literatura

K. Balasubramanian, Computer generation of distance polynomials of graphs, J. Comput. Chem., 11 (1990) 829-836.

D. Cvetkovic, M. Doob, H. Sachs, Spectra of Graphs, Deutcher Verlag der Wissenshaften, Berlin, 1980.

Trinajstic, N. The Characteristic Polynomial of a Graph. J. Math. Chem., 1988, 2, 197- 215.

 

11. Inverzní matice

Moebiusova inverze

O německém matematikovi Moebiusovi jste asi slyšeli jako objeviteli plochy, která má jen jednu stranu. Vezměte dostatečně dlouhý proužek papíru, zkruťte jej o 180 stupňů a slepte jeho konce, takže dostanete jakousi obruč.

Proužek měl původně dvě strany. Zkuste si označit jednu stranu slepeného proužku čarou jdoucí středem pásku a zjistíte, že se čára uzavře, Moebiusův pás má jedinou stranu. Když proužek podél čáry rozstřihněte, dostanete dva spletené kruhy.

Dá se dlouho spekulovat, co by se třeba mohlo stát, kdyby Vesmír, ve kterém žijeme, měl topologii podobnou Moebiusovu pásu.

My se teď nebudeme zabývat tímto problémem, ale dalším Moebiusůvým objevem, který má velmi podobné vlastnosti. Jsou to dvě funkce, z nichž jedna je inverzí druhé, takže je vlastně nelze oddělit protože existují současně. Podobnost existuje i v tom, že se také dostanou “rozstřižením”, i když se tohle rozstřižení technicky provádí jinak, “rozstřižené” části se naopak spojují, v tomto případě se dvě maticové funkce se spojují v diagonální pás, ve kterém jsou samé jednotky.

Nejprve trochu impertinentní otázku: Víte co je to Erastothenovo síto?

To síto je primitivní zařízení na rýžování prvočísel. Na Erastothenovo síto se vysypou přirozená čísla a když číslo sítem propadne na dno, jedná se o prvočíslo.

Technicky je konstrukce Erastothenova síta velmi jednoduchá.

Je to matice E, jejíž prvky e(ij) jsou 1, pokud číslo i dělí číslo j a 0, jestliže j není beze zbytku dělitelné číslem i.

Prvý řádek síta jsou samé jednotky a samé jednotky jsou také na diagonále matice, která představuje dno síta. Tak tedy

1

1

1

1

1

1

1

1

1

1

0

1

0

1

0

1

0

1

0

1

0

0

1

0

0

1

0

0

1

0

0

0

0

1

0

0

0

1

0

0

0

0

0

0

1

0

0

0

0

1

0

0

0

0

0

1

0

0

0

0

0

0

0

0

0

0

1

0

0

0

0

0

0

0

0

0

0

1

0

0

0

0

0

0

0

0

0

0

1

0

0

0

0

0

0

0

0

0

0

1

Čísla 1, 2, 3, 5 a 7 propadnou ze základní čáry na diagonálu, jsou to tedy prvočísla. Mezi jednotkami v prvém řádku není žádná nula, v druhém řádku je mezi jednotlivými jednotkami jedna nula, v třetím řádku jsou mezi jednotlivými jednotkami nuly dvě, v dalším řádku tři nuly a tak jsou mezery stále širší.

Teď najdeme matici, která při vynásobení s Erastothenovým sítem dá jednotkovou diagonální matici.

Tato matice má tvar

1

0

0

0

0

0

0

0

0

0

-1

1

0

0

0

0

0

0

0

0

-1

0

1

0

0

0

0

0

0

0

0

-1

0

1

0

0

0

0

0

0

- 1

0

0

0

1

0

0

0

0

0

1

-1

-1

0

0

1

0

0

0

0

-1

0

0

0

0

0

1

0

0

0

0

0

0

-1

0

0

0

1

0

0

0

0

-1

0

0

0

0

0

1

0

1

-1

0

0

-1

0

0

0

0

1

Na diagonále Moebiusovy matice jsou vždy jednotky, m(i=j) = 1. Dovedete odhalit způsob, jakým jsou v Moebiusově matici rozdělena čísla 1, -1 a 0 mimo diagonálu? Záporný jednotkový prvek musí být v prvém sloupci u prvočísel, aby se v prvém sloupci součinu vynulovaly dva jednotkové prvky v příslušném sloupci Erastothenova síta. Pokud je číslo j mocnina i, pak m(i1) = 0. Dále platí, že m(ij) = -1 pro prostý dělitel čísla i. Pro čísla, která jsou součinem dělitelů čísla i platí pravidla násobení, takže mohou mít obě znaménka podle toho, kolik dělitelů čísla i -1 se násobí.

Inverzní funkce

Připomenme si, že existují dva typy inverzních funkcí, additivní, kdy se jedná o součet dvou prvků

a + (-a) = 0

a multiplikativní, kdy se jedná o součin dvou prvků

a x (-a) = 1

Obecně těmito prvky mohou být i matice. Additivní inverzní matice je daná matice, jejíž všechny prvky mají opačné znaménko. Na našem příkladě Moebiusovy inverze jsme viděli, že u multiplikativní inverzní matice jsou vztahy složitější. Při násobení matic se prvky obou matic nejen násobí, ale současně sečítají, proto se většinou v inverzní matici matice, jejíž všechny prvky jsou kladné, objeví prvky záporné.

V některých případech může být inverzní matice totožná s danou maticí, pokud platí vztah

MM = I

kde I je jednotková diagonální matice. To znamená, že když násobíme matici stejnou maticí, najdeme její druhou mocninu a tato mocnina je jednotkovou diagonální maticí, potom jsou je inverzní matice totožná s danou maticí.

Už jsme se s takovými maticemi setkali, jsou to jednotkové permutační matice konvolucí (symetrické permutační matice), například:

0

1

0

1

0

0

0

0

1

Velmi zajímavými příklady samoinverzních matic je matice Pascalova trojuhélníku se střídavě kladnými a zápornými sloupci

1

0

0

0

1

-1

0

0

1

-2

1

0

1

-3

3

- 1

případně se střídavě kladnými a zápornými řádky

1

0

0

0

-1

-1

0

0

1

2

1

0

-1

-3

-3

- 1

Inverzní matice matice Pascalova trojuhélníku

1

0

0

0

1

1

0

0

1

2

1

0

1

3

3

1

má stejné hodnoty, pouze znaménka jsou rozdělena jinak

1

0

0

0

-1

1

0

0

1

-2

1

0

-1

3

-3

1

Pascalův trojuhélník je vhodným objektem i pro vysvětlení problému hledání inverzních matic u matic, které nemají trojúhelníkový tvar.

Pokud napíšeme Pascalův trojuhélník ve tvaru

1

1

1

1

1

2

3

4

1

3

6

10

1

4

10

20

víme, že se jedná o součin Pascalova trojuhélníka s transponovaným Pascalovým trojuhélníkem. Matici rozložíme na součin matic v trojúhelníkovém tvaru, k oběma členům najdeme inverzní matici a obě částečné inverzní matice vynásobíme. Jenom si musíme dát pozor na pořadí násobení. Podobně se dají rozkládat a obracet i některé jiné matice.

Pokud není matice symetrická, má odlišnou inverzní matici při násobení zprava od inverzní matice při násobení zleva.

Ne ke každé matici lze najít inversní matici. Základní podmínkou existence inverzní matice je existence nenulového determinantu. Ve spektru matice nesmí být nulové vlastní hodnoty, protože vlastní hodnoty inverzní matice jsou inverzemi vlastních hodnot původní matice a inverze nuly je nekonečno.

Nebudeme se zabývat technickými problémy řešení problému hledání inverzních matic, od toho přece máme počítače, ale budeme se zabývat některými zajímavými problémy, které pomáhají pochopit význam inverzních matic, protože mají zcela konkretní význam.

Matice cest

Kvadratická forma STS incidenční matice orientovaného grafu je známa jako Laplace- Kirchhoffova matice. O těchto maticích je známo, že mají jednu nulovou vlastní hodnotu.

Protože obě kvadratické formy STS i SST mají shodná spektra, potom kvadratická forma SST stromů s (n-1) sloupci a řádky nemá žádnou nulovou vlastní hodnotu a má tedy inverzní matici.

Abychom si zjednodušili práci a mohli pracovat s celými čísly, nebudeme hledat inverzní matici, ale její n-tý násobek.

Diagonální prvky kvadratická formy incidenční matice orientovaného grafu SST jsou vždy 2, mimodiagonální prvky jsou 0, pokud dvě orientované hrany nemají společný vrchol, 1, když orientované hrany se společným vrcholem mají opačnou orientaci nebo obě vycházejí ze společného vrcholu, a -1, když orientované hrany na sebe navazují.

Diagonální prvky inverzních matic W počítají, kolikrát se orientovaná hrana objevila ve všech cestách ve stromu, mimodiagonální prvky inverzních matic W počítají, kolikrát se orientovaná hrana i objevila ve všech cestách ve stromu společně s diagonální hranou j.

Pro lineární řetězce L(n) jsou inverzní matice postupně pro n = 4

3

2

1

2

4

2

1

2

3

pro n = 5

4

3

2

1

3

6

4

2

2

4

6

3

1

2

3

4

pro n = 6

5

4

3

2

1

4

8

6

4

2

3

6

9

6

3

2

4

6

8

4

1

2

3

4

5

Stopy matic (součty diagonálních prvků) jsou postupně (4), 10, 20, 35. Tato čísla jsou v chemii známa jako Wienerova čísla (záměrně jsem proto zvolil označení matic W). Harry Wiener byl skromný jmenovec známého Norberta Wienera. Ještě před druhou světovou válkou zjistil, že body varů alkanů (methan, ethan, propan, atd.) korelují se součtem všech vzdáleností (počty vazeb) mezi uhlíky alkanů.

Tento objev nejprve zapadl, později se však zjistilo, že má obecnější platnost. Wienerovo číslo bylo formálně spojeno se součtem prvků matice vzdáleností (o těchto maticích až příště). Tady se však objevilo jako stopa matice a tedy součet jejjích vlastních hodnot.

Vyvracení matic z kořenů

U některých matic důležitých pro techniku s jednou nulovou vlastní hodnotou neexistují inversní matice. Patří k nim Laplace- Kirchhoffovy matice. Laplace je spojil s mechanikou nebeských těles a Kirchhoff s elektrickými obvody, odpory v sítích a hledáním proudů protékajících mezi jednotlivými uzly sítě. Nevím, jak se dnes učí řešení tohoto problému na školách, ale za mých mladých let se hledaly počty stromů, na které je možné síť rozdělit.

Při tom existují dvě řešení problému.

Prvé bylo známo z teorie kódování, bez aplikace na teorii grafů, a platí přesně jen pro stromy. Je spojené s pojmem kořenu a u cyklických grafů se jedná o jakési náhradní a dílčí řešení.

U každého grafu můžeme si zvolit jeden jeho vrchol a posadit jej na tento vrchol, kterému se potom říká kořen. Pak můžeme značit cesty od kořene ke všem ostatním vrcholům v matici cest, jejímiž prvky budou 1, pokud vrchol leží v cestě mezi kořenem a vrcholem i a 0 jindy. Samotný kořen ještě označíme v matici osamělou jednotkou.

Pro lineární řetězce bude příslušná matice W mít tvar

1

0

0

0

0

1

1

0

0

0

1

1

1

0

0

1

1

1

1

0

1

1

1

1

1

Invezní matice se najde velmi snadno, protože má méně nenulových prvků:

1

0

0

0

0

-1

1

0

0

0

0

-1

1

0

0

0

0

-1

1

0

0

0

0

-1

1

Pomineme-li prvý řádek, pak je to incidenční matice orientovaného lineární řetězce L(5). Když k této matici přidáme další hranu

1

0

0

0

0

-1

1

0

0

0

0

-1

1

0

0

0

0

-1

1

0

0

0

0

-1

1

1

0

0

0

-1

dostaneme jako kvadratickou formu STS zakořeněnou incidenční matici orientovaného cyklu C(4).

3

-1

0

-1

-1

2

-1

0

0

-1

2

-1

-1

0

-1

2

Při hledání invezní matice si úkol rozdělíme na dvě části. Nejprve si uvědomíme, že jednotkový vektor sloupec je vlastní vektor pro nulovou vlastní hodnotu nezakořeněné kvadratické formy STS cyklu C(4). Když shora uvedenou matici vynásobíme čtvercovou jednotkovou maticí, dostaneme jako produkt jednotkový prvý řádek, ostatní řádky budou samé nuly. K nim můžeme přidat inverzi podmatice, kterou jsme už řešili shora L(n) pro n = 4. Násobíme všechny hodnoty 4x:

4

4

4

4

4

7

6

5

4

6

8

6

4

5

6

7

Jednotkový řádek je zbytek kořenu, ale další tři řádky mimo prvý nulový sloupec jsou kvadratická forma SST lineárního řetězce L(4). Zbyla by nám po odstranění zakořeněného vrcholu.

Jedná se o tak zvaný Ulamův subgraf. Ulam vyslovil hypotézu, že ze všech n podgrafů vzniklých z grafu odstraněním jednoho vrcholu a s ním incidentních hran se dá rekonstruovat původní graf. Důkaz tohoto tvrzení je obtížný, ale bylo dokázáno, že součet charakteristických polynomiálů kvadratických forem STS všech n podgrafů je diferencí charakteristického polynomiálu původního grafu, takže se z nich dá původní polynomiál rekonstruovat podle pravidel integrace.

No a součet inverzních matic všech Ulamových podgrafů (příslušně upravený) dá pseudoinverzní matici původního grafu. Pseudoinverzní matice je to proto, že po vynásobení s původní maticí se nedostane jednotková diagonální matice I, ale součet této matice s maticí -1/nJJT, kde J je jednotkový sloupec.

V našem příkladě pro cykl C(4) je to 1/16 matice

10

4

2

4

4

10

4

2

2

4

10

4

4

2

4

10

Vraťme se ještě k matici diference cyklu C(4)

1/4

3

2

1

2

4

2

1

2

3

U elektrických obvodů diagonální prvky prvky můžeme interpretovat jako vodivosti sítě vzhledem k vrcholu 1. Za předpokladu jednotkových odporů mezi vrcholy sítě je odpor cesty 1-2 roven 1, odpor cesty 1-4-3-2 je roven 3, součet proudů je 1 + 1/3 = 4/3 a vodivost mezi vrcholy 1-2 je 3/4. Mezi vrcholy 1-3 je to 1/2 + 1/2 = 1.

Závěrečné poznámky

Existence pseudoinverzních matic sítí má velmi závažné důsledky nejen pro techniku, ale také pro řadu vědeckých oborů.

Laplace je znám jako zastánce determinizmu. Jestliže si představíme, že Vesmír přechází v každém okamžiku z jednoho stavu do druhého, pak lze tento přechod vyjádřit incidenční maticí S. K této matici si lze představit její kvadratické formy. Laplace-Kirchhoffovy matice má zobecněnou inverzi. Otázkou je, jak rychle se tato inverze vytváří a jak rychle působí vzdálené změny.

Literatura

M. Kunz: Path and walk matrices of trees, Coll. Czech. Chem. Commun., 54 (1989) 2148- 2155.

M. Kunz: A Moebius inversion of the Ulam subgraphs conjecture, J. Math. Chem., 9 (1992) 297-305.

M. Kunz: Inverting Laplace-Kirchhoff matrices from their roots, J. Chem. Inform. Comput. Sci., 1996, 36, 822-824.

Trinajstic,N. The Characteristic Polynomial of a Graph. J.Math.Chem., 1988,2,197- 215.

 

12. Matice vzdáleností

Úvod

Musím se přiznat, že si sám dost dobře nevím rady s výsledky, které jsem dostal. Všechno se zdálo být jednoduché a elementární, ale pak se to jaksi zvrtlo. Výsledky, které jsem dostal, odporují běžné zkušenosti. Na druhé straně pomáhají pochopit některé fyzikální zákonitosti. Ostatně posuďte sami.

V teorii grafů byla definována vzdálenost mezi vrcholy jako počet hran na cestě mezi nimi. Pokud graf je nespojitý, vzdálenost se považuje za nekonečnou. Tyto vzdálenosti se vynášely do matic, což zjednodušovalo zápis. Součty vzdáleností jsou známy v chemii jako Wienerovo číslo. Toto číslo koreluje velmi dobře s body varů alkanů (methan, ethan, atd.) i s některými dalšími fyzikálními vlastnostmi těchto uhlovodíků.

Pak však Chorvat Trinajstic se svými spolupracovníky [1] přišel s ideou, místo topologických vzdáleností dosadit do matic skutečné vzdálenosti mezi atomy (počítají se jen atomy uhlíku, vodíky se zanedbávají) a korelovat s fyzikálními vlastnostmi součty těchto geometrických vzdáleností. Poslal mi jednu z mnoha prací týkající se tohoto problému k recenzi. Já jsem trochu nevděčně - měl jsem od nich spoustu reprintů - začal šťourat do problému a aplikoval jsem na matice vzdáleností základní trigonometrický vzorec pro stanovení úhlů mezi stranami trojúhelníku, který by jste měli znát ze střední školy, a překvapeně jsem zjistil, že geometrickým analogem topologických vzdáleností jsou matice, ve kterých se vzdálenosti udávají ve čtvercích [2]. To zdánlivě odporuje naší zkušenosti, jak jsem poznamenal už v úvodu, na druhé ústraně však některé fyzikální veličiny, třeba gravitační nebo elektromagnetické pole, se mění lineárně se čtvercem vzdáleností.. Začněme však od začátku, což budou koordináty čtyř bodů, uspořádané jednou na přímce, pak na vrcholech třírozměrné krychle a konečně ve čtyřrozměrném prostoru.

Nejprve uspořádáme body na přímku

0

0

0

0

1

0

0

0

2

0

0

0

3

0

0

0

dále na čtyři vrcholy krychle

0

0

0

0

1

0

0

0

1

1

0

0

1

1

1

0

a konečně do čtyřrozměrného prostoru. Pro zachování jednotnosti jsme v předešlých maticích zapisovali také nulové sloupce:

1

0

0

0

0

1

0

0

0

0

1

0

0

0

0

1

K těmto maticím najdeme nejprve odpovídající kvadratické formy, pro prvou matici

0

0

0

0

0

1

2

3

0

2

4

6

0

3

6

9

pro druhou matici

0

0

0

0

0

1

1

1

0

1

2

2

0

1

2

3

V případě třetí matice je kvadratická forma identická s původní maticí.

V dalším kroku příslušné matice nejprve násobíme z obou stran, zleva incidenční maticí úplného orientovaného grafu S (dvě jednotky v každém řádku, se záporným znaménkem pro výchozí vrchol, a kladným znaménkem pro konec hrany) a transponovanou incidenční maticí úplného orientovaného grafu ST zprava. Dostaneme matici, na jejíž diagonále jsou vzdálenosti jednotlivých vrcholů, přesněji řečeno čtverce rozdílů původních koordinát.

Budou to postupně následující seřazené hodnoty

1, 1, 1, 4, 4, 9

1, 1, 1, 2, 2, 3

1, 1, 1, 1, 1, 1.

Tuto diagonální matici opět sbalíme násobením z obou stran incidenční maticí úplného orientovaného grafu S a transponovanou maticí v opačném pořadí. Dostaneme celkem tři různé matice. V jedné budou mimodiagonální prvky samé jednotky, to v případě umístění bodů na vrcholech pravidelného čtyřstěnu, v další matici se objeví vzdálenosti 1, 2, 3, to u bodů v krychli, a konečně se objeví vzdálenosti 1, 4, 9, pro přímku.

Mimodiagonální prvky ve velké matici ukazují prvky společné dané dvojici vzdáleností, což ukazuje kosinus úhlu mezi dvojicí prvků. Při trigonometrickém ověřování úhlů konfigurace souhlasí [3]. V prvém případě jsou úhly nulové, v druhém pravé a v třetím 60 stupňové a případně pravé u trojice protilehlých hran.

To však není vše, co svědčí o správnosti interpretace konfigurace.

Ukázalo se, že matice čtvercových vzdáleností mají tolik nenulových vlastních hodnot, jako je rozměr prostoru, ve kterém je těleso uspořádáno, v případě přímky dvě [4], u rovinných obrazců tři. Matice topologických vzdáleností mají všechny vlastní hodnoty nenulové. To znamená, že tyto vzdálenosti jsou definovány v n- rozměrném prostoru.

Problematika mocnin vzdáleností vede k zobecnění problému, studiu vlastností matic různých mocnin vzdáleností, větších než dva, tedy jejich momentů, a nejen mocnin kladných, ale i záporných. Nultá mocnina jakéhokoliv čísla je 1, nekonečná záporná mocnina je nula. Představte si čtvercový rám, jehož hrany jsou spojeny klouby, takže se čtverec dá v rovině libovolně deformovat na kosočtverec a z roviny na čtyřstěn. Deformace v ideálním případě mohou skončit přímkou, buď délky 2 při deformacích v rovině, či délky 1 při úplném sklopení čtyřstěnu. Delší vzdálenosti protilehlých rohů si musíme představit jako mocniny geometrických vzdáleností, nebo jako vzdálenosti v zakřiveném prostoru.

Takto lze považovat matice sousedství A za konečný výsledek takových transformací. Je zajímavé sledovat proměny vlastních hodnot při těchto transformacích [5].

U stromů mají matice topologických vzdáleností další vlastnost, jsou součástí pravé inverzní matice incidenční matice S spolu s transponovanou maticí. Jinak řečeno rámování matice topologických vzdáleností incidenční maticí S spolu s transponovanou maticí matici topologických vzdáleností diagonalizuje. To se využívá při studiu vlastností krystalů (Rutherford [6]).

Vzdálenosti mohou mít i jinou formu. Když si vezmeme lineární řetězec a obarvíme jeho vrcholy (místo barev můžeme použít symboly abecedy), potom se můžeme zajímat o rozdělení vzdáleností mezi stejně obarvenými vrcholy. To by byl model třeba pro rozdělení písmen v textech, nukleových kyselin a kodonů v RNA, či jakýchkoliv událostí v denním životě.

V matematice se takové rozdělení považuje za negativní. Lepší výraz by byl obrácené nebo inverzní. Jenomže když hážeme minci, tak řada výsledků hodů orel - hlava, nebo při jiném zápisu 0 - 1, je známa jako binomické rozdělení a rozdělení vzdáleností mezi stejnými výsledky je známé jako negativně binomické rozdělení. Ještě před takovými dvaceti léty bylo toto rozdělení kuriozitou, protože potřebné výpočty jsou značně zdlouhavé. Počítače tuto překážku odstranily a tak je možné provádět analýzu velmi rychle. A výsledky jsou velmi zajímavé .

Literatura

[1] N. Bogdanov, S. Nikolic, N. Trinajstic, On the three dimensional Wiener index, J. Math. Chem., 3 (1989) 299- 309.

[2] M. Kunz: On topological and geometrical distance matrices, J. Math. Chem., 13 (1993) 145- 151.

[3] M. Kunz: An equivalence relation between distances and coordinate matrices, MATCH, 32 (1995) 193- 203.

[4] M. Kunz: Distance matrices yielding angles between arcs of the graphs, J. Chem. Inform. Comput. Sci., 34, (1994) 957-959.

[5] M. Kunz: Transformations of distances into adjacencies. J. Serb. Chem. Soc. 62 (3) 277-287 )1997).

[6] J.S. Rutherford, Theoretical prediction of bond- valence networks, Acta. Cryst., B46 (1990) 289-292.

  

 

13. ZENONOVY GRAFY

Pro inteligentní veřejnost klasického Řecka to byl asi kulturní šok, když jim Zenon1,2 z Eley kolem roku 460 př. Kr. logicky dokázal, že rychlonohý Achilles není schopen dohonit ani želvu, pokud želva dostane nějaký náskok, protože než Achilles doběhne na místo, kde byla původně želva, ta se posune o kus dále a než Achilles doběhne o kus dále, želva se posune o kousek dále a než Achilles doběhne o kousek dále, želva se posune o kousíček dále a než Achilles doběhne o kousíček dále, želva se posune o kousičínek dále a než Achilles doběhne o kousičínek dále, želva se posune o kousičičínek dále a než Achilles doběhne o kousičičínek dále bude želva opět jinde a tak dále ad infinitum, s těmi čiči přestaneme, aby se neseběhly všechny kočky z okolí.

Studenti filozofie a matematiky1 jsou poučováni, že my dne tento paradox za nic podivného nepovažujeme, protože víme, že i součet nekonečné řady může být konečné číslo.

Není však na škodu se zamyslit, co vlastně chybělo starověkým učencům, aby dokázali paradox vyřešit technikou, kterou mistrně ovládali, to znamená geometricky.

Obr.1 Časová projekce rovnoměrného pohybu. Časová osa je normalizována, takže větší rychlost se jeví jako úhlopříčka a. Rychlost pomalejšího pohybu b je poloviční. Časové intervaly, označené kroužky, se stále zmenšují, takže ani jejich nekonečný počet nezabrání protnutí obou drah. Přímka c ukazuje situaci při startu ze stejné polohy (c = b).

Obrázek 1 ukazuje jednoduché řešení, které se nám dnes zdá tak primitivní, že si ani neuvědomujeme, že na něj lidstvo muselo dospívat dva tisíce let. Na obrázku jsou znázorněny normalizované dráhy obou borců. Želva je jen dvakrát pomalejší než Achilles, takže to představuje současně jinou eporii, dichotomii. Předpokládaný rovnoměrný pohyb ukazuje okamžik, kdy se dráhy obou borců protnou bez ohledu na to, kolikrát bychom lákali pomyslnou kočku. Mimo to je vynesena i dráha pomalejšího borce za předpokladu, že oba závodníci vyběhnou současně.

Základem grafu je schopnost představit si čas jako geometrickou veličinu kolmou na dráhu obou těles pohybujících se různou rychlostí. Tato představa se objevila téměř současně s nalezením součtu nekonečné geometrické řady.

Zenonova aporie se však objevila znovu v chemii.

Pokud se pozorný čtenář diví, proč co má Zenonova aporie společného s chemii, pak nemá, podobně jako starověcí učenci dost představivosti.

Exponenciální pohyb

Můj teoreticky založený kolega Rádl kdysi chtěl měřit rychlost monomolekulární reakce, byl však schopen sledovat pouze koncentraci produktu. Z monografie jsme se dozvěděli, že existuje jakási Guggenheimova3 metoda, popsaná v obskurním (alespoň pro nás) časopise. Pokusil jsem se metodu znovu objevit a výsledkem byl jednoduchý způsob, jak z řady koncentrací, stanovených v pravidelných časových intervalech (delta t) se dá vypočítat konstanta rychlosti monomolekulární reakce.

Obr. 2. Ortogonální projekce exponenciálního pohybu. Přímka b platí pro koncentraci produktu, přímka c pro koncentraci eduktu. Přímka d pro reverzibilní reakci, kdy se ustaví rovnováha na úhlopříčce a. Stejné časové intervaly, označené kroužky, se zmenšují jen zdánlivě .

Později jsem zjistil, že Guggenheimova metoda je založena na diferencích koncentrací, zatím co já jsem pracoval s podíly, a tak jsem metodu publikoval4. Brzo na to se objevily sofistikovanější varianty.

Koncentrace produktu (samozřejmě i eduktu) chemické reakce se sledují v pravidelných časových intervalech (delta t). Koncentrace produktu lze psát jako

Pi = E0(1 - exp(-kti))

Pi+1 = E0(1 - exp(-kti))(exp(-kD t)

Dosazením xj = Pi a yj = Pi+1 dostaneme rovnici přímky

yj = a + bxj

z jejíž směrnice se snadno vypočte konstanta reakční rychlosti. Podobnou přímku lze nalézt i pro edukt. Výhodou oproti Guggenheimově metodě, která pracuje s rozdíly koncentrací, je menší citlivost k experimentálním chybám jednotlivých stanovení.

Porovnáme-li obrázek 2 s obrázkem 1, pak kromě toho, že na obrázku 2 je ještě další přímka, jsou obrázky shodné. Rozdílný je ovšem význam obou os, na obrázku 2 jsou vynášeny proti sobě koncentrace v následujících časových intervalech, čas se objevuje jen jako následující body tvořící přímku.

Obrázek není možná tak atraktivní jako složité obrazce atraktorů při složitých oscilujících reakcích, avšak má proti nim jednu výhodu: je jednoduchý a umožňuje pochopit, co se vlastně stalo. Ortogonální transformace převedla exponenciální pohyb na rovnoměrný a zlogaritmovala místo koncentrací časovou osu. Časově ekvidistantní body se objevily na korelační přímce jako geometrická posloupnost. Vynášením koncentrací (P + delta P)/P, případně (E + delta E)/E jsme dostali 1 + delta log P. Rovnoměrný pohyb se stejným způsobem zobrazí jako přímka rovnoběžná s diagonálou.

Geometrická shodnost objevila moderní verzi Zenonovy aporie: Když se v čase delta t rozpadne polovina radioaktivních atomů, kdy se rozpadne poslední atom? S pravděpodobností hraničících s jistotou, abychom se vyjadřovali exaktně, by těch intervalů mělo být podle Zenona nekonečně mnoho a na rozdíl od jeho důmyslných hříček jsou stejně dlouhé, protože ortogonální transformace nemá na ně žádný vliv. Při ukládání radioaktivních odpadů se jeví tato aporie dost bezvýchodná.

Okamžik, kdy se radioaktivní atom rozpadne, nezávisí na tom, kolik má sousedů, ale na jeho vnitřním stavu, na energetických bariérách a podobných představách. Zásadně není vyloučeno, že rozpad není zvratná reakce, že z produktů by mohl za určitých podmínek vznikat edukt. V tom případě se ustaví rovnováha mezi produktem a eduktem, jako na obrázku 2 podle přímky c, kde je zachycena zvratná monomolekulární reakce. Její průběh závisí i na velikosti reakční soustavy. Těmito otázkami se zabýval podrobně v Chemických Listech Šolc5-7 (tři body do citačního skóre za zaslané separáty snad stačí, stejně jsem tomu sotva rozuměl).

Godelizovaný Zenon

Od atomů můžeme přejít opět k obecnějším problémům. Proč jsme neměli obrázek 2 s příslušným vysvětlením v učebnici matematiky a proč se v nich (aspoň v těch co znám) neobjevuje dodnes? Zenonovy aporie mohla vyřešit téměř najednou různými technikami, součtem nekonečné geometrické řady, analytickou geometrií, diferenciálním a integrálním počtem celá řada matematiků. Trvalo však dva tisíce let, než se narodili. Se mnou současně na problému pracovala řada autorů, pouze namátkou8-18, takže to byla jen náhoda, kdo si všimne tak jednoduchého triku. Ani dnes nejsou všechny problémy vyřešeny19.

Objevení grafické logaritmické diferenciace trvalo tak dvě stě let, pokud ovšem tato technika nebyla už dávno někde popsaná a nezapadla ve stozích nečtených archiválií. Jinak je to prý jen speciální případ Lieových grup.

Dalo by se říci, že problémy zrají k řešení jako radioaktivní jádra k rozpadu. Kdo pak problém rozlouskne jako první, je už druhořadé. Jsou popsány i případy čtyřnásobných koincidencí řešení jednoho problému20-23. Konkurence stimuluje vědeckou aktivitu, nutí pracovat rychle a systém grantů si vynucuje produkci publikovatelných výsledků. Současná věda pracuje systémem paralelních počítačů.

To vede k třetí verzi Zenonovy aporie. Brněnský rodák Godel poukázal na to, že podobně jako existují prvočísla, tak může existovat nekonečně mnoho axiomů nutných pro všeobecnou teorii24. Prvočísla mají stejnou mohutnost jako řada přirozených čísel, tak taková váha působila stejně přesvědčivě na moderní filozofy jako kdysi Zenonovy aporie..

Godel nevzal v úvahu, že součet nekonečné řady může být konečné číslo. Jestli se podaří vytvářet teorie stále rychleji, potom ani nekonečný počet axiomů nemusí být kritický.

Věda v posledních stoletích procházela obdobím exponenciálního růstu. Nasazení počítačů neuvěřitelně znásobilo výzkumné kapacity. Takovým způsobem, že sledovat nové informace přesahuje lidské schopnosti. Pokud se kdy podaří vytvořit univerzální teorii s nekonečným počtem axiomů, pak téměř určitě jejími tvůrci budou počítače. Únava z nadbytku vede k moudrosti. Člověk nemůže tu želvu, na jejíž nohách spočívají dle čínského mýty čtyři sloupy držící nebeskou klenbu25, dohonit a tak poznat tajemství vesmíru. Proto je lépe oddat se meditacím zenonového budhismu.

Literatura

1. Kolman A.: Dějiny matematiky ve starověku, Academia, Praha, 1968. Str. 96.

2. Znám Š., Bukovský L., Hejný M., Hvorecký J., Riečan B.: Pohľad do dejín matematiky, ALFA, Bratislava, 1986. Str. 60.

3. Guggenheim E. A.: Phil. Mag. 1, 538 (1926).

4. Kunz M.: Chem. Listy 75, 432 (1981).

5. Šolc M.: Chem. Listy 80, 561 (1986).

6. Šolc M.: Collect. Czech. Chem. Commun. 52, 1 (1987).

7. Šolc M.: Chem. Listy 85, 878 (1991).

8. Prater C. D., Silvester A. J., Wei J.: Chem. Eng. Sci. 22, 1587 (1967).

9. Aris R.: Ind. Eng. Chem. 61, 17 (1969)

10. Cleland R.L.: Anal. Chem. 42, 675 (1970).

11. Chen J. C. H., Huntsman W. D.: J. Phys. Chem. 75, 430 (1971).

12. Chen F. W., Fitzgerald T. J.: Ind. Eng. Chem. Process Res. Dev. 16, 59 (1977).

13. Ciurlizza Guizar A., Jimenez P. R. M.: Acta Mex. Cienc. Tecnol. 1975-1976 (Pub. 1978, 9-10, 3. (CA 92, 128184).

14. Ciurlizza Guizar A., Miranda T. V. M., Hernandez C. H.: Acta Mex. Cienc.Tecnol. 1975-1976 (Pub. 1978, 9-10, 13. (CA 92, 58026).

15. Connors K. A.: Anal. Chem. 49,1650 (1977).

16. Pytela O., Večera M., Vetešník P.: Chem. Listy 73, 754 (1979).

17. Leggett D. J.: Talanta 27, 286 (1980).

18. Bacon J.R., Demas J.N.: Anal. Chem. 55, 653 (1983).

19. Chrastil J.: Comput. Chem. 17, 103 (1993).

20. Hansen D. R., Shen M.: Makromolecules 8, 343 (1975).

21. Wang F. W., Di Marcio E. A.: Makromolecules 8, 343 (1975).

22. Stockmayer W. H., Kennedy J. W.: Makromolecules 8, 351 (1975).

23. Wang F. W.: Makromolecules 8, 364 (1975).

24. Thiele R.: Matematické důkazy. Str. 80, SNTL Praha, 1985.

25. Bodde D. v knize: Mytologie starověku (Kramer S., N., Ed.). Str. 324, Orbis, Praha, 1977.

 

14. Diferenciální rovnice

Staří Řekové byli velmi dobří geometři, ale přesto si nevěděli rady s aporeou, se kterou přišel Zenon. Tvrdil, že rychlonohý Achiles nemůže nikdy dohonit želvu, pokud tato má před ním náskok. Během doby, než Achiles doběhne na místo, kde byla původně želva, želva odleze o kus dále, než Achiles doběhne na místo, kam se želva přesunula, želva odleze o kousek dále, než Achiles doběhne na místo, kam se želva opět přesunula, želva odleze o kousíček dále, než Achiles doběhne na místo, kam se želva znovu přesunula, želva odleze o kousičičínek dále. Tak to půjde nekonečněkrát. Zkušenost ukazovala, že Zenonův závěr je chybný, avšak tehdejší matematika nedokázala nalézt řešení.

Řešení bylo jednoduché jako pověstné Kolumbovo vejce.

Především bylo potřeba si představit pohyb obou soutěžících jako geometrickou úlohu. To lze provést dvěma způsoby. Jeden vyžaduje konkretizovat pojem času a jeho plynutí.

Když užijeme prostředky, které měli tehdy lidé k dispozici, můžeme si čas si představit jako hladinu vodních hodin. Tady jsou také možné dva způsoby. Buď považujeme za počátek času plnou horní nádobu, ze které voda ubývá, nebo prázdnou dolní nádobu, do které voda přitéká. K těmto časovým hladinám se přiřadí poloha obou soutěžících na závodní dráze. Příslušné nákresy budou ve stejbém vztahu, jako zrcadlový obraz.

Úloha se promění v dvě čáry o různém sklonu. Čáry nemusí nutně být přimky, neběhá se stejnoměrnou rychlostí, ale přímky značně zjednoduší všechny úvahy a případné výpočty. Strmější přímka představuje Achilla, druhá přímka želvu.

Když se Achilles dostane na úroveň, kde byla původně želva, ta už je o kousek dále. Tuto úvahu si můžeme znázornit zakreslením rovnoběžek mezi obě čáry. Vytvoří mezi nimi jakýsi stupeň. Další stupeň bude menší a jak se čáry zbližují, tak se zmenšují i stupňě. Těch stupňů může být nekonečně mnoho, ale to nekonečno dá dohromady jen konečné množství vody. Důkazem je vzorec pro součet nekonečných řad. Nebo obráceně, důkazem platnosti vzorce pro součet nekonečných řad je geometrické znázornění Zenonovy aporey.

Spojení geometrie s aritmetikou a algebrou je vynález moderní doby. Jeho základem je rozbor následující tabulky

x

1

2

3

4

5

6

7

2.

1

2

3

4

5

6

7

3.

2

4

6

8

10

12

14

4.

4

6

8

10

12

14

16

5.

-1

-2

-3

-4

-5

-6

-7

Prvý řádek představuje osu x, další řádky různé případy osy y.

Pro druhý řádek zřejmě platí vztah

y = x

což se zdá být zbytečné. Vztah prvého a třetího řádku popisuje rovnice

y = 2x

která se u čtvrtého řádku mění ve vztah

y = 2x + 2

a konečně pátý řádek popisuje rovnice

y = -x.

Když si vyneseme souřadnice (x, y) do souřadných os a body spojíme přímkami, dostaneme přímky. Rovnice zřejmě platí nejen pro celá čísla, ale pro celé číselné osy, i racionální a irracionální čísla. Obecný tvar rovnice přímky je

y = ax + b

kde konstantě a se říká směrnice.

Vrátíme-li se k Zenonovu problému, pak pohyb Achilla i želvy popisují dvě rovnice přímek s různými konstantami a i b.

Pokud známe rychlost a obou závodníků i náskok želvy b, pak snadno vypočteme bod dráhy, kde se závodníci míjejí.

Nová aporea

V minulém století nás fysika postavila před novou formu Zenonova problému, radioaktivní rozpad. Zjistilo se, že se některé atomy rozpadají a vysílají paprsky alfa, beta a gama. Rychlost rozpadu má zajímavou vlastnost. Sledujeme- li určitý vzorek po následující konstantní časové úseky, pak se v nich rozpadne vždy polovina předešlého množství. Počet rozpadajících se atomů klesá a počet přeměněných atomů roste podle následujícího příkladu

Čas

0

1

2

3

4

5

6

7

8

Nerozpadlé atomy

256

128

64

32

16

8

4

2

1

Vzniklé atomy

128

192

224

240

248

252

254

255

?

Pokud si vyneseme uvedené údaje do grafu, musíme body proložit exponenciální křivku.

Nová aporea má formu odpovědi na otázku, kdy se rozpadne poslední radioaktivní atom v pozorovaném vzorku. Když budeme vzorek pozorovat další poločas, budeme mít poloviční naději, že se tak stane, po dvou poločasech tříčtvrtinovou naději, avšak úplnou jistotu nebudeme mít nikdy.

Problém však můžeme znázornit i graficky. Při tom zobrazíme vzorek na sebe, nebo jinak, postavíme počty nerozpadlých atomů (nebo vzniklých atomů) proti sobě tak, že na jednu osu budeme vynášet jejich počet v čase t, na druhou osu v čase (t+1), kde jednotka zastupuje časový interval, ve kterých rozpad sledujeme. Dostaneme rovnici přímky, kde se jednotlivé vynášené body budou k sobě blížit podobně jako v předešlém případě. Exponenciální rovnici jsme tak linearizovali.

Markovovy matice

Začátkem dvacátého století významný ruský matematik Markov (s iniciálami A. A., bylo jich stejného jména víc) ztrácel čas divnou zábavou: místo aby se kochal krásou Puškinových textů, počítal, kolikrát v nich po samohlásce následuje samohláska a kolikrát souhláska, a naopak, kolikrát v nich po souhlásce následuje souhláska a kolikrát samohláska.

Výsledky zanesl do tabulky, ve které se místo nalezených čísel objevily hodnoty poměrné, získané vydělením všemi možnostmi. Dostal tak tabulku, jako je například následující vymyšlený příklad

 

Samohláska

Souhláska

Samohláska

0,20

0,80

Souhláska

0,67

0,33

Podle tabulky přibližně po čtyřech z pěti samohláskek následuje souhláska, jinak souhláska, a po dvou souhláskách ze tří samohláska a jednou souhláska. Tabulku by bylo možné upřesnit pro všechny písmena abecedy, to by se dostala dost veliká matice.

Z tak prostého jádra se rozvinul během necelých celý specializovaný obor matematiky, teorie markovovských procesů.

Nejprve si ukážeme souvislost s předešlými příklady a současně nejdůležitější vlastnost markovovských matic.

Vezmeme si jednoduchou matici

0,5

0,5

0

1

a budeme s ní násobit zleva vektor sloupec (256, 0) T (je zapsán v transponovaném tvaru). Postupné výsledky jsou následující

128

64

32

16

8

4

2

1

0

64

96

112

120

124

126

127

Výsledek odpovídá příkladu s radioaktivním rozpadem. Markovovské matice jsou tedy exponenciálními operátory, které působí na vektory koncentrací.

Vektory koncentrací se většinou uvádějí jako poměrné, podíl atomů (nebo jiných prvků soustavy, jako v původním vzorku hlásek)jednoho druhu k celkovému počtu. Místo podílů však můžeme použít absolutní hodnoty, jako v našich příkladech.

Markovovské přechody potom odpovídají orientovaným grafům, přesněji řečeno orientovaným multigrafům (jsou přítomné paralelní hrany) se smyčkami (nedojde ke změně).

Markovovské matice mají všechny prvky kladné, zatím co kvadratická forma incidenční matice, Laplace-Kirchhoffova matice má mimodiagonální záporné.

Markovovský operátor je složený z operátoru změn, normalizované Laplace-Kirchhoffova matice a operátoru identity (jednotková diagonální matice), který vrací všechny prvky na jejich místo. Od tohoto operátoru musíme operátor změn odečíst.

Tento tvar má závažné důsledky. Jednotková diagonální matice má všechny vlastní hodnoty rovny jedné, Laplace-Kirchhoffova matice má jednu vlastní hodnotu nulovou, jejich součet má tedy jednu vlastní hodnotu rovnou jedné. Ostatní vlastní hodnoty jsou menší než jedna. Když se Markovovský operátor násobí, vlastní hodnoty se zmenšují, až zbude prakticky jediná vlastní hodnota, která odpovídá rovnovážnému stavu soustavy, na kterou operátor působí.

Soustava se nemusí k rovnovážnému stavu blížit po nejkratší dráze. Někdy se může blížit tak, že koncentrace oscilují, střídavě se zvětšují a zmenšují.

Abychom se vyhnuli odtažitým chemickým či fyzikálním příkladům, můžeme si vzít příklady z hospodářství, kolísání kurzů měn a akcií, krize z nadvýroby. Lidé špatně odhadnou budoucí potřeby a trvá jim dlouho, než na změny reagují.

Další aporea

Zenonova aporea má novou formu. Jedná se o hranice poznání a vyslovil ji brněnský rodák Goedel. Jestliže předpokládáme, že axiomatická teorie poznání má tolik axiomů, kolik je prvočísel, potom nebude nikdy úplná, vzhledem k nekonečnému počtu prvočísel.

Tento pesimistický pohled je moderní obdobou Zenonova tvrzení.

Goedel může mít pravdu, avšak jeho závěr nemusí platit.

Dosud se lidské poznání rozvíjelo exponenciální rychlostí. Prvý si toho všimnul Sola Price. Získal do své pracovny všechny ročníky odborného chemického časopisu Journal Chemical Society. Když přemýšlel, co s tímto danajským darem, všimnul si, že z počátku jednotlivé ročníky byly jen útlé svazky, které pomalu tloustly, až musely být svazovány do několika svazků. Přírustek objemu se dal vyjádřit exponenciální řadou. Toto pozorování o růstu informace se neustále potvrzuje, nejnověji údaji o růstu Internetu, nebo o růstu operační rychlosti či paměti počítačů.

Pokud bude vývoj pokračovat stejným tempem, pak ani nekonečnéný počet prvočísel nemusí být nepřekonatelnou překážkou při tvorbě teorie. Tu však nebudou vypracovávat lidé, ale stále rychlejší počítače.

 

15. Entropie

Úvod

Vyhledávač Google najde na internetu přes 900 odkazů na toto slovo, mezi nimi jména firem, radiové stanice a i website pána entropie. Slovo entropie se stalo populární pro svou tajemnost. Každý o něm slyšel a nikdo pořádně neví, co znamená.

Když jsem před více než třiceti léty narazil na problém entropie, cítil jsem se ze začátku jako kadet Biegler, který na školení důstojníků zmateně vykřikl:" Jesus Maria, Herr Major, es stimt nicht!"

Kadet Biegler horlivě sledoval výklad školicího důstojníka, ale ten návod nedával smysl. Já jsem na tom byl podobně. A stejně jako v mém případě se jednalo o teorii informace, v případě kadeta Bieglera o její podobor, teorii šifrování. Pomůckou tenkrát byla kniha "Hříchy otců". Švejk na základě praktických zkušeností se čtenářkou horlivostí pánů důstojníků vydal jim místo předepsaného druhého dílu jenom díl prvý.

Osobní vzpomínky

Obvykle se začíná historií problému. Já začnu vysvětlením, jak jsem se vůbec k problému a jeho řešení dostal. S trochou nadsázky se dá říci, že jsem byl k řešení problému dohnán jako Robinzon na pustém ostrově, který se musel pod tlakem okolností naučit spoustu věcí zcela sám, bez učitelů. To se v mém případě ukázalo jako výhoda, protože jsem neopakoval jejich chyby.

V rámci normalizace jsem byl vykázán z chemické laboratoře. S trochou štěstí jsem se uchytil v patentovém oddělení výzkumného ústavu. Aby to nevypadalo, že nemám co na práci a nestal jsem se nadbytečným, musel jsem si sám zajišťovat zaměstnanost. Tak jsem si vymyslel patentové rešerše, ve kterých jsem se snažil zjistit, kolik vynálezů přihlašuje úspěšnější konkurence a jak asi velké jsou konkurenční výzkumné týmy.

Za socialismu se výzkum vlekl řadu pětiletek bez konečné realizace, což bylo pohodlné pro všechny zainteresované. Výzkumník nemusel začínat stále znovu a výrobci se nemuseli zvládat nové nevyzkoušené technologie. Předpokládal jsem, že tento stav byl zaviněn tím, že se najednou honilo příliš mnoho zajíců. Výzkumné týmy byly příliš malé.

Získal jsem několik rešerší, které se vzájemně hodně podobaly. Asi polovina přihlašovatelů, což byly v případě patentů firmy, nikoliv přímo autoři, podala ve sledovaném období několika let jen jednu přihlášku vynálezu, mnohem méně jich mělo dvě a jen ojedinělí přihlašovatelé jich měli desítky.

Nejjednodušší popis dat jsem získal vynesením údajů na dvojitém logaritmickém papíru. Počáteční body leží na přímce, pouze chvost s nejproduktivnějšími firmami klesal strměji. Později jsem zjistil, že takové rozdělení objevil statistik Lotka, když se ještě před tím, než jsem se narodil, zajímal o produktivitu autorů všech chemických publikací v pětiletém rejstříku Chemical Abstracts. Takový tvar rozdělení je obecně platný pro všechnu informaci.

Rozdělení je velmi kosé a platí i pro rozdělení bohatství. Bohatých je málo, chudých mnoho. To už komentoval svatý Matouš, podle kterého tomu, kdo má bude přidáno a tomu, kdo nemá, bude vzato i to, co má. Na stejný problém se dá nahlížet také optimisticky, úspěch budí úspěch. Úspěšná publikace povzbudí autora, aby byl ještě pilnější, zkušenosti usnadní další práci.

Řada autorů tento tvar rozdělení považuje za specifický pro informaci, ale naopak se může tvrdit, že v přírodě jsou taková rozdělení základní. Za příklad si můžeme vzít rozdělení velikosti částic, ve Vesmíru klesají počty od mikročástic, iontů a atomů, ke hvězdám a černým dírám o několik řádů, v živé přírodě tvoří podobně počátek takových řad jednobuněčné organismy. Na jejich koncích jsou velryby a sekvoje, těchto největších organismů existuje velmi málo.

Měl jsem tenkrát trochu štěstí, které člověk potřebuje pro neočekávaný objev. Důvodem, proč jsem se nespokojil s jednoduchým popisem, bylo to, že jsem e svých rešerších zachytil jednu anomálii.

Jednalo se o patenty z oboru výroby polyvinylchloridu. Rozdělení bylo deformované v tom smyslu, že v souboru chyběli největší světoví producenti. Příčinu, proč vedoucí firmy v sledovaném období omezily výzkum jsem zjistil teprve později, když vyšlo najevo, že v rozhodném období velké firmy financovaly výzkum výzkumu vlivu vinylchloridu na vznik rakoviny. Měly k dispozici jeho předběžné výsledky jako tajnou informaci. Firmy předpokládaly možný zákaz výroby a proto přestaly investovat do výzkumu v tomto oboru nebo změnily jeho zaměření. Pokles vynálezecké aktivity byl jen dočasný, v následujícím období se objevila řada vynálezů, které řešily nově vzniklé problémy, zmenšení obsahu stop vinylchloridu v polyvinylchloridu a zvýšení bezpečnosti práce s vinylchloridem.

Danou rešerši lépe popisovalo rozdělení logaritmicko-normální (rozdělení normální s logaritmickou substitucí). Také u ostatních rešerší toto rozdělení vyhovovalo, pouze přihlašovatelů jednou či dvěma přihláškami bylo vždy více, než by odpovídalo rozdělení logaritmicko-normálnímu.

Korelace se velmi vylepšila, když jsem použil substituci log(log2(mk + 1)!). Ten vykřičník ve vzorci není upozorněním na podivnost této substituce, ale je to, jak už snad víte, znak funkce faktoriálu, kterou jsem použil. Faktoriál je součin celé řady čísel 1 až n. Logaritmování změní součin na součet logaritmů. Druhé logaritmování by zobrazilo číslo 1 na minus nekonečno, proto je potřeba přidávat jednotku, binární logaritmus základní dvojku vydá jako jednotku, která při druhém logaritmování přejde na nulu.

Tuto trochu krkolomnou substituci jsem použil vlastně z nouze. Uvažoval jsem o korektnějším použití funkce součinu čísla k s jeho logaritmem (k logk), podle teorie informace, jenomže tyto hodnoty bych musel pracně počítat ručně, kdežto faktoriály jsem měl k dispozici ve formě tabulek, takže stačilo jej zlogaritmovat. Měl jsem trochu štěstí, za několik měsíců jsem si pořídil kapesní kalkulačku se všemi vědeckými funkcemi. Mimo tento praktický argument jsem měl představu, že logaritmuji polynomický koeficient (viz níže) podobně jako kdysi Boltzmann. Opakoval jsem si základy termodynamiky, protože jsem uvažoval o tom, že bych se mohl vrátit do laboratoře.

Na rozdíl od Boltzmanna jsem do faktoriálů nedosazoval počet přihlašovatelů s určitým počtem patentů, ale počet jejich patentů, což podle mého chápání odpovídalo základním kvantům, jednotkám, v tomto případě nikoliv energie, ale informace.

Logaritmicko-normální rozdělení informace, které je dobře použitelné i bez uvedené substituce, je rozdělení useknuté, protože počítá jen s určitými minimálními kvanty informace, kterými mohou být knihy, články, citace a podobně, takže nezná zlomky. Situace by se asi změnila, kdyby se zjišťoval počet stránek, slov nebo dokonce znaků v publikacích. Tak by se jedna publikace počítala jako několik tisíc slov a teoreticky by mohly existovat publikace pouze s několika mála slovy (název a jméno autora). Takové statistiky však představují jiný problém, dnes sice technicky řešitelný, ale zatím se to nedělá.

Výsledky rešerší jsem publikoval. Teprve po nějaké době jsem si uvědomil, že jsem provedl něco "co se nedělá". Použil jsem entropii ke korelování rozdělení uvnitř soustavy. To však nebylo to podstatné, měl jsem nepříjemný pocit, že něčemu nerozumím. Když jsem si nějakou dobu marně lámal hlavu nad matematickými vlastnostmi entropické funkce, rozhodl jsem se, že musím ke zdrojům, a prostudovat si Shannonovu práci. Po jejím přečtení mi to bylo jasné, v čem spočívají potíže. Informační entropie se počítá podle polynomického koeficientu, který jsem použil, a ten je jiný než podle kterého se počítá entropie fyzikální, takže se jedná o dvě různé funkce.

Tady se objevil nový problém: V jakém poměru jsou oba polynomické koeficienty a tím obě entropie? Rešerše týkající se funkce entropie už tehdy odkazovaly na několik set publikací. Neměl jsem chuť je všechny shánět, ale v jejich názvech jsem nenašel ani zmínku o tom, že by si někdo všimnul rozdílu, který jsem si uvědomil.

Studoval jsem kombinatoriku, ale k ničemu to nevedlo.

Oba koeficienty jsou uvedeny jen v dodatku k jednomu vydání Fischerovy monografie, ke které jsem se dostal až mnohem později. Jsou tam uvedeny bez bližšího vysvětlení jejjich významu.

Asi po roce přešlapování jsem se konečně rozhodl prostudovat si původní Boltzmannovu práci. Musel jsem na ni asi měsíc čekat, než byla volná, což se ukázalo jako výhoda, protože jsem mezitím začal chápat některé vlastnosti rozdělení čísla n.

Když jsem si konečně Boltzmannův článek donesl do práce (byl jsem přece ve studijním oddělení, tak to patřilo do mé náplně), ani jsem jej pořádně nedočetl, protože jsem našel řešení, prosté jako Kolumbova vejce. Oba polynomické koeficienty se jednoduše násobí, tedy jejich logaritmy jsou dvě rozdílné aditivní funkce.

Tehdy jsem měl už k dispozici kalkulačku z Tuzexu, takže výpočet čísla 77 jako součtu 11 násobků dvou polynomických koeficientů byl rychlý (také to můžete zkusit, viz níže).

Bláhově jsem si myslel, že už mám vše za sebou, problém jsem uspokojivě vyřešil. To jsem netušil, že o mé řešení nebude nikdo stát, protože odporuje učeným knihám. Podařilo se mi je publikovat pouze v těch případech, kdy si recenzenti neuvědomovali význam problému. Jinak si nechtěli pálit ruce s doporučením k publikaci.

Docházelo při tom ke komickým situacím.

Prvý recenzent mi vytýkal, že se vyjadřuji nesrozumitelně. To mne trochu naštvalo a tak jsem sdělení přepracoval a poslal do redakce časopisu Věda a technika mládeži, kde je beze všeho otiskli. Bylo jasné, že ve srozumitelnosti mého výkladu problém asi není.

Potíže jsou mnohem hlubší. Měl je už před sto léty Boltzmann se svou funkcí H(n), kterou navrhl jako matematický ekvivalent fyzikální funkce. Jeho kolegové vymýšleli paradoxy, aby dokázali, že nemá pravdu (1).

Boltzmann, který jako bodrý Vídeňák po návratu z Ameriky nejdříve spěchal do restaurace na pivo, tomuto tlaku dlouho odolával. Nakonec však podlehl depresím a spáchal sebevraždu, shodou okolností právě v době, kdy Planck pomocí kvantové hypotézy vysvětlil záření černého tělesa, což jej jen jinou formou uplatnění Boltzmannových představ (2).

Boltzmannovo vysvětlení zapadlo do nečtených archivů tak dokonale, že ani nositel Nobelovy ceny za fysiku Steven Weinberg je nezná, ačkoliv téma patří do základního kurzu fysiky (3).
Partitio numerorum však použil už Boltzmann při řešení důležitého problému v termodynamice, při řesení rozdělení rychlostí molekul plynu a entropie. Ani nositel Nobelovy ceny za fysiku
Steven Weinberg, ani žádný z přítomných fyziků to nevěděl.

Jiný recenzent v jiném časopise mi namítal, že navrhované řešení odporuje činnosti Maxwellova démona. Na základě zkušeností se socialismem, který se snažil řídit samovolně probíhající procesy, jsem ukázal, že Maxwellův démon stejnou činností molekuly nejen třídí, ale také míchá (pokud začne šíbovat molekuly rozdělené dle teploty, což je samovolný proces), takže jeho práce entropii zvyšuje i snižuje, případně kdyby pracoval v toroidní komoře (pneumatika), plyn uvede do cirkulace, takže dochází ke změně hybnosti plynu. Moje poznámka o činnosti démona vyšla, avšak původní publikace nikoliv.

Vlastní problém zkomplikovala Shannonova teorie spojení (4), považovaná všeobecně za teorii informace. Shannon použil formálně podobnou funkci H(m) jako míru informace, kterou zavedl jako axiom, aniž by se namáhal s vymezením rozdílu. Toho se chopila řada autorů, axiomatická forma se jim zdála dokonalejší a lepší než zpochybňovaná funkce H(n). Fysik Brillouin, kterému prý unikla Nobelova cena za fysiku, dokonce zapletl do vysvětlení předpokládaného vztahu mezi informací a entropií zmíněného Maxwellova démona. To byla druhá tragedie v této historii, tentokrát vědecká. Vztah mezi oběma entropiemi lze totiž odvodit od rozdělení, které je známé pod Brillouinovým jménem.

Hříchy otců, díl prvý: Termodynamika

Termodynamika vznikla z potřeby vysvětlit funkci parního stroje, vztahy mezi teplotou T, objemem V a tlakem P vodní páry, definované stavovou rovnicí. Při tom se formalizovala zkušenost, že k zahřívání těles je třeba jim dodávat teplo Q, že pevné látky při určité teplotě tají a kapaliny se při určité teplotě vypařují.

Při popisování těchto jevů definoval Clausius roku 1854 novou funkci S, kterou nazval entropií. Na rozdíl od teploty, objemu a tlaku, není možné funkci S měřit přímo, ale je ji nutné pracně vypočítávat z experimentálních dat. Její hodnota je určena tvarem plochy pod křivkou, protože funkce S je definována jako diference,

d(S)=d(Q)/T.

Při formální integraci se ve vzorci objeví logaritmus teploty.

Boltzmann se zabýval, podobně jako před ním Maxwell, rozdělením rychlostí molekul plynu. Nárazy jednotlivých molekul na stěny nádoby vyvolávají tlak. Tento tlak je dán průměrnou kinetickou energií jednotlivých molekul, která je přímo závislá na teplotě, a jejich počtem, který je nepřímo závislý na objemu. Oba autoři došli ke shodnému výsledku, který je znám jako Maxwell- Boltzmannovo rozdělení.

Boltzmann mimo to navrhl jako formální ekvivalent entropie funkci

H = - ? (nk/n)log(nk/n)

kde nk je počet molekul s energií k, n je celkový počet molekul. Při tom platí

n = ? nk

a je zvykem dosazovat zkráceně podíly jako

pk = nk/n.

Boltzmann při tomto návrhu narážel na řadu obtíží. Za prvé výpočet podle tohoto vztahu vyžaduje kvantování energie, takže Boltzmann použil kvantovou hypotézu, aniž by měl důkaz její oprávněnosti. Sám prakticky okamžitě od této představy upustil a nijak ji neohajoval, ačkoliv na ní byla založena celá jeho úvaha. To byla možná zásadní chyba. Za druhé nesprávně svůj příklad interpretoval pomocí pravděpodobnosti, vzhledem k tomu, že tehdejší fysika prakticky kromě krystalografie neznala pojem symetrie. Dnes se celá fysika subatomárních částic točí kolem pojmu symetrie, takže prohlášení, že entropie je logaritmickou mírou symetrie by bylo přijatelné.

Boltzmann použil příklad sedmi molekul, které si mezi sebe dělí sedm kvant energie. Taková soustava může být v jednom ze stavů, které lze popsat následujícími vektory

(7, 0, 0, 0, 0 ,0, 0),

(6, 1, 0, 0, 0 ,0, 0),

(5, 2, 0, 0, 0 ,0, 0),

(4, 3, 0, 0, 0 ,0, 0),

(4, 2, 1, 0, 0 ,0, 0),

(3, 2, 2, 0, 0, 0, 0),

(3, 2, 1, 1, 0 ,0, 0),

(3, 1, 1, 1, 1 ,0, 0),

(2, 2, 1, 1, 1 ,0, 0),

(2, 1, 1, 1, 1 ,1, 0),

(1. 1, 1, 1, 1, 1, 1).

Vektory jsou známy v teorii čísel jako rozdělení čísla m na n sčítanců. Obvykle se s nulami nepočítá, ale Boltzmann použil přesně uvedenou formu zápisu, která se dá pokládat za základní formu rozdělení čísla (5). Zápis bez nulových hodnot je pouhá diference.

Boltzmann předpokládal, že soustava plynu mění při náhodných srážkách molekul rozdělení.

Jednotlivá rozdělení představují ve fázovém prostoru sférické orbity. Každé orbitě odpovídá ve fázovém prostoru takový objem, kolik je možných různých stavů, které se získají permutacemi hodnot vektoru. U prvého rozdělení je sedm možností, u posledního jedna a u rozdělení (3, 2, 1, 1, 0 ,0 , 0) je jich 840. Objem odpovídající rozdělení se vypočítá tak, že faktoriál n! se dělí faktoriály počtu stejných hodnot vektorů.

Maximální počet stavů by se dosáhl, kdyby každá molekula měla vlastní úroveň energie, což by pro 7 částic vyžadovalo minimálně 21 kvant energie (0+1+2+3+4+5+6=21). V obvyklých termodynamických soustavách, kdy počet molekul udává Avogadrovo číslo s třiadvaceti nulami násobené počtem molů a počet kvant energie je dán dokonce součinem Avogadrova čísla s Boltzmannovou konstantou a Kelvinovou teplotou, nejsou teploty potřebné pro takovou maximalizaci počtu stavů reálně dosažitelné. Je nezbytné, aby částic s relativně malými energiemi bylo mnohem více, než částic s velkými energiemi.

Objem orbit odpovídá jejich symetrii. Orbity ve fázovém prostoru jsou sférické, všechny permutace vektoru rozdělení energie mají stejnou Euklidovskou délku. Lze tedy tvrdit, že entropie je logaritmickou mírou symetrie, čím větší symetrie, tím vyšší entropie. Aby se předešlo nedorozuměním, větší symetrie znamená větší počet prvků symetrie a jejich vyšší stupeň. Čtverec má větší počet prvků symetrie než rovnostranný trojúhelník, koule má více prvků symetrie než kruh.

Je nutno podotknout, že koncepce tají velké problémy, které přesahují rámec termodynamiky. Soustavu plynu v termodynamické rovnováze si můžeme představit v laboratoři.

Platí však pro plynná oblaka ve Vesmíru, zárodky hvězd či galaxií? Když si takovou soustavu rozdělíme na části, bude rozdělení všude stejné, nebo různé části budou v různém stavu? Ve velkých soustavách by se měly vyskytovat částice s energiemi odpovídajícími energii kosmického záření. Je kosmické záření integrální součástí termodynamických soustav, nebo je to cizí prvek?

Nesporné je, že v takových velkých soustavách se uplatňuje gravitace. Hustota oblaku v jeho centru je větší než na okrajích. Je tedy gravitace projevem snahy soustavy po dosažení maximální entropie, nebo je to cizí prvek?

Hříchy otců, díl druhý. Teorie informace.

Tato teorie se objevila před více než padesáti léty a byla přijata na rozdíl od Boltzmanna bez jakéhokoliv odporu, naopak s velkým nekritickým nadšením.

Vlastně to byla pouze teorie komunikace, teorii všeho z toho udělali nadšenci, kterým se zalíbila její strohá axiomatická forma. Axiomy se nemusí dokazovat, ty je nutno vyvracet. To se zpravidla dělá tak, že se ukážou rozpory mezi axiomy. Případně je třeba ukázat, že teorie nefunguje a je v rozporu se skutečností.

Entropii zavedl autor teorie jako axiom. Jednoduše prohlásil, že mírou informace je funkce H(m), která se počítá podle vzorce

H(m) = - ? mj/m log mj/m

kde mj je počet opakování symbolu j, m je celkový počet symbolů v textu či zprávě, jeho délka. Při tom platí

m = ? mj

a je zvykem psát zkráceně

pj = mj/m.

Všimněte si použití rozdílných symbolů proti funkci H(n). Opakováním symbolu j se říká jeho frekvence, což připomíná fotony. Tato analogie je i funkční, fotony také přenášejí mezi mikročásticemi informaci o stavu sousedních mikročástic. Existuje však důležitý rozdíl, zatím co každá mikročástice je kompaktní těleso, což vyjadřuje její název, jednotlivé opakování symbolů jsou v textu rozesety dosti rovnoměrně.

Vzhledem k tomu, že v textu se může vyskytnout několik symbolů se stejnou frekvencí k, lze rovněž psát

m = ? mj = ? nkmk

Vzhledem k tomu, že funkce H(m) se už v teorii informace používala dříve a měla jméno, nazval Shannon tuto funkci entropií. Poradil mu to John von Neumann. Prý takto (6):

"Měl by jste tomu říkat entropie ze dvou důvodů. Za prvé vaše funkce nejistoty se užívá v statistické mechanice pod tímto jménem a tak už má jméno. A za druhé, což je mnohem důležitější, nikdo neví, co entropie opravdu je, tak ve sporu budete vždy mít výhodu."

Rada John von Neumanna byla možná chytrá. Nebyla však moudrá, protože svedla na scestí další vývoj.

Nová teorie byla nadšeně přijata. Epigoni navrhli nahrazení pochybné Boltzmannovy funkce H(n) novou funkcí H(m). To se jim podařilo, z části z toho důvodu, že si nikdo nedal práci, aby podrobil kritickému rozboru vztah obou funkcí.

Místo toho se přijal chybný model vztahu entropie a informace. Do vysvětlování tohoto vztahu se zapletl Maxwellův démon, který prý k snižování entropie tříděním molekul potřebuje informaci. S touto myšlenkou přišel už dříve Szilard. Informace snižující entropií je její inversní funkcí, jakousi negentropií.

Abychom si udělali jasno o vztahu obou funkcí H(n) a H(m), vyjdeme z Boltzmannova příkladu.

Ke každému rozdělení, které charakterizuje příslušný vektor, přiřadíme informační vektor v základním stavu, kdy symboly jsou řazeny podle abecedy a frekvence. Tedy:

(7, 0, 0, 0, 0 ,0, 0) = (a, a, a, a, a, a, a)

(6, 1, 0, 0, 0 ,0, 0) = (a, a, a, a, a, a, b)

(5, 2, 0, 0, 0 ,0, 0) = (a, a, a, a, a, b, b)

(4, 3, 0, 0, 0 ,0, 0) = (a, a, a, a, b, b, b)

(4, 2, 1, 0, 0 ,0, 0) = (a, a, a, a, b, b, c)

(3, 2, 2, 0, 0, 0, 0) = (a, a, a, b, b, c, c)

(3, 2, 1, 1, 0 ,0, 0) = (a, a, a, b, b, c, d)

(3, 1, 1, 1, 1 ,0, 0) = (a, a, a, b, c, d, e)

(2, 2, 1, 1, 1 ,0, 0) = (a, a, b, b, c, d, e)

(2, 1, 1, 1, 1 ,1, 0) = (a, a, b, c, d, e, f)

(1. 1, 1, 1, 1, 1, 1) = (a, b, c, d, e, f, g).

Posloupnost (a, a, a, a, a, a, a) odpovídá vektoru (7, 0, 0, 0, 0, 0, 0), permutaci vektoru (0, 7, 0, 0, 0, 0, 0) odpovídá posloupnost (b, b, b, b, b, b, b) a tak dále. Číselná hodnota vektoru n se nahradí příslušným počtem symbolů odpovídajících danému vektoru j. Posloupnost (a, a, a, b, b, c, g) odpovídá vektoru (3, 2, 1, 0, 0, 0, 1).

Ve zprávách se jednotlivé symboly samozřejmě čárkami neoddělují. Jejich vypuštění je však pouhá formální úprava zápisu, která nemá vliv na podstatu problému.

Permutace n- vektoru mění symboly za jiné, nikoliv jejich pořadí. Změny pořadí symbolů se dosáhnou rovněž permutacemi, v tomto případě měnícími pořadí v posloupnosti. Zde jsou to m-permutace. Tyto permutace se počítají v daném konkretním případě takto 7!/3!2!1!1!0!0!0!. Tento výraz má smysl vzhledem k definici faktoriálu 0! = 1.

V příkladě je použita rovnost m = n. Obvykle je počet znaků mnohem větší než počet symbolů abecedy. Základní rozdělení je potom useknuté.

Přechod od polynomického koeficientu k funkci H(m) je podobný jako u funkce H(n), s použitím Stirlingovy aproximace. Její použití je v případě informace trochu problematické vzhledem k tomu, že počty symbolů ve zprávách jsou ve srovnání s počty molekul v termodynamických soustavách relativně malá čísla, takže aproximace jsou zatíženy většími relativními chybami, to však není příliš podstatné. Další rozdíl je v tom, že Shannon použil logaritmus o základu 2, což ovšem vyžaduje další úpravy, na druhé straně umožňuje jinou interpretaci informační entropie, jako přímé míry informace získané označením m objektů symboly vybranými z abecedy o n členech.

Jestliže máme m neoznačených objektů, můžeme je indexovat pomocí binárního rozhodovacího stromu. Strom vyrůstající z kořene se větví vždy na dvě větve označené 0 (vlevo) a 1 (vpravo). Strom by měl být podle možnosti pravidelný, potom má nejmenší počet větví. Například pro označení osmi předmětů potřebujeme 24 znaků:

000, 001, 010, 011, 100, 101, 110, 111.

Pokud předměty jsou předem označeny, můžeme původní označení použít jako kořen a počet nutných znaků se zmenší. Třeba pro osm symbolů a, a, a, a, b, b, c, d, potřebujeme jen 10 znaků:

a00, a01, a10, a11, b0, b1, c, d.

Rozdíl (24 – 10) dělený počtem objektů je mírou informace, kterou o souboru máme.

Příklad je volen tak, že souhlasí přesně s funkcí H(m). Pro velká čísla můžeme nahradit počítání větví přímo logaritmem o základu 2 jako dolní limitou počtu větví. Je to paradox, za informaci nepovažujeme takové vyhodnocení. Musíme si ještě jednou připomenout, že Shannona zajímal technický problém, jak znaky zpráv přenést elektronicky bez chyb a co nejefektivněji.

Lze říci, že funkce H(m) jednoduše měří, kolik různých zpráv je možné vytvořit z daného souboru symbolů jejich různými uspořádáními a tak umožňuje vyhodnocení efektivnosti třeba různých kódování.

Funkce H(m) má maximum, když všechny hodnoty m jsou stejné. Nejlépe by bylo, kdyby každý symbol se objevil ve zprávě pouze jednou. To je možné pouze u velmi krátkých zpráv. Angličtina používá pouze 26 písmen, při využití malých a velkých znaků by se taková optimální zpráva mohla prodloužit na 52 znaků, při využití všech ASCII symbolů by to bylo 256. Faktoriál 256 je větší než exp(1419), takže by se tak dala zakódovat dosti velká knihovna (každé sérii ASCII symbolů by odpovídala jedna kniha). Ještě delší by mohly být optimální depeše v čínštině, kde znaky znamenají slabiky nebo celá slova.

V přirozených jazycích se však znaky nevyužívají rovnoměrně, právě naopak, vedle značně frekventovaných písmen se některá objevují jen zřídka. Souhlásky x a z jsou pro angličtinu cizí a objevují se dost málo (zdá se mi, že teď se to pomalu mění, najdete je nyní dosti často v různých slangových výrazech).

Shannon považoval tuto nerovnoměrnost za chybu přirozených jazyků a rozdíl mezi rovnoměrným využitím symbolů a jejich skutečným využitím nazval redundancí (nadbytečnost).

Ukázali jsme si, že H(n) je maximální, pokud každé n má svou frekvenci, tedy všechna mj jsou různá. Nadbytečnost však zvyšuje H(n) takže součet obou entropií je větší, než kdyby se maximalizovala pouze entropie jediná. Pro informaci není prostě maximalizace jedné entropie optimální. Toto jednoduché vysvětlení experimentálních faktů svědčí pro můj výklad problému.

Ve skutečnosti právě nadbytečnost usnadňuje porozumění zprávám. Toto tvrzení se snadněji vysvětlí na celých slovech, která se v textu také objevují velmi nerovnoměrně. V tomto textu je frekvence slova "entropie" mnohem vyšší než ve frekvenčním slovníku, což je známka toho, že entropie je tématem tohoto sdělení. Nerovnoměrnost zabraňuje monotonnosti. České přísloví "já o koze, on o voze" ukazuje úskalí optimalizovaného využití symbolů, rozdíly mezi jednotlivými sděleními by se musely hledat lupou.

Nadbytečnost informace se objevuje už v DNA, protože v RNA se jednotlivé triplety neobjevují rovnoměrně. Mimo to některé aminokyseliny jsou kódovány několika triplety, což zvyšuje frekvenci jejich výskytu.

 Entropie míchání

Informační entropie se počítá z frekvence znaků, která je stejná pro litery v tiskařské kase (kdo si ještě pamatuje tento výraz z doby, kdy se litery řadily do sazby ručně ze zásobníku?) jako v hotové sazbě. Úsilí sazeče a před ním autora zprávy se na entropii zprávy vůbec neprojeví. Při tom právě určité uspořádání symbolů v posloupnosti přenáší informaci. Autoři mu věnují značné úsilí, aby dosáhli dokonalosti ve výběru slov a jejich pořádku, aby se slova ani fráze neopakovaly, ale teorie informace si vůbec nevšímá tohoto úsilí a ani jej neumí měřit.

Shannon si byl vědom tohoto nedostatku a počítal frekvence dvou po sobě následujících hlásek a jim odpovídající entropii, jako možnou náhradu nějaké lepší míry.

Abychom si problém ozřejmili, použijeme k tomu Maxwellova démona. Ten jak je známo, umí rozlišovat chladné a horké molekuly (pomalé a rychlé) a jejich tříděním snižovat entropii. Může se však také jednat o různé chemické prvky či sloučeniny.

Takže si představme na rozdíl proti předešlému, že každý výskyt písmena odpovídá jedné molekule. Vezmeme jich tolik, aby zaplnily dostatečně velký prostor, třeba dva svazky (pro příklad postačí dva řádky). Oddělené molekuly budou reprezentovat řady symbolů (počet je stejný, písmena s mezerami jsou různě široká)

ccccccccccccccccccccccccccccccc

hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh

a smíchané molekuly řada

chchchchchchchchchchchchchchchchchchchchchchchchch.

V tomto řádku jsou molekuly smíchány příliš dokonale, takže by připomínaly spíše krystal než nějakou zprávu. Je to však také jedna z počítaných variant.

Nabízí se otázka, zda je možné nějak měřit stupeň promíchání symbolů v textech, nebo také nukleových kyselin v sekvencích DNA či číslic v číslech.

Domnívám se, že takovou možností je měření vzdáleností mezi následujícími symboly v posloupnosti.

Můžeme si představit, že posloupnost bude vznikat náhodně, třeba dlouhou sérií hodů mincí, kdy jsou možné jen dva výsledky. Sleduje se, zda padla hlava nebo orel. Při hodu kostkou existuje šest ploch poskytujících možnosti, aby se kostka ustálila. Pro celou abecedu bychom potřebovali polyhedr s odpovídajícím počtem hran (nebo více kostek, kdy by symbol určovala kombinace jejich výsledků). Polyhedr by měl být nepravidelný, protože písmena v přirozených jazycích nejsou stejně využívána. Samohlásky, kterých je méně, jsou většinou velmi frekventované, avšak některé souhlásky, v češtině třeba q, w, x, se vyskytují relativně řídce. Podle jejich četnosti lze třeba poznat odborný text s častými slovy cizího původu.

U hodů mincí je rozdělení vzdáleností mezi jednotlivými shodnými výsledky známé jako negativně binomické rozdělení. Tyto vzdálenosti se mohou spočítat ze všech posloupností určité délky, kolikrát se mezi následujícím symbolem vyskytne jeden, dva či více symbolů druhého druhu.

Ukázalo se, že je možné výsledek popsat matematicky, nejprve rekurentními vzorci, pak analytickým vzorcem. Před používáním PC byly výpočty negativně binomického rozdělení velmi pracné, proto bylo téměř neznámé. Dnes však existují programy, které odstranily všechny potíže s jeho analýzou.

Vzdálenosti v číselných posloupnostech mohou být různé. Zlomek 1/3 má nekonečný počet číslic za desetinnou čárkou (0,333..). Zde se opakuje pouze jedna číslice, takže rozdělení vzdáleností je monotonní.

V jiném iracionálním čísle, čísle e, se číslice vyskytují prakticky náhodně. To znamená, že rozdělení vzdáleností mezi jednotlivými číslicemi lze popsat velmi dobře negativně binomickým rozdělením.

U textů je rozdělení písmen méně pravidelné a k jeho popisu se může vedle negativně binomického rozdělení použít rozdělení exponenciální, rozdělení logaritmicko-normální a rozdělení Weibullovo (to se používá při sledování životnosti strojních a elektronických součástí). Při tom se vyskytují v průběhu rozdělení anomálie, některých vzdáleností je více, než by odpovídalo ideálnímu průběhu funkce, jiných méně.

Podobná situace s rozděleními vzdáleností existuje i u základního jazyka živé přírody, genů, rDNA a DNA.

Je možné vypočítat entropii i těchto rozdělení vzdáleností. To by byly další hodnoty, které mají analogii i u termodynamických soustav. U krystalu jsou všechny vzdálenosti téměř stejné, ale v roztocích či plynech nejsou molekuly rozděleny úplně rovnoměrně a mimo to se musí projevit i jejich tvar.

Závěr

Matematika bývá pokládána za racionální vědu, ve které nemají co dělat emoce, jen holá fakta a důkazy. Historie entropie svědčí o tom že to vůbec není pravda. I matematikové často opakují jenom to, co je naučili jejich učitelé.

Kdysi kdosi překročil bludný kořen a vydal se nesprávným směrem. Vzhledem k tradici se mylné názory přejímají.

Je nesporný fakt, že existují dva polynomické koeficienty. Tady lze chybu stopovat až k Newtonovi, že nepsal výsledek násobení mnohočlenu, třeba (a + b + c)3 se dvěma polynomickými koeficienty ve tvaru:

3x3 + 6[3(x2)y] + 6xyz

kde se za x dosazuje a,b,c, potom za y se dosazuje b, c, a za z se dosazuje jen c, což dá celkem 27 členů (3 + 18 + 6).

Boltzmann se dopustil chyby, že svoji představu orbit ve fázovém prostoru rozmělnil pravděpodobností a že opustil kvantovou hypotézu. Bylo ironií osudu, že spáchal sebevraždu ve stejné době, kdy Planck pomocí kvantové hypotézy vysvětlil spektrum záření černého tělesa. Izolované termodynamické soustavy se ve fázovém prostoru pohybují po rovinách konstantní energie a samovolně se dostávají na orbity s největším objemem. Nepochopení jeho základní myšlenky skončilo tragedií.

Pak přišla teorie informace, to byla komedie. Z formálně i funkčně bezvadné teorie komunikace se udělala univerzální teorie. která měla vše vysvětlit. Místo jasného vymezení vzhledem k fyzikálnímu pojmu se s její pomocí snažili vylepšit "podezřelý" Boltzmannův výklad. Na strohé axiomy se nalepil výklad sice barvitý, ale zcestný.

Literatura

Jiří Svršek, Matematika. Století polemik o základech matematiky. Historická vsuvka, Ludvík Boltzmann, Natura

L. Boltzmann, Über die Beziehung zwischen dem zweiten Hauptsatze der mechanishen Wärmetheorie und die Wahrscheinlichkeitsrechnung, Wiener Berichte 1877, 76, 373.

Matematika – jednotící prvek vědy, Pokroky matematiky, fyziky a astronomie, 34 (1989) 193-205.

C. E. SHANNON, The Mathematical Theory of Communication, Bell System Technical Journal, 27 (1948), 379, 623.

M. Tribus, E. C. McIrvine, Energy and Information, Scientific American, 1971, 225, 3, 179.

 

16. Výpočet binárního logaritmu a entropie informace

Dovedete vypočítat logaritmy bez použití vědecké kalkulačky?

Výpočet logaritmů býval neobyčejně pracnou záležitostí. Napier počítal logaritmy přibližnou integrací diferenciálních rovnic, později byly objeveny způsoby vyčíslení logaritmů jako součtů nekonečných geometrických řad. Logaritmické tabulky byly výsledkem celoživotní práce řady matematiků a jako takové se i cenily.

Dnes jsou zastaralé, kalkulačka vyčíslí logaritmus mžikem, rychleji, než jej vyhledáme v tabulkách.

Dokážete však sami, jen pomocí základních matematických úkonů, vyčíslit logaritmus 3 o základu 2 s přesností alespoň 1 %?

Řešení:

Některé vlastnosti logaritmu o základu 2 má délka hrany v binárním rozhodovacím stromu.

Od kořene takového stromu vedou dvě větve, které se vždy dělí na další dvě (jako obrácený rodokmen).

Větve odpovídají počtu odpovědí na otázky potřebných k určení čísla (m-1) a odpovědi lze označit čísly 0 a 1. Pro mocniny čísla 2 je výsledek přesný, na příklad pro 8 jsou to 3. U ostatních čísel je průměrný počet rozhodnutí L(m) aproximací, která je tím lepší, čím je číslo bližší mocnině čísla 2. Pro číslo 9 by to byl strom

Hladina

Počet objektů

Otázka

0

 

 

 

 

9

 

 

 

 

Je číslo menší než 5?

1

 

 

5

 

 

 

4

 

 

Je číslo menší než (7) (2)?

2

 

3

 

2

 

2

 

2

 

Je číslo menší než (8) (6) (4) (2)?

3

2

 

1

1

1

1

1

1

1

Je číslo menší než (9)?

4

1

1

1

1

1

1

1

1

1

 

Řešení

9

8

7

6

5

4

3

2

1

 

 

Označení listů bude: 0000, 0001, 001, 010, 011, 100, 101, 110 a 111. Všimněte si, že se nejedná o binární čísla, ale indexy obsahují nadbytečné nuly.

L(9) = 7 x 3 + 2 x 4 = 29:9 = 3.222. Děleno mocninou (9 = 32) dá výsledek 1.611. Strom přímo pro číslo 3 dá L(3) = 1.66.

Pro 35 = 243 dostaneme strom

128 x 8 = 1024

64 x 8 = 512

32 x 8 = 256

16 x 8 = 128

2 x 6 = 12

1 x 5 = 5

Součet = 1937. Průměr 7.971, děleno 5. mocninou dá 1.594. Logaritmus 3 o základu 2 je 1.585.

Kdybychom volili stále vyšší mocniny čísla k a dbali na to, aby byly současně co nejblíže mocnině čísla 2, dostali bychom stále přesnější výsledky logaritmu. Lze tvrdit, že limitou L(m) je logaritmus o základu 2.

Entropie informace

Jak jsme si ukázali, pro označení m objektů pomocí binárního rozhodovacím stromu potřebujeme mL(n) číslic.

Pokud máme o daných objektech nějakou informaci, třeba to, že jsou předem označeny n symboly nějaké abecedy, postačí nám k identifikaci objektů menší počet číslic, protože budou označeny kombinací písmene a číslice. Rozhodovací strom se rozpadne na les rozhodovacích stromů (1). Například pro 8 neoznačených objektů potřebujeme 24 číslic: 000, 001, 010, 011, 100, 101, 110 a 111.

Pokud budou objekty označeny, třeba jako : a, a, a, a, b, b, c, d,

postačí k jejich identifikaci indexace: 00a, 01a, 10a, 11a, 0b, 1b, c, d. Tedy jenom 10 číslic. Rozdíl počtu číslic (24 - 10 = 14) budeme považovat za míru informace, kterou o objektech máme. Abychom tuto hodnotu zbavili závislosti na velikosti souboru, podělíme ji počtem objektů m a označíme ji písmenem H. H = 14 : 8 = 1,75.

Eliminujeme i další závislost na velikosti hodnot mj (j = 1, 2 ...n), když nahradíme počet číslic binárními logaritmy a potom budeme moci nazvat funkci H entropií

Bude mít tvar H = S (mj/m) log2 (mj/m).

Několik poznámek o entropii

Jak jsme ukázali, entropie informace měří jen informaci, kterou máme o nějakých objektech. Těmito objekty mohou být symboly nějaké zprávy, kde jsou navíc indexovány přirozeným pořádkem v textu, ale mohou to být i rozsypané litery. Funkce H tento rozdíl nezaznamená. Funkce H byla použita před 50 léty Shannonem v jeho teorii komunikace (2). Shannon řešil problémy spojené s přenosem zpráv a tady jeho definice zcela vyhovuje. Funkce H však neměří význam informace ani její obsah.

J. Von Neumann poradil Shannonovi (3): "Měl byste to nazvat entropií ze dvou důvodů. Za prvé Vaše funkce nejistoty byla použita ve statististické mechanice pod tímto jménem a tedy už má jméno. Za druhé, a to je důležitější, nikdo neví co entropie opravdu je, takže v debatě budete mít vždy výhodu".

Entropie se vždy považovala za funkci tajemnou a existuje celá řada spekulací o jejím klíčovém významu pro vývoj vesmíru. Možná její znázornění prostým grafem a tím její degradace na obyčejné kupecké počty pomůže odstranit aspoň některé omyly.

Literatura

1. M. Kunz: Entropies and information indices of star forests, Coll. Czech. Chem. Commun., 51 (1986) 1856-1863.

2. C. E. Shannon, The Mathematical Theory of Communication, Bell System Technical Journal, 1948, 27, 379, 623.

3. M. Tribus, E. C. McIrvine, Energy and Information, Scientific American, 1971, 225, 3, 179.