Úvahy o prostoru I aneb co konáme, aniž o tom víme

MILAN KUNZ

V 42 čísle Bajtu úvaha Z. Dobiášové vedle sdělení nepopíratelné skutečnosti, že si čtvrtý geometrický prostor neumíme představit, končila řadou nedoložených spekulací, které by patřily spíše do nějakého scifi časopisu.

Prvé upozornění na existenci vícerozměrných prostorů se objevilo už před dva a půl tisíci léty. Formuloval ji Plato, když nás vyzval, abychom si představili, že jsme přikováni v jeskyni a z okolního světa vidíme jen stíny, které se promítají na stěnu jeskyně. Zjišťování vlastností vnějšího světa z těchto odlesků je zdlouhavý a bolestivý proces. A tak matematikové, když do toho vnějšího světa proniknou, raději zavírají oči a předstírají, že se jedná jen o jakousi abstrakci, přesně tak, jak Plato předpověděl.

Noviny nedávno byly plné zpráv, že byla asi dokázaná velká Fermatova věta, ale že důkaz je tak složitý, že jej zatím nikdo neprověřil. Když se přiznám, že mým posledním matematickým objevem bylo zjištění, že když označím délku úhlopříčky v jednotkovém čtverci jako dvě, potom musím délku dvou jednotkových kroků v přímém směru označit jako čtyři (a navíc, že mi to trvalo dva roky, než jsem si to uvědomil) tak se budou zdát moje matematické schopnosti směšné a moje kompetence minimální. Ale na druhé straně - lidstvu to trvalo dva a půl tisíc let, než na to přišlo, a na světě je několik desítek lidí, kteří o problému také věděli, ale neuvažovali.

Důsledkem toho prostého tvrzení je, že třeba 5 musíme chápat v jistých výrazech jako délku úhlopříčky v pětirozměrné krychli. Dovedete si představit šňůru korálků namotanou na vrcholy mnohorozměrné krychle? Mně se to přes veškeré snahy nedaří, ale akceptuji algebraické důkazy, které mi poskytl počítač. Jeho výsledky jsem už úplnou indukcí jen zobecnil na nekonečno. Zatím co matice pravidelných vzdáleností korálků na šňůře, zdánlivě přímo měřených, má tolik nenulových vlastních hodnot, kolik je korálků (to se vědělo už dřív), potom matice se čtverci vzdáleností má vždy jen tři nenulové vlastní hodnoty, což je překvapení, které se však mělo čekat, protože ty hodnoty odpovídají prvkům symetrie přímky.

Použil jsem teď výrazy, o kterých nevíte co znamenají? Mám je vysvětlovat ihned nebo postupně a systematicky? Domnívám se, že matematikové své znalosti špatně vysvětlují, někdy příliš složitě a učeně, a pak sami nerozumí tomu, co ví. Anebo mají zázračné schopnosti, jako indický chlapec Ramanudjan, který si přečetl několik učebnic a pak popsal sešit nádhernými složitými vzorci, tak krásnými, že musely být správné, ale jejich správnost se těžko dokazuje obyčejným smrtelníkům, kteří musí zůstat venku, před branami této vědy. Tak tedy začneme od počátku.

Na počátku bylo slovo

Tak to aspoň stojí v jedné staré knize. Ovšem počátkem souřadnic by měl být jen jediný bod a to slovo by mělo vést od tohoto bodu k nějakému stavu, poloze v prostoru. Mělo by nám ten stav ukázat.

Tím se odlišíme od klasické geometrie. Budeme důsledně rozlišovat stav soustavy, polohu reprezentovanou bodem a jeho změnu, kterou si představíme jako šipku mezi dvěma body. Bude to mít nedostatek, že nedokážeme nakreslit ani přímku (to byl problém, který jsem zmínil na začátku), avšak na druhé straně nám to umožní zařadit do našeho vesmíru pojem informace.

Co je to vlastně informace? Existuje mnoho definic, ale pro nás postačí jednoduché tvrzení, že je to operátor, který účinkuje na naše vědomí, aby změnil jeho stav. Buď aby přidal další vědomosti, nebo změnil staré. Tato definice má tu výhodu, že umožňuje využít matematické teorie operátorů k formálnímu popisu informace. Před tím, než jej zavedeme, tak si pojem informace zúžíme na to, jak komunikujeme s počítači a budeme za informaci považovat texty, soubory, řady symbolů, to co sdělujeme počítači pomocí klávesnice. Symboly budou také reprezentovat náš prostor. Tím se zbavíme obtíží s představivostí. Zdá se to jednoduché, ale starověcí matematikové nebyli schopni uvažovat o ničem, co přímo neviděli.

Počet různých symbolů označíme vždy jako n, délku souboru jako m. Pro informaci je důležité pořadí symbolů ve zprávě, proto budeme pro toto pořadí používat index i, pro pořadí symbolu v jejich fixním seznamu index j. Tato konvence nám umožní zapisovat jednotlivé symboly jako jednotkové vektory řádky.

ej (0, 0,..1j, 0,.., 0)

a texty jako řady jednotkových vektorů, matice.

Například slovo abace má zápis

1

0

0

0

0

0

1

0

0

0

1

0

0

0

0

0

0

1

0

0

0

0

0

0

1

Tato tabulka je redundantní, ukazuje však, že definice informace jako operátoru je víc než pouhou analogií. V matematice jsou operátory matice a my tady máme informační matici. Za druhé, a to je mnohem důležitější, můžeme s její pomocí pochopit důležitou vlastnost informace, která unikla Shannonovi při formulaci jeho teorie spojení. Její použití je docela legitimní, protože v teorii čísel se podobné tabulky, jen jinak upravené používaly dávno.

Zavedeme tři důležité operace s maticemi.

Prvou jsou permutace jejích řádků a sloupců. Dokud se ještě sazba ručně sestavovala z liter, vyjímali sazeči jednotlivé litery z kasy a skládali z nich sazbu. Po skončení tisku mohli litery setřídit zpátky a znovu použít. Nebo mohli jen jinak uspořádat jejich pořadí. To je princip permutace řádků matice. Permutace sloupců matice se používala při sestavování tajných zpráv, kdy se psalo třeba místo a x, místo x z atd..

Pokud jste hádankáři, znáte možná permutovky, záhadné nápisy. Jiným druhem hádanky jsou záměnky, kdy se mění písmena za jiné permutací sloupců matice.

Matice, které odpovídají slovům mají v každém řádku vždy jen jednu jednotku. Kdysi jsem je označil za naivní, jednak proto, že jiné vhodné výrazy, jako elementární, primitivní, už mají své vžité významy, a jednak proto, abych vyjádřil jejich jednoduchost. Naivní matice, které mají jednu jednotku nejen v každém řádku, ale i v každém sloupci, jsou známy jako jednotkové permutační matice. Jsou to matice čtvercové a jejich množiny tvoří grupy cyklických permutací. Permutace se provádějí násobením matice jednotkovými permutačními maticemi zleva či zprava.

Vás neučili násobit matice ani vektory? Ale ano, jenom vám to zatajili. Když si napíšete čísla pod sebe, podtrhnete a sečtete, tak jste vlastně násobili vektor sloupec jednotkovým vektorem řádkou

 

23

19.5

1

(1, 1, 1)

43.5

Vynásobí se prvky s odpovídajícími indexy a pak se sečtou. Při násobení matic to musíte udělat, pokud nemáte příslušný program, se všemi řádky a sloupci. Násobení permutační maticí je snadnější. Pokud je zprava, tak se opisuje do každého sloupce ten sloupec násobené matice, v kterém řádku je v permutační matici jednotka.

Třetí operací je transponování matice. Transponovanou matici budeme označovat horním indexem T jako MT. Při této operaci se přehodí význam indexů i a j, nebo jinak se z vektor sloupců stanou vektor řádky a z vektor řádků vektor sloupce. Ještě jinak, prvky matice se přehodí podél hlavní diagonály, to je polí s indexy i=j od 11 do nn.

To se lehko řekne, ale jaký je důsledek této operace? Z matice odpovídající slovu aaa dostaneme matici, která má v prvém řádku tři jednotky, takže jí neodpovídá žádný symbol (snad stisknutí několika kláves současně). Tak ji musíme jinak interpretovat. Ale musí to být v souladu s původním významem indexu i. Domluvíme se, že ta jednotka je prostě značka, která měří délku vektoru od počátku souřadnic. Pokud bude značka v prvém řádku, bude to nulová vzdálenost, v druhém jednotková atd. Potom každé slovo délky m odpovídá jednoznačně jednomu bodu v m rozměrné krychli o hraně (n - 1). To přináší jednu nevýhodu. Zatím nemůžeme pracovat s jinými čísly než je 1. Později se nám však samy objeví a tak je do našeho prostoru vpustíme.

Když se vrátíte k úvaze Z. Dobiášové, tak si všimnete, jak se nám to zkomplikovalo. Jednou mluvíme o n rozměrném prostoru, teď zas o m rozměrném prostoru. Matice reprezentují nm rozměrný prostor a do méně rozměrného prostoru musíme sestoupit.

Prostor, který jsme si vytyčili se nazývá fázový. Většinou se uvažuje třírozměrný fázový prostor s n objekty, které mají vždy tři koordináty polohy. Nás však vůbec v této situaci nezajímá, kde je soubor v počítači uložen, a proto jsme si to pro začátek hned zkomplikovali, abychom nějak vyrovnali, že pracujeme jen s jednotkami.

Symetrie a entropie

Každá matice může být násobena permutačními maticemi zleva a zprava. Všechny výsledky budeme považovat za ekvivalentní, protože to nemění některé důležité vlastnosti matic, zejména jejich prvky. Vektor se permutacemi sloupců otáčí. Jeho délka se nemění, protože permutace nemění prvky matice. Proto se otáčí po kružnici, která se nám na čtyřrozměrné ploše, kterou si umíme představit, protože je to trojrozměrné těleso, jeví jako sférická. Této dráze budeme říkat orbita. U permutací řádků je to složitější, ale tady dobře vidíme, co se děje se slovy, když měníme jejich pořadí.

Když sestavíme výsledky do tabulky, zjistíme, že některé násobky budou stejné. Počet různých výsledků bude odpovídat symetrii matice. Tak například matice

1

0

0

1

0

0

1

0

0

dá jen 3 různé, odpovídající slovům aaa, bbb, ccc, protože nemůžeme rozlišit pořadí stejných symbolů a násobení zleva, které mění jejich pořadí, je neúčinné. Jednotková diagonální matice

1

0

0

0

1

0

0

0

1

dá slov šest.

Formálně výsledky zapíšeme jako PmNPn. Rozdíl mezi m a n je významný u obdélníkových matic, kde obě čísla nejsou stejná. Obě násobení můžeme oddělit nalezením kvadratických forem. K tomu matici nejprve transponujeme a pak vynásobíme transponovanou matici s původní v obou možných pořadích. Snad bych ještě měl podotknout, že při transponování součinu matic se mění jejich pořadí a že při násobení permutační matice její transponovanou maticí dostaneme jednotkovou diagonální matici, která se při násobení neprojevuje:

PnTNTPmTPmNPn = PnTNTNPn

PmNPnPnTNTPmT = PmNNTPmT

Ty kvadratické formy opět zní hrozně učeně, ale ve skutečnosti je to v prvém případě prosté sčítání počtu stejných symbolů ve sloupcích. Jejich počet jenom nenapíšeme do řádku, ale na diagonálu. Z počtu písmen neuhodneme, o čem byla řeč, snad jen z jejich rozdělení, zda se mluvilo česky nebo anglicky. Kdybychom počítali slova, tak bychom poznali, o čem se asi povídalo, protože některá slova by se opakovala častěji než je obvyklé. Tato kvadratická forma odpovídá poloze, do které nás řada jednotkových vektorů zavedla. Všechny řady stejné délky vedou, jak jsme se už zmínili, v n rozměrném prostoru na plochu, která je rovinou kolmou k jednotkovému diagonálnímu vektoru I. V trojrozměrném prostoru se o tom můžete snadno přesvědčit a ve vícerozměrném prostoru tomu musíme věřit na základě algebraických důkazů. Každé cestě k rovině odpovídá bod v krychli, na ploše je těch bodů méně, protože některé cesty vedou ke stejnému bodu. Když si to začnete kreslit třeba na čtverečkovaném papíře, zjistíte, že ty roviny (přímky) zaplňují postupně celý prostor. Jednotlivé roviny nazveme simplexy a jejich skládáním do komplexu z nich vytvoříme prostor, ze kterého se dají krychle vyříznout. Tento prostor je složitější, než si jej představoval kdysi pan Euklides, přes to však Euklidovskému prostoru odpovídá, protože v něm bude platit všude, i v nekonečnu, že 1x1=1. Jinak se tomu prostoru říká Hilbertův, i když ten zas předpokládal nekonečný počet prvků, jejichž součet má být konečný, a tak bychom měli mluvit o podprostoru. Konečně, o cestách v prostoru uvažoval Riemann, tak bychom těch jmen měli víc.

Počet různých matic, které získáme permutacemi ze základního vzoru strašně rychle roste, proto jej musíme nějak redukovat, třeba logaritmováním. Logaritmus počtu různých matic použijeme jako míru a označíme tuto míru jako entropii. Tím se dostáváme k ožehavému bodu našeho výkladu. Entropie bývá definována velmi různě jako míra neuspořádanosti, neurčitosti a my najednou sem pleteme symetrii. Tak si musíme ujasnit tento pojem.

Symetrie je počet abstraktních možností, jak manipulovat s objekty, abychom dostali shodný tvar.

Existují prvky symetrie a jejich počet. Rovnostranný trojúhelník má jako prvky symetrie operaci identity, kdy s ním nehýbeme, případně jej vrátíme do původní polohy, trojčetnou osu, podle které jej můžeme otáčet, a tři roviny zrcadlení, podle kterých se zrcadlí protilehlé vrcholy. Čtverec má čtyřčetnou osu, podle které jej můžeme otáčet a dvakrát dvě roviny zrcadlení, podle kterých se zrcadlí protilehlé body. Kruh má takových rovin nekonečně mnoho a ještě víc jich má koule. Obecný trojúhelník je asymetrický, ten má jen prvek identity, musíme jej vrátit do původní polohy. Soustavy s více prvky symetrie mají vyšší symetrii a proto i vyšší entropii. Jestli nejsme jejich uspořádání schopni pochopit a jeví se nám jako nepořádek, tak je to jen naše chyba.

Když Shannon hledal název pro funkci

H = - S pilog2pi,

kterou chtěl měřit informační obsažnost zpráv, navrhl mu trochu poťouchle John von Neumann: "Měl by jste tomu říkat entropie ze dvou důvodů. Za prvé vaše funkce nejistoty se užívá v statistické mechanice pod tímto jménem a tak už má jméno. A za druhé, což je mnohem důležitější, nikdo neví, co entropie opravdu je, tak ve sporu budete vždy mít výhodu."

John von Neumann se mýlil ze dvou důvodů. Jednak funkce, která se užívá v statistické mechanice má jiný základ logaritmu a měří něco jiného, jednak lze názorně ukázat, co Shannonova funkce opravdu měří (viz rámeček). Ukazuje se, že je to funkce zajímavá z hlediska vnitřní struktury zprávy, která je sice důležitá při jejím přenosu, ale pro příjemce je prakticky bezcenná.

V statistické mechanice existuje slavná funkce H, kterou navrhl Boltzmann jako modelovou funkci entropie. Měl smůlu, protože v jeho době maticový počet ani teorie grup prakticky neexistovaly a hlavně neexistovala kvantová teorie. Tak své vysvětlení, které bylo naprosto správné, sám považoval jen za ilustraci. A kdo dnes čte víc než sto let staré časopisy?

Tak tedy, v isolované soustavě n částic ideálního plynu každá částice má mj kvant energie, celková energie soustavy je m kvant. Stav soustavy lze popsat n rozměrným vektorem, jehož prvky jsou hodnoty mj. Stavy, mající stejné rozdělení energie jsou ekvivalentní, protože nás jednotlivé molekuly naprosto nezajímají, protože je nevnímáme. Když si částice vyměňují energii vzájemnými srážkami, soustava se pohybuje po rovině konstantní energie. Nejčastěji ji najdeme na orbitách, jejichž objem (počet bodů odpovídající jednotlivým stavům) bude největší. Ten objem je dán symetrií orbity měřenou polynomickým koeficientem pro n permutace. V našem označení to odpovídá symetrii kvadratické formy PnTNTNPn. Tento koeficient má tvar n!/P nk!, kde n! je n faktoriálně, P je symbol pro násobení a nk počítá vektory (částice) mající stejnou hodnotu mk. Zlogaritmováním pomocí přirozených logaritmů, kdy můžeme využít Stirlingův vzorec pro faktoriál, dostaneme známou rovnici, kde pk= nk/n, což je proměnná označovaná obvykle jako pravděpodobnost. Je to prostě poměr počtu daných vektorů k celkovému počtu vektorů. Takto formulovat Boltzmann nemohl a tak mu dodnes vyčítají, že svou funkci nedokázal.

Uvědomte si rozdíl. Tato funkce H počítá body, kvadratické formy, protože uvažuje jen celkový počet kvant energie (reprezentovaných jednotlivými symboly, tedy počet substitucí aab --> abb --> bbc atd.), které částice má a nestará se o jejich rozprostření po cestě. Nás však v informatice zajímá počet cest k jednotlivým bodům daný rozložením symbolů po cestě.

Tento počet měří jiný polynomický koeficient pro m permutace m!/P mj! = m!/P mk!nk. Ve druhém tvaru jsme umocnili vektory se stejnou hodnotou mk. Abychom dostali celkový počet stejně dlouhých zpráv na abecedě n symbolů, musíme oba polynomické koeficienty znásobit. Po zlogaritmování součinu dostaneme součet dvou funkcí odpovídajících Shannonově a Boltzmannově definici.

Tak lze snadno vysvětlit známou nadbytečnost informace, proč se symboly neopakují stejně často. To by sice maximalizovalo počet cest směřujících do jednoho bodu prostoru, neoptimalizoval by se však celkový počet zpráv. Nás zajímají různé věci a proto dáváme přednost možnosti vyjadřovat se způsobem, který při přenosu informace není optimální. Permutacemi abc vytvoříme sice 6 slov a z aab jen 3, ale na jiné orbitě jsou ekvivalentní slova jako abb, bba. Celkem 18 slov.

Když jsem na tento fakt kdysi dávno přišel a poslal článek do odborného časopisu, vytýkal mi recenzent, že je to v rozporu se všemi učenými knihami a že se vyjadřuji nesrozumitelně. Tak jsem se naštval a sepsal to jako popularizaci do Vědy a techniky mládeži, kde považovali vše pro své čtenáře za docela jasné. Jestli to čtenáři opravdu četli, to ovšem nevím. Součin dvou polynomických koeficientů najdete i v učebnicích, já jsem jej už také publikoval víckrát, ale nesmím se při tom zmiňovat o svých názorech na entropii lidem, kteří si myslí, že o ní něco ví.

Začali jsme s naivními maticemi. S jejich pomocí lze formalizovat celou klasickou kombinatoriku jako počítání naivních matic s různými omezeními. Pak by přišly matice s dvěma jednotkovými prvky v řádku. To je vlastně teorie grafů. Tady možnosti systematického studia prostoru prakticky v současné době končí. Naštěstí však dosažené výsledky umožňují studium chemie, elektrických obvodů, protože lze zavést různé typy inversních matic, počítat vlastní hodnoty a vektory, kterým odpovídají vlastnosti chemických sloučenin. Ještě nedávno to byla zdlouhavá a mravenčí práce, kterou dnes za nás naštěstí udělá počítač. Snad proto se tento obor matematiky rozvinul tak pozdě. To už jsou však jiné kapitoly.

Indexování regulárním kódem a míra informace

Pro označení m předmětů regulárním kódem potřebujeme alespoň mlog2m symbolů 0 nebo 1. Tento počet je dán délkou rozhodovacího stromu ano-ne, která je log2m a počtem symbolů (výraz je přesný u mocnin 2). Tak pro 6 předmětů to bude celkem 16 symbolů: 000, 001, 010, 011, 10, 11. (Zkontrolujte si to, prosím. Recenzent prestižního amerického časopisu mi to odmítl věřit).

Pokud jsou předměty označené symboly z abecedy n symbolů, potřebujeme indexovat jen předměty mající stejný symbol, protože pak budou všechny symboly jednoznačně očíslovány kombinací kódu a původního symbolu. Počet nutných symbolů kódu bude   mjlog2mj, součet symbolů indexů pro jednotlivá písmena.

Rozdíl obou výrazů, počet ušetřených symbolů při kódování je dán vztahem   mj(log2m-log2mj). Po přepočtu na jeden symbol (dělením celkovým počtem předmětů m) a dosazením Pj= mj/m dostaneme Shannonovu funkci H. Tato funkce tedy měří informaci ve zprávě jako úsporu počtu binárních indexů a pj má jiný význam, než u Boltzmannovy funkce H.

Konvergence regulárního kódu k logaritmu je velmi rychlá. Tak pro 35 = 243 dostaneme strom s 1937 symboly, což dá jako odhad log23 hodnotu 1.594. Skutečná hodnota je 1.585.