Menu Zavřeno

Jsou matice a tenzory druhého řádu totéž?

Vím, že je to staré téma. Ale myslím, že tu stále chybí nějaký bod, takže pokud lidé stále chodí na tento příspěvek pro odkaz, dovolte mi, abych se do toho opřel.

Chci argumentovat z matematického hlediska, které je poněkud geometrické. Chceme brát vektory z nějakého vektorového prostoru $V$. Zvláště nebudeme požadovat, aby $V$ byl $\mathbb{R}^n$ pro nějakou dimenzi $n$, ale řekněme pro jednoduchost, že $V$ je konečně dimenzionální. Existují dva různé druhy operací nad tímto vektorovým prostorem, které jsou relevantní v obvyklém tenzorovém obrazu, přičemž jedním z nich jsou tenzory $\begin{pmatrix}0\\2 \end{pmatrix}$ – které jsou snadno popsatelné bez technického nepořádku – a druhým jsou lineární mapy popsané tenzory $\begin{pmatrix}1\\1 \end{pmatrix}$ – které vyžadují technický nepořádek, takže zde zůstaneme struční. Budeme také muset mluvit o bázích. Půjdeme tedy ve třech krocích.

Předčasný postskriptum: Tohle se trochu rozrostlo. Snažil jsem se to rozvést, protože vím, že moji studenti často bojují s rukopisnými a stručnými odpověďmi, které nenatahují důležité mantinely.

Dobrým zdrojem, jak proniknout do látky (a velmi čtivým), je kniha Nadira Jeevanjeeho Introduction to Tensors and Group Theory for Physicists.

$\begin{pmatrix}0\\2 \end{pmatrix}$ Tenzory

  1. Bez velkých řečí můžeme definovat $\begin{pmatrix}0\2 \end{pmatrix}$-tenzor jako bilineární mapu $T$, která sežere dva vektory $v$ a $w \v V$ a vyplivne reálné číslo $T(v,w)$. Trochu formálněji:$$T : V \times V \to \mathbb{R}, \qquad (v,v) \mapsto T(v,v) \v \mathbb{R}.$$Ti, kteří se bojí matematického zápisu, se nemusí bát, je to opravdu jen výše napsaná próza. Důležité je zejména slovo bilineární. Znamená, že tenzor je lineární v obou argumentech. Jinak by to byla spíše náhodná mapa, ale linearita je skutečně to, co dává tenzorům jejich charakteristické vlastnosti.

To je vše. To je vlastně to, co tenzor je: vezme dva vektory a vyplivne reálné číslo. A to lineárně.

Tato definice je nezávislá na prostoru vektorů $V$, tenzory lze popsat na libovolném prostoru vektorů. Příkladem pro vektorový prostor $V$ může být prostor všech možných rychlostí, které může mít kulečníková koule (je to vektorový prostor, protože rychlosti můžete roztahovat a sčítat, a opravdu toho není o moc víc, aby se nějaká množina dala kvalifikovat jako vektorový prostor). A tenzor? Jak bylo zmíněno výše, stačí jakákoli vícedílná mapa, ale něco smysluplného pro fyziku by mohl být „tenzor kinetické energie“$$ T(v,w) = \frac{m}{2}v \cdot v,$$ jehož diagonála je právě $T(v,v) = E_{\textrm{kin}}(v)$.

Nyní si všimněte jedné věci: Nikdy jsme se v této definici ani v příkladu nezmínili o souřadnicích nebo $\mathbb{R}^3$. To je důležité. Tenzor je objekt, který může existovat v celé své kráse, volně a nezávisle na jakémkoli souřadnicovém systému. Pro teoretika (nebo jakéhokoli fyzika) je to potěšující výsledek: Neexistuje žádný experiment, který by určil, zda je souřadnicový systém světa kartézský, polární nebo sférický. To jsou výplody lidské mysli. Dobrá teorie by neměla začínat v závislosti na libovolné volbě, je lepší, když jsou tenzory dobře definovanými entitami, než se ztratíme v souřadnicových systémech. A to jsme zde udělali.

Výběr základu

Na druhou stranu naše mysl v souřadnicových systémech pracuje docela dobře, nebo k tomu byla alespoň dobře vycvičena. Co se tedy stane, když si vybereme základnu? Pak lze vektory $v,w \ve V$ rozložit na součet nad množinou bázových vektorů $\{e_i\}$ krát příslušné měřítkové faktory $\{v^i\}$ pro každý z nich. Se součtovou konvencí:$$ v = v^i e_i, \qquad w = w^i e_i.$$ Zapojíme to do definice tenzoru a uvidíme, co nám vyjde.\begin{align} T(v,w)&= T(v^i e_i, w^j e_j)\\&= v^i T(e_i, w^j e_j)\\&= v^i T(e_i, e_j) w^j \&=: v^i T_{ij} w^j.\end{align}První rovnost je pouhé dosazení (s náležitou péčí o indexy), druhá rovnost je linearita prvního argumentu ($v^i$ je prostě reálné číslo, lze ho vytáhnout), třetí rovnost je linearita v druhém argumentu a nakonec zavedeme definici$$T_{ij} := T(e_i,e_j).$$Jde o novou veličinu, kterou jsme definovali tak, že jsme vzali tenzor a aplikovali ho na všechny dvojice bázových vektorů. Má-li vektorový prostor rozměr $n$, pak dostaneme $n^2$ reálných čísel, přičemž složky $v^i$ a $w^j$ tvoří každá $n$ reálných čísel.

A nyní přichází na řadu zcela libovolný způsob uložení všech těchto informací: matice. Matice sama o sobě není nic jiného než tabulka (historicky se jim dokonce nějakou dobu říkalo tabulky). Pouhé tabulky MS-Excel. Ale motivováni rovnicí, kterou jsme právě odvodili, přišli lidé s nápadem: hele, uspořádejme $v^i$ a $w^j$ do těchto řádků a sloupců čísel a uspořádejme čísla $T_{ij}$ do tohoto pěkného čtvercového bloku čísel. A abychom si zapamatovali, jak s nimi zacházet, zavedeme způsob jejich vzájemného násobení.

Matice (včetně čtvercových matic ve tvaru $\mathbb{R}^{n \krát n}$ i řádkových matic ve tvaru $\mathbb{R}^{1\krát n}$ a sloupcových matic ve tvaru $\mathbb{R}^{n \krát 1}$, běžně označovaných jako vektory) není, jak bylo zmíněno v jiné odpovědi, nic jiného než způsob uchovávání informací. Pravidlo násobení matic („řádek krát sloupec“) je další informace navrch. Je to jen způsob, jak správně zacházet s informací uloženou v matici a vektorech, což jsou holá reálná čísla.

V tomto smyslu považujeme vektory za ležící v nějakém $\mathbb{R}^n$ a tenzory za matice v $\mathbb{R}^{n \times n}$. Vektory ve skutečnosti leží v nějakém $n$rozměrném vektorovém prostoru $V$ a tenzory jsou bilineární mapy, které berou dva z těchto vektorů a dávají reálné číslo. Avšak po volbě báze $\{e_i\} \V$, jsou všechny informace, které potřebujeme k získání celého vektoru $v$, jeho složky $\{v^i\}$ v dané bázi, a vše, co potřebujeme k úplnému poznání tenzoru $T$, jsou jeho hodnoty na bázových vektorech $\{T_{ij}\} = \{T(e_i,e_j) \}$. Tím se sice báze strčí pod koberec, ale při změně báze se pak dějí podivné věci.

Tenzory jako lineární mapy

Proč se tedy většina odpovědí zde soustředí na to, že tenzory jsou lineární mapy, které přenášejí vektor v $\mathbb{R}^n$ na jiný vektor v $\mathbb{R}^n$? Protože samozřejmě existuje blízká podobnost.

Podíváme se znovu na souřadnicovou reprezentaci násobení tenzorů. Tam jsme napsali$$T(v,w) = v^i T_{ij}w^j.$$To vykazuje blízkou podobnost se souřadnicovým zobrazením vnitřního součinu,$$v \cdot u = v^i u_i,$$ stačí v rovnici nahradit$$u_i = T_{ij}w^j = T(e_i,e_j)w^j = T(e_i,w^j e_j) = T(e_i,w)$$.

V tomto smyslu nacházíme nový způsob chápání tenzoru. Místo toho, abychom pouze vzali dva vektory a vrátili reálné číslo, můžeme uvažovat tenzor tak, že vezmeme vektor $w$, lineárně jej transformujeme na nový vektor $u$ a poté vypočítáme vnitřní součin mezi $v$ a $u$.

Na okraj: Na tomto místě jsem vynechal několik jemností, protože abychom získali úplný obraz, museli bychom dále hovořit o vnitřním součinu. Vnitřní součin totiž definuje metrický tenzor (nebo naopak), který ještě potřebujeme, chceme-li se dostat od kovariantních složek $u_i$ ke kontravariantním složkám $u^i = \eta^{ij} u_j$. Tím se zde nebudeme zabývat. Předpokládám, že to už stejně bylo probráno jinde.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *