Menü Bezárás

A mátrixok és másodrangú tenzorok ugyanaz a dolog?

Tudom, hogy ez egy régi téma. De szerintem még mindig hiányzik egy pont, úgyhogy ha az emberek még mindig erre a posztra hivatkozva jönnek, hadd próbáljam meg én is.

Matematikai szempontból szeretnék érvelni, ami némileg geometrikus. Vektorokat akarunk venni valamilyen $V$ vektortérből. Különösen nem fogjuk megkövetelni, hogy $V$ egy $\mathbb{R}^n$ legyen valamilyen $n$ dimenzió esetén, de az egyszerűség kedvéért mondjuk, hogy $V$ véges dimenziós. Kétféle művelet létezik ezen a vektortéren, amelyek a szokásos tenzorképben relevánsak, az egyik a $\begin{pmatrix}0\\\\2 \end{pmatrix}$ tenzorok – amelyek könnyen, technikai zűrzavar nélkül leírhatók -, a másik pedig a $\begin{pmatrix}1\\\\1 \end{pmatrix}$ tenzorok által leírt lineáris leképezések – amelyek technikai zűrzavart igényelnek, ezért itt rövidek maradunk. Bázisokról is beszélnünk kell majd. Menjünk tehát három lépésben.

Előtti utóirat: Ez egy kicsit túlnőtt az arányokon. Azért próbáltam részletezni, mert tudom, hogy a diákjaim gyakran küzdenek a kézzel fogalmazott és rövid válaszokkal, amelyek nem feszegetik a fontos jeleket.

Egy jó forrás a dologba való belemerüléshez (és nagyon olvasmányos) Nadir Jeevanjee Introduction to Tensors and Group Theory for Physicists című könyve.

$\begin{pmatrix}0\\\\2 \end{pmatrix}$ Tenzorok

  1. Nem sok hűhó nélkül definiálhatunk egy $\begin{pmatrix}0\\\\\2 \end{pmatrix}$-tenzort úgy, hogy az egy olyan $T$ bilineáris térkép, amely két vektort $v$ és $w \ V$-ban és egy valós számot $T(v,w)$-t ad ki. Kicsit formálisabban leírva:$$$T : V \times V \to \mathbb{R}, \qquad (v,v) \mapsto T(v,v) \ in \mathbb{R}.$$$Akik megijednek a matematikai jelöléstől, ne aggódjanak, ez valójában csak a fent leírt próza. A bilineáris szó különösen fontos. Azt jelenti, hogy a tenzor mindkét argumentumban lineáris. Máskülönben egy meglehetősen véletlenszerű leképezés lenne, de valójában a linearitás az, ami a tenzorok jellegzetes tulajdonságait adja.

Ez az. Valójában ez az, ami egy tenzor: fog két vektort, és kiköp egy valós számot. És ezt lineárisan teszi.

Ez a definíció független a $V$ vektortértől, a tenzorok bármilyen vektortéren leírhatók. A $V$ vektortérre példa lehet a biliárdgolyó összes lehetséges sebességének tere (ez azért vektortér, mert lehet nyújtani és hozzáadni sebességeket, és tényleg nem sok minden van még, hogy valamilyen halmaz vektortérnek minősüljön). És egy tenzor? Ahogy fentebb említettük, bármilyen multinieáris leképezés megfelel, de a fizika számára értelmes lehet a “kinetikus energia tenzor”$$ T(v,w) = \frac{m}{2}v \cdot v,$$, amelynek diagonálisa pontosan $T(v,v) = E_{\\textrm{kin}}}(v)$.

Most, vegyünk észre egy dolgot: sem ebben a definícióban, sem a példában nem említettünk semmit koordinátákról vagy $\mathbb{R}^3$-ról. Ez fontos. A tenzor egy olyan objektum, amely a maga teljes pompájában, szabadon és minden koordinátarendszertől függetlenül létezhet. Egy elméletíró (vagy bármely fizikus) számára ez kellemes eredmény: Nincs olyan kísérlet, amelyből kiderülne, hogy a világ koordinátarendszere kartéziánus, poláris vagy gömbi. Ezek az emberi elme szüleményei. Egy jó elméletnek nem szabad egy önkényes választástól függően indulnia, jobb, ha a tenzorok jól definiált entitások, mielőtt elveszünk a koordinátarendszerekben. És mi itt ezt tettük.

Az alap kiválasztása

Az elménk viszont elég jól működik a koordinátarendszerekben, vagy legalábbis jól kiképezték erre. Mi történik tehát, ha választunk egy bázist? Akkor a $v,w \in V$ vektorok felbonthatók a $\{e_i\}$ bázisvektorok halmaza feletti összegre és az egyes bázisvektorokra vonatkozó $\{v^i\}$ skálázási tényezőkre. Az összeg konvencióval:$$ v = v^i e_i, \qquad w = w^i e_i.$$Adjuk be a tenzor definíciójába, és nézzük meg, mi jön ki.\begin{align} T(v,w)&= T(v^i e_i, w^j e_j)\\&= v^i T(e_i, w^j e_j)\\&= v^i T(e_i, e_j) w^j \\\&=: v^i T_{ij} w^j.\end{align}Az első egyenlőség csak beszúrás (az indexek megfelelő gondosságával), a második egyenlőség az első argumentum linearitása ($v^i$ csak egy valós szám, kihúzható), a harmadik egyenlőség a második argumentum linearitása, végül pedig bevezetjük a definíciót$$$T_{ij} := T(e_i,e_j).$$$Ez egy új mennyiség, amit úgy definiáltunk, hogy a tenzort minden bázisvektorpárra alkalmazzuk. Ha a vektortér $n$ dimenziójú, akkor $n^2$ valós számot kapunk, míg a $v^i$ és $w^j$ komponensek egyenként $n$ valós számot alkotnak.

És most mindezen információk tárolásának egy teljesen tetszőleges módját találjuk ki: a mátrixokat. Egy mátrix önmagában nem más, mint egy táblázat (történelmileg egy ideig még táblázatoknak is nevezték őket). Puszta MS-Excel táblázatok. De az imént levezetett egyenlet által motiválva az emberek előálltak az ötlettel: hé, rendezzük a $v^i$ és $w^j$ számokat ezekbe a sorokba és oszlopokba, és rendezzük a $T_{ij}$ számokat ebbe a szép négyzet alakú számtömbbe. És hogy megjegyezzük, hogyan kell velük bánni, vezessük be, hogyan szorozzuk őket egymással.

A mátrix (beleértve a $\mathbb{R}^{n \times n}$ négyzetmátrixokat, valamint a $\mathbb{R}^{1 \times n}$ sormátrixokat és a $\mathbb{R}^{n \times 1}$ oszlopmátrixokat, amelyeket általában vektoroknak neveznek), ahogy egy másik válaszban említettük, nem más, mint az információ tárolásának egy módja. A mátrix szorzási szabály (“sorszor oszlop”) további információ ezen felül. Ez csak egy módja annak, hogy helyesen kezeljük a mátrixban és a vektorokban tárolt információt, ami puszta valós számok.

Ez az az értelem, amelyben a vektorokat valamilyen $\mathbb{R}^n$, a tenzorokat pedig $\mathbb{R}^{n \times n}$ mátrixoknak tekintjük. A vektorok valójában egy $n$ dimenziós $V$ vektortérben fekszenek, a tenzorok pedig olyan bilineáris leképezések, amelyek két ilyen vektort vesznek és egy valós számot adnak. A $\{e_i\} bázis kiválasztása után azonban a $\{e_i\} \V$ részhalmazának kiválasztása után a teljes $v$ vektor visszanyeréséhez csak a $\{v^i\}$ összetevőire van szükségünk az adott bázison, és a $T$ tenzor teljes megismeréséhez csak a $\{T_{ij}\} = \{T(e_i,e_j) \}$ bázisvektorok értékeire van szükségünk. Ez a bázisokat a szőnyeg alá tolja, de aztán furcsa dolgok történnek, ha bázist váltunk.

A tenzorok mint lineáris térképek

Az itteni válaszok többsége miért arra összpontosít, hogy a tenzorok lineáris térképek, amelyek egy $\mathbb{R}^n$ vektort egy másik $\mathbb{R}^n$ vektorba visznek? Mert természetesen van egy szoros hasonlóság.

Nézzük meg újra a tenzorszorzás koordinátás ábrázolását. Ott azt írtuk$$$T(v,w) = v^i T_{ij}w^j.$$$Ez szoros hasonlóságot mutat a belső szorzat koordinátás ábrázolásával,$$$v \cdot u = v^i u_i,$$$csak a$$$u_i = T_{ij}w^j = T(e_i,e_j)w^j = T(e_i,w^j e_j) = T(e_i,w)$$ az egyenletben.

Ebben az értelemben a tenzor megértésének egy új módját találjuk. Ahelyett, hogy csak két vektort vennénk és egy valós számot adnánk vissza, úgy tekinthetjük a tenzort, hogy veszünk egy $w$ vektort, lineárisan átalakítjuk egy új $u$ vektorrá, majd kiszámítjuk a belső szorzatot $v$ és $u$ között.

Egy megjegyzés: Ezen a ponton kihagytam néhány finomságot, mert ahhoz, hogy teljes képet kapjunk, tovább kellene beszélnünk a belső szorzatról. A belső szorzat ugyanis definiálja a metrikus tenzort (vagy fordítva), amire még szükségünk van, ha a $u_i$ kovariáns komponenseiből a $u^i = \eta^{ij} u_j$ kontravariáns komponensekre akarunk jutni. Erre itt nem térünk ki. Gondolom, ezt amúgy is tárgyaltuk már máshol.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük