상대성 이론/심화


1 개요

특수 상대성 이론과 일반 상대성 이론에 관한 전공자들을 위한 설명이다.
X발 얘들아 도망쳐 사람이 볼게 아니야

이름에서 느껴지듯이, 특수 상대성 이론이 먼저 나오고 그 후에 일반 상대성 이론이 나왔다. 보통 특수한 것을 다루는 것보다 일반적인 것이 복잡하고 어렵기 마련이다. 온도와 습도와 진동이 유지되는 방 안에서 도는 모터와 극지대와 물 속, 모래바람이 부는 사막에서 다 잘 도는 모터 중 어떤 것을 만들기 더 쉬울 지 생각해보면 이해가 빠를 것이다. 그렇게 생각하는 것으로 특수 상대성 이론과 일반 상대성 이론의 (수학적) 난이도 차이를 말할 수 있겠지만 사실 상황은 좀 더 희한하다. 사실 상대성 이론은 좌표계 간의 변환에 대한 이론이다. 그 중에서 관성 좌표계 간의 변환만 취급한 게 특수 상대성 이론이고, 그 외 다른 모든 좌표 변환[1]을 다 다룬, 그리고 그러한 모든 좌표 변환에 대해 상대성 원리를 적용시킨 게 일반 상대성 이론이다. 사실 일반 상대성 이론은 그저 이러한 단순 확장에 지나지 않는다고 말할 수 있다. 놀라운 건 이러한 단순 확장이 중력을 요구한다는 것.

먼저 두 가지를 알고 들어가자.

1.1 상대성 원리

☞ 상대성 원리 : 상대성 이론과 다른 거다. 하지만 상대성 이론의 핵심 개념. 이걸 제대로 다루기 위해 상대성 이론이 있다고 봐도 되겠다. 짧게 말하자면 두 관성 좌표계에서 물리 법칙들은 똑같이 적용이 된다는 것이다. 이것을 완전히 이해하려면 관성 좌표계가 무엇인지 이해하는 것이 필요하다.

먼저 좌표계를 살펴 보자. 별 거 없다. 그냥 원점 잡고 시간, 공간 좌표를 잡은 것으로 보면 된다. 어떻게 보면 변수 [math]t, x, y, z[/math], 그리고 그 기준(원점)을 잡은 셈이다. 물론 [math]x, y, z[/math] 대신 구면좌표계 [math]r, \theta, \phi[/math]로도 잡을 수 있는데, 직교 좌표계로 잡는 것은 관성 좌표계를 표현하는 데 있어서 가장 적합하다는 점에서 특별하다.

Landau, Lifshitz 시리즈의 Mechanics에서는 관성 좌표계가 균질(homogeneous)하고 등방(isotropic)인 좌표계라고 정의한다. 무슨 말이냐면, 평행이동과 회전을 시켜도 뭐가 바뀌는 게 없다는 것이다. 예를 들어 보자. 한 실험실을 생각하자. 이 실험실은 근처에 지구도 태양도 없는 텅 빈 우주 공간에 덩그러니 놓여 있어 주변에 영향을 주는 것조차 없다. 이런 실험실에서 어떤 물리 실험을 한다고 치자. 이제 이 실험실과 완전히 똑같은 실험실이 하나 더 있다고 하자. 이 실험설은 처음 실험실과 위치가 다르거나 혹은 좀 돌아가 있을 뿐이다. 어떻게 보면 처음 실험실을 이동시킨다든가 돌려 놓는다든가 한 것과 똑같은 것인 셈이다. 그러면 이 두 실험실에서 같은 실험을 했을 때 두 실험의 결과는 달라질까? 이것은 마치 서울에서 실험하나 뉴욕에서 실험하나 결과는 똑같을 것이라는 주장을 한층 더 강화시킨 것이다. 아니면 실험 장비를 북향으로 해 놓고 실험하나 남향으로 놓고 실험하나 결과는 그게 그거라는 얘기.[2] 여기서 균질성은 평행이동에 상관 없다는 것, 등방성은 회전에 상관 없다는 것을 가리킨다.

이제 한 실험실에서 다른 실험실이 실험한 것을 보는 상황을 생각해 보자. 예를 들어 두 실험실 모두 동일한 탁자를 쏘고 있고 원점을 둘 다 각자의 탁자 정중앙으로 잡았다고 했을 때 실험실 B가 실험실 A에서 잡은 좌표계에서 (10m, 0, 0)에 해당하는 위치에 있다고 치자. 그러면 B(의 좌표계)에서 (1m, 2m, 3m)에 있다고 관측된 물체는 A의 좌표계에서 (11m, 2m, 3m)에 있다고 관측될 것이다. 그런데 두 실험실 모두 같은 물리 법칙으로부터 같은 결과가 나왔으므로 B의 좌표계에서 설명하든 A의 좌표계에서 설명하든 결과는 똑같이 나와야 할 것이다. 즉, A에서 (11m, 2m, 3m) 같은 것으로 설명하나 B에서 (1m, 2m, 3m) 같은 것으로 설명하나 잘 들어맞는다는 뜻이다. 결과적으로 원점을 처음과 다르게 잡는다든가 좌표 축을 좀 돌려 놓는다든가 한다고 해서 물리 법칙이 다르게 적용되지는 않는다는 것이다. 이것이 균질성과 등방성이 말해주는 것이다. 이러한 성질은 물리 법칙들을 직교좌표계로 나타냈을 때에만 잘 드러난다, [math]\vec{F} = m \vec{a} = m \frac{d^2 \vec{x}}{dt^2}[/math]를 직교좌표계와 구면 좌표계에서 각각 표현한 다음, 평행이동과 회전 변환을 시켰을 때 이 법칙이 어떻게 바뀌어 써지는가를 보면 잘 알 수 있는 사실이다. 이런 (좌표) 변환에 대해 물리 법칙이 바뀌지 않는 것을 가리켜 물리학자들은 대칭성(symmetry) 혹은 불변성(invariance)라고 부른다. 불변성은 (고급) 물리학을 관통하는 매우 중요한 키워드이다.[3]

그런데 신기한 것은 이러한 관성 좌표계의 성질들이 시간, 공간의 평행이동과 공간에서의 회전에 의한 불변성 뿐만 아니라 좌표계의 '속도'를 바꾸는 것에 대해서도 불변한다는 것을 암시한다. 다시 두 똑같은 실험실의 예로 돌아가자. 관성 좌표계의 균질성과 등방성은 두 실험실이 서로 등속도로 움직이고 있어도 두 실험실에서 같은 실험을 했을 때 얻는 결과는 똑같다는 것을 말해 준다는 것이다. 따라서 두 관성 좌표계 간의 변환은 평행 이동과 회전만 있는 것이 아니라는 이야기이다. '실험실의 속도를 바꾸는 것'에 해당하는 변환 역시 관성 좌표계 간의 변환이 되는 셈이다. 그리고 상대성 원리는 다름 아닌 평행 이동, 회전, 그리고 '속도와 관련된 변환'에 대해 물리 법칙들이 불변성을 가져야 한다는 것을 요구하는 원리이다.

하지만 여기서 문제는 '속도와 관련된 변환'이 무엇이냐는 것이다. 고전 역학에서는 관측을 통해 갈릴레이 변환이 그 변환에 해당된다고 여겼다. 이 변환은 사실 공간의 평행 이동, 회전과 같은 변환들과 완전히 별개의 것으로 치부될 수 밖에 없는 구조를 가지고 있었고, 이는 오랫동안 시간과 공간이 서로 별개의 것이라는 개념이 유지되도록 했다. 그런데 '속도와 관련된 변환'은 사실 유일하지 않다. 갈릴레이 변환도 있지만 로렌츠 변환도 있지 않은가. 사실 이러한 문제를 해결해 주는 것이 바로 다음 원리인 광속 불변의 원리이다.

1.2 광속 불변의 원리

☞ 광속 불변의 원리 : 어떤 속력이 존재하여, 한 관성 좌표계에서 이 속력을 가지고 운동하는 것으로 관측된 물체는 다른 관성 좌표계에서도 그 속력으로 운동하는 것으로 관측된다는 말이다. 통상 이 속력을 빛의 속도라고 표현하고 수식에서는 [math]c[/math]로 표기된다.

위에서 설명한 바에 의하면 두 똑같은 실험실이 위치가 서로 다르고 방향이 달라도 같은 실험에 대해 같은 결과를 얻는다고 했었다. 광속 불변의 원리는 한 실험실에서 [math]c[/math]로 진행하는 물체가 다른 실험실에서도 [math]c[/math]로 진행하는 것으로 관측될 거라고 말해 준다. 그리고 한 실험실에서 다른 실험실의 그런 물체를 봐도 그 물체는 [math]c[/math]로 진행하는 것으로 관측될 것이고. 다른 데에서 보든 좀 돌아서 보든 어떤 물체의 속력이 다르게 측정되지 않으리라는 것은 상식적으로 당연해 보인다.

그런데 광속 불변의 원리는 서로 속도가 다른 두 관성 좌표계끼리 봐도 그 물체의 속력이 여전히 [math]c[/math]의 속력을 가질 것이라는 것을 말해 준다. 즉, 실험실 B가 실험실 A로부터 멀어지는, 혹은 A에 접근한다고 했을 때, 둘 다 똑같이 [math]c[/math]로 움직이는 물체를 각각 관측했다면 A에서 B의 물체를 관측했을 때에도 그 물체의 속력은 여전히 [math]c[/math]라는 것이다. 이것은 상식에 어긋나 보인다. 만약 실험실 B가 실험실 A에 대해 [math]\vec{V}[/math]의 속도로 움직이고 있을 때, 실험실 B에서 [math]\vec{v}[/math]로 움직이는 것으로 관측된 물체는 실험실 A에서 [math]\vec{v} + \vec{V}[/math]의 속도를 가지는 것으로 측정될 것이다. 그리고 이것은 전적으로 갈릴레이 변환의 결과이다. 광속 불변의 원리는 이러한 상식이 잘못되었으며 대신에 새로운 기준을 제시해 준다. 상대성 원리에서 '속도와 관련된 변환'이 있다고 했었고, 이 변환은 상대성 원리와 관성 좌표계의 정의 만으로 정해지지 않는다고 말했었다. 광속 불변의 원리는 그 변환이 갈릴레이 변환이 아니라는 것을 말해 주는 동시에 그 변환을 완전하게 결정해 준다.

2 특수 상대성 이론

2.1 상대성 이론의 정체

특수상대성이론의 요지는 딱 두 가지다. 상대성 원리와 광속 불변의 원리. 끝.

정말 쉽고 간단한(?) 개념이다. 물음표가 들어갔지만, 한번 이해를 하면 상당히 직관적인 개념이기도 하다. 특수 상대론은 기본적으로 등속계를 다룬다. 절대 가속하는 계를 다루는 상대론이 아니므로, 특수 상대성 이론에 쌍둥이 패러독스를 가져오게 되면 모순이 발생한다. [4]

특수 상대론은 의외로 간단하다. 개념은 관측자에 따라 모든 것이 상대적 이다. 밀폐된 계가 등속으로 이동 중일 때 당신은 외부 계가 이동 중인지, 아니면 본인의 계가 이동 중인지 절대, 결코 알 수 없다. 바로 여기서 특수 상대론이 출발한다. 순이와 철수를 도입해 설명을 가미할 수 있다.
순이나 철수 둘 중 하나가 광속에 가까운 속도로 등속운동한다고 하면, 관측자는 철수를 관측하는 순이와, 순이를 관측하는 철수로 나누어진다. 이때, 순이는 철수가 광속 C(에 극히 가까운 속도) 로 이동 중인 모습을 관측할 것이고, 철수 또한 순이가 광속 C(에 극히 가까운 속도) 로 이동 중인 모습을 관측하게 된다. 당연히 서로 상대방이 광속에 가까운 속도로 운동 중이고 자신은 정지해 있다고 판단한다! 시간지연이 발생했을 때, 철수는 순이의 시계가, 순이는 철수의 시계가 느리게 간다고 판단한다. 즉, 모든 것은 상대적이라는 개념.

이게 전부다. 사실 사람들이 그렇게 떠들어대던 길이가 짧아진다느니, 시간이 느리게 간다느니 하는 건 순전히 부수적인 결과물에 지나지 않는다. 결국 이런 결과도 로렌츠 변환의 부수적인 결과물이고, 로렌츠 변환 역시 저 요지의 부산물에 지나지 않는다.역학이 아예 바뀐 것 같지만 신경쓰면 지는거다 왠지 썰렁해 보이는 요지라 이상할 수도 있지만, 이거 하나만 알아두자.

상대론은 저 두 원리가 모든 물리법칙에 적용될 것을 강요요구한다.

다시 말해, 저 두 원리는 물리학의 기본 원칙들이라는 뜻이다.

상대성 원리야 그렇다 치더라도 광속 불변의 원리를 기본 원칙으로 받아들이라는 건 우리의 상식으로 힘든 일임이 분명하다. 하지만 실험이 증명하는 걸 어쩌겠는가. 더군다나 이 두 원리를 거부하면 일단 맥스웰 방정식, 즉 전자기학을 받아들일 수가 없게 된다.[5] 이런 식으로 광속 불변의 원리에 물리법칙이 지배되는 경우를 가리켜 로렌츠 불변라고 부른다. 이제 모든 (의미 있는) 물리량, 물리법칙은 이 로렌츠 불변을 만족해야 한다. 이게 곧 상대론의 주요 골자이기도.

혹자는 상대론과 양자론이 대립 중이라고 하는데, 사실 이는 일반 상대론에만 국한된 것이지, 특수 상대론, 즉 광속 불변의 원리(혹은 로렌츠 불변)는 예전부터 양자론과 잘 융합했다.안 그랬으면 정말 큰일 났지. 디랙 방정식이 그 결과 중 하나로 유명하며, 양자장 이론은 아예 상대론을 베이스로 하여 양자역학을 재구축한 것. 전자기학(상대론은 당연히 포함)과 양자역학이 완벽하게 융합한 이론인 양자전기동역학, 즉 QED는 지금까지 등장한 모든 이론들 중에서 가장 정확한 예측을 하는 이론으로 정평이 나 있다.[6] 물론 상대론 하나만 가지고 이 강력함을 말하는 건 무리겠지만, 사실 중요한 건 상대론은 아무리 작게 잡아도 이 모든 것의 근본이라는 점. 물론 그 이후의 이론들인 표준 모형이라든지 끈이론 등에도 상대론은 필수 요소이다.

누군가는 상대론이 응용할 수도 없고 오차만 만들어내는[7] 불필요한 이론으로 생각할 수도 있는데, 위 내용을 차근차근 읽어본 사람이라면 이 주장에 웃음을 금치 못할 것이다. 굳이 '응용'이란 단어를 쓰자면, 상대론이 응용된 곳은, 과장 없이 말해서, 현대 물리학 거의 전체이다.[8]

여하간에 상대론의 등장은 물리학 전체를 다시 쓰도록 하였으며, 역학 체계는 그 뿌리부터 수정되어야 했다.[9] 모든 물리량은 갈릴레이 변환이 아닌 로렌츠 변환의 지배를 받게 되었으며, 아예 물리량의 정의를 다시 잡는 계기가 되기도. 이제 물리량은 텐서로 정의되며,[10][11] 랭크에 따라 스칼라 혹은 벡터로도 불리지만, 결국 텐서의 한 분류로 보는 것이다. 이들 텐서의 근본적인 성질은 로렌츠 변환에 대해서 불변이라는 것인데,[12] 이는 상대성 원리와 광속 불변의 원리를 수용한 결과이다.

2.2 로렌츠 변환과 로렌츠 불변성

이제 로렌츠 변환에 대해서 좀 이야기해 보자.이미 다 된 이야기같지만... 로렌츠 변환은 갈릴레이 변환의 대체물이며, 로렌츠 불변이라고 하면 사실 이 로렌츠 변환에 대하여 불변이라는 뜻이다. 사실 우리가 아는 특수상대론에 대한 괴상한 이야기들은 전부 이 로렌츠 변환에서 온 것. 하지만 물리학에서 로렌츠 불변성이 갖는 의미는 생각보다 크다. 괜히 아인슈타인이 끝판왕이 아니라는 거다 상대성 원리를 확장시킴과 동시에 엄청나게 강화시킨 셈.

상대성 원리와 광속 불변의 원리를 가정한다는 것은 수학적으로 다음과 같이 표현될 수 있다. 한 관성 좌표계 O를 잡았을 때, 빛이 한 사건(Event,4차원 시공간에서의 한 점) [math](ct_0, x_0, y_0, z_0)[/math]에서부터 출발하여 매우 가까운 점 [math](c(t_0 + dt), x_0 + dx, y_0 + dy, z_0 + dz)[/math]만큼 이동했다고 하자. 그러면 다음이 성립한다.

[math]c^2 dt^2 - dx^2 - dy^2 - dz^2 = 0.[/math][13]

이때 다른 관성계 O'에서 이를 바라 보는 것을 생각해 보자. 그러면 아까 두 점을 각각 [math](ct'_0, x'_0, y'_0, z'_0)[/math][math](c(t'_0 + dt'), x'_0 + dx', y'_0 + dy', z'_0 + dz')[/math]로 표기할 수 있다. 그런데 광속 불변의 원리에 따라 다음이 성립한다.

[math]c^2 (dt')^2 - (dx')^2 - (dy')^2 - (dz')^2 = 0.[/math]

상대성 이론이 말해주는 것은 관성계끼리의 좌표 변환이 위와 같은 조건을 만족해야 한다는 것이다. 즉, [math]c^2 dt^2 - dx^2 - dy^2 - dz^2[/math]가 0이면 관성계 간의 좌표 변환에 의해 바뀐 결과 역시 0이어야 한다. 그러한 좌표 변환 중에서 선형성 등의 조건을 만족하는 변환 [math](ct, x, y, z) \to (ct', x', y', z')[/math][math]A[/math]라고 표기하자. 그러면 [math]A[/math]는 4x4 행렬로 표시되며, 열(column) 벡터 [math](ct, x, y, z)[/math](의 왼쪽)에 곱해져서 열 벡터 [math](ct', x', y', z')[/math]로 만드는 변환으로 이해할 수 있다. 이때 이러한 선형성 등의 조건을 잘 따져 보면 [math]c^2 dt^2 - dx^2 - dy^2 - dz^2 = 0[/math]이 일정해야 한다는 조건을 다음과 같이 확장시킬 수 있다. 한 관성 좌표계에서 [math]ds^2 = c^2 dt^2 - dx^2 - dy^2 - dz^2[/math]가 정해지면, 다른 관성 좌표계로 변환된 결과, 즉 [math](ds')^2 = c^2 (dt')^2 - (dx')^2 - (dy')^2 - (dz')^2[/math]는 일정, 즉 [math]ds^2 = (ds')^2[/math]이 성립해야 한다는 것이다. 다시 말해, [math]ds^2 = c^2 dt^2 - dx^2 - dy^2 - dz^2[/math]는 관성 좌표계 간의 변환에 대해 불변하다. 이러한 성질을 만족하는 선형 변환을 로렌츠 변환이라고 부른다.

[math]J[/math]를 4x4 대각 성분이 1, -1, -1, -1인 대각행렬이라 하자[14]. 앞에서 보인 수학적 성질에 의해 임의의 로렌츠 변환 [math]A[/math]는 항상 다음을 만족시킨다는 것을 알 수 있다.

[math]A^t J A = J[/math]
(여기서 [math]A^t[/math][math]A[/math]의 전치(transpose)행렬.)

이 성질로부터 또한 우리가 아는 로렌츠 변환식들을 얻어낼 수 있다. 일반적으로 위 식을 만족하는 행렬 A는 항상 다음과 같은 꼴로 표현이 된다.

[math]A = O_1 A_0 (O_2)^{-1}[/math].

여기서 [math]O_1, O_2[/math]는 3차원 공간 성분을 유클리드 회전을 시키는 변환들에 해당하며, 그 모양은 (1, 1)-성분이, 1, (i, 1), (1, j)-성분들이 다 0, 나머지 3x3 행렬 성분이 3차원 회전 변환(orthogonal 행렬) 꼴인 형태이다. 특히 [math]O_2[/math]는 x축을 특정한 방향으로 돌리는 변환이다. 따라서 [math](O_2)^{-1}[/math]는 그 역변환으로, 그 특정한 방향을 x축으로 돌리는 변환이다. 이러한 변환이 필요한 이유는 [math]A_0[/math]를 간단하게 표현하기 위함인데, 이때 [math]A_0[/math]의 각 성분들은 다음과 같이 쓸 수 있다.

[math]A_0 = \left( \begin{array}{cccc} \gamma \;\;& -\gamma \beta \;\;& 0 \;\;& 0 \\ -\gamma \beta \;\;& \gamma \;\;& 0 \;\;& 0 \\ 0 \;\;& 0 \;\;& 1 \;\;& 0 \\ 0 \;\;& 0 \;\;& 0 \;\;& 1 \end{array} \right)[/math]

그리고 나머지 성분들, 예컨대 [math](A_0)_{31}[/math] 같은 것들은 전부 0이다. 여기서 [math]\beta = \frac{v}{c}[/math]이며 [math]\gamma = \frac{1}{\sqrt{1 - \beta^2}}[/math]이다. 즉, 여러분이 잘 아는 로렌츠 변환식인 것이다! 만약 [math]A_0[/math]를 한 4차원 점 [math](ct, x, y, z)[/math](를 4x1 행렬로 나타낸 것)의 왼쪽에 곱하면 그 결과로 나타나는 점 [math](ct', x', y', z')[/math]들은 정확하게 여러분이 아는 그 로렌츠 변환 공식이 된다. 즉,

[math]x' = \gamma (x - \beta (ct)) = \gamma (x - vt), t' = \frac{1}{c} \gamma (-\beta x + (ct)) = \gamma (t - \frac{vx}{c^2})[/math].

이때 행렬 [math]A_0[/math]는 로렌츠 부스트라고 부른다. 이 행렬은 한 계의 점(이벤트)들이 x축 방향으로 속력 v로 날아가는 입자의 정지계에서 어떤 점들로 보내지는지를 결정해 준다. 왼쪽에 곱해주는 것으로 말이다. 이제, 이로부터 [math](O_2)^{-1}[/math]의 의미가 분명해진다. 속도 [math]\vec{v}[/math]가 주어져 있고[math]O_2[/math]가 x축 방향을 [math]\vec{v}[/math]와 나란하게 회전시키는 변환이라고 하자. 다음 변환 [math]O_2 A_0 (O_2)^{-1}[/math]는 이런 변환이다.

[math]\vec{v}[/math]를 x축과 나란한 방향으로 돌려 놓기
-> v만큼 로렌츠 부스트
-> 다시 x축을 원래 [math]\vec{v}[/math]과 나란한 방향으로 돌려 놓기

결과적으로 이 변환은 [math]\vec{v}[/math]의 방향으로 v만큼 로렌츠 부스트를 취한 것과 같다! 원래 일반적인 [math]A[/math] 식을 보면 맨 앞에 [math]O_2[/math]가 아닌 [math]O_1[/math]이 붙어 있는데, 이는 [math]O_1 = O_3 O_2[/math]로 다시 썼을 때, [math]\vec{v}[/math] 방향으로 v만큼 로렌츠 부스트를 가한 다음, [math]O_3[/math]로 회전시키라는 뜻이다. 다시 말해 공간 축도 나중에 또 돌리겠다는 뜻이다. 물론 [math]O_3[/math]는 단순히 단위 행렬일 수도 있다. 그러면 [math]A[/math]는 로렌츠 부스트만 있는 셈. 반대로 [math]A_0[/math]가 단위 행렬일 경우, 남는 건 [math]A = O_3[/math]이고, 따라서 단순한 3차원 공간의 회전 변환이 된다. 즉, 로렌츠 변환을 나타내는 행렬은 일반적으로 공간의 회전까지 포함하고 있는데, 만약 로렌츠 부스트를 시간과 공간을 같이 회전시키는 변환으로 보면, 로렌츠 변환은 4차원 시공간의 (선형) 회전 변환을 의미하게 된다! 실제로 로렌츠 변환은 다음 값을 바꾸지 않는다.

[math]ds^2 = c^2 dt^2 - dx^2 - dy^2 - dz^2[/math].

이것은 3차원에서의 미소 길이 [math]ds^2 = dx^2 + dy^2 + dz^2[/math]과 비슷하다. 현대 기하학에 따르면 이러한 '길이'를 불변시키는 변환을 회전이라고 부른다. 그런 의미에서 로렌츠 변환은 4차원 시공간의 회전을 의미한다고 볼 수 있다.

이제 이걸 물리에서 생각해 보자. 3차원 공간만 놓고 생각했을 때, 회전과 물리 법칙 간의 관계를 생각해 보자. 우리가 어떤 실험 혹은 관측을 하고 있는 상황이라고 가정해 보자. 예를 들어 특정한 전하 분포를 만들어 맥스웰 방정식을 확인하는 중이라고 하자. 아예 주변의 다른 영향들을 제거하기 위해 이 실험이 주변에 지구도 태양도 아무 것도 없는 (태양계를 비롯해 모든 것으로부터 아주아주 먼) 우주 공간에서 이루어진다고 해 보자. 이때 이 실험실이 통째로 조금 돌아간다고 해서 실험 결과가 바뀔까? 혹은 맥스웰 방정식이 다르게 적용될까? 그건 아닐 것이다. (위에서 상대성 원리를 설명할 때 예를 들었던 실험실들이 이에 해당한다.) 이렇듯, 일반적으로 회전에 대해서 물리 법칙은 변하지 않아야 할 것이다. 3차원 회전의 경우 맥스웰 방정식 뿐만 아니라 뉴턴 역학도 변하지 않으며 뉴턴의 중력 법칙 또한 그렇다.

그런데 뉴턴 역학은 갈릴레이 변환에서 변하지 않지만 맥스웰 방정식은 그렇지 않다. 맨 위 소개에서 나왔던 상황인 것이다. 따라서 만약 갈릴레이 변환을 우리 자연이 갖고 있는 '회전'이라고 본다면 맥스웰 방정식은 물리 법칙으로 보기 어려워지게 된다. 하지만 아인슈타인의 아이디어와 통찰력으로 얻어진 결과에 따르면 자연의 진짜 '회전'은 3차원 회전 + 갈릴레이 변환이 아니라 로렌츠 변환인 것이다.[15] 그리고 맥스웰 방정식인 이 회전에 대해 불번이고. 따라서 맥스웰 방정식은 상대성 이론, 즉 로렌츠 변환이 자연의 진정한 회전이라는 프레임[16] 아래에서 올바른 이론인 것이고, 지금까지 관측된 결과에 따르면 맥스웰 방정식 뿐만 아니라 모든 물리 법칙에 대해서도 그래야 할 것임이 분명하다.

이러한 상대성 이론의 틀 안에서는 어떤 양이 물리적으로 의미를 가지는가를 논할 수 있게 된다. 예를 들어 속도의 x 좌표 값은 그 하나 만으로 물리적인 의미가 없다. 이 값이 의미를 가지려면 다른 성분들도 모두 필요하게 된다. 이해를 쉽게 하기 위해 뉴턴 역학에서 설명하도록 하자. 이 경우 y 좌표 값과 z 좌표 값이 같이 있어야 속도는 그 물리적 의미를 갖는데, 사실 그 이유는 간단하다. 회전을 시킬 때 x 좌표 값 하나만 가지고 속도의 x 좌표 값이 변하는 게 아니기 때문이다. 게다가 그 변환은 우리가 아는 행렬 곱 변환이다. 이러한 이유로 인해 백터는 주어진 회전 변환에 대해 행렬 곱 형식으로 변환이 되는 물리량을 의미한다. 스칼라도 그런 식으로 해석이 되어야 한다. 단순히 크기만 갖는, 즉 성분이 하나 짜리인 물리량이 아니라는 것이다. 정확하게, 스칼라는 회전 변환에 대해서 그 양이 전혀 변하지 않는 물리량을 가리키는 말이다. 따라서 속도의 x 성분은 스칼라도 아니다. 반면에 뉴턴 역학의 경우 속력(속도의 크기)는 스칼라인데, 벡터의 크기는 회전 변환에 대해 변하지 않기 때문이다. 이런 식으로 텐서가 정의될 수 있는데, 성분은 여러 개이면서 각 인덱스 별로 회전 변환이 따로 적용이 된다면 그것을 텐서라고 부를 수 있다. 그러면 벡터는 딱 하나의 인덱스만 갖는 텐서로 볼 수 있을 것이다. 말로 하면 어려운데, 이걸 수식으로 나타내면 이렇다. 회전 변환을 나타내는 행렬을 [math]A[/math]라고 하자. 그리고 그 성분들을 [math]A_{ij}[/math]라고 표기하자. 그러면 스칼라 [math]s[/math], 벡터 [math]\vec{v}[/math], (인덱스가 2개인) 텐서 [math]T_{ij}[/math][math]A[/math]에 의한 회전에 대하여 다음과 같이 변환된다.[17]

[math]s \to s, [/math]
[math](\vec{v})_i \to \left( \sum_{j = 1}^3 A_{ij} (\vec{v})_j \right), [/math]
[math]T_{ij} \to \left( \sum_{r = 1}^3 \sum_{s = 1}^3 A_{ir} A_{js} T_{rs} \right).[/math]

뉴턴 역학에서 벡터가 아닌 텐서로 좋은 예는 아무래도 관성 모멘트 텐서일 것이다. 정확하게 위와 같이 변환을 한다. 아무튼, 이런 식으로 물리량들은 변환이 되어야 하며, 그렇지 않은 양들은 물리적인 의미를 부여하기 어렵다. 만약 주어진 한 양이 잘 정의된 물리량이려면 반드시 위와 같은 변환을 만족시키기 위한 다른 물리량들이 있어야 할 것이다. 좀 전에 예를 든 속도의 x 성분이 그 예인데, 이 값이 진정 물리적으로 의미를 가지려면 나머지 y 성분과 z 성분이 필요하다. 즉, 3개의 물리량이 필요하다는 것이다. 스칼라의 경우라면 하나만 있어도 되겠지만. 인덱스 2개 텐서라면 9개가 필요할 것이다. 즉, 1, 3, 9, ..., 3^n개의 성분이 물리적으로 의미있는 양이 되기 위해 필요한 셈이다.

상대성 이론에서는 이것을 그대로 확장한 논리로 물리량들을 꽉 잡는다. 그러고 보면 고등학교 때에도 이런 얘기는 못 들어 봤잖은가. 희한하게도 이 논리는 상대성 이론에서 제대로 써먹힌다. 물론 상대성 이론을 배우거나 써먹기 전에는 좀 전에 말한 회전이며 진짜 물리량이며 하는 것들이 별 쓸모가 없을지도 모른다. 하지만 물리학의 베이스를 아예 새로 다지는 상대성 이론의 경우 이러한 논리는 무척 중요하다. 특히 이론을 만들고자 하는 경우라면. 아무튼, 상대성 이론은 스칼라, 벡터, 텐서 등으로 표현되는 물리량이 진정 물리적으로 의미가 있다는 것을 강조한다. 사실 더 있긴 한데, 스피너가 바로 그것이다. 이것은 로렌츠 변환의 '표현(representation)'를 이해해야 알 수 있는 양인데... 자세한 내용은 해당 항목 참조. 이러한 논리 기반 위에 맥스웰 방정식이 견고해지고 일반 상대성 이론이 세워질 수 있는 것이다.

상대론으로 돌아가 보자. 뉴턴 역학의 경우에서 써먹었던 그 논리를 그대로 적용시키고자 한다면 일단 '3차원 회전'을 '4차원 로렌츠 변환'으로 바꿔야 한다. 그렇다면 필요한 성분의 수도 바뀌어야 한다. 회전 변환의 행렬이 더 이상 3x3이 아닌 4x4니까. 따라서 상대성 이론의 경우라면 스칼라 1개, 벡터 4개, 인덱스 2개 짜리 텐서 16개, ...와 같이 말이다.

더군다나 상대성 이론의 경우라면 3차원의 경우와 다른 형태의 변환도 가능하다. 다음 식들이 이를 보여주는데, 첫번째 식은 기존의 식이고 두번째 식은 새로운 식이다.

[math]u^\mu \to \left( \sum_{\nu = 0}^3 A^{\mu}_{\nu} u^\nu \right), [/math]
[math]u_\mu \to \left( \sum_{\nu = 0}^3 (A^{-1})_{\mu}^{\nu} u_\nu \right), [/math]

여기서 위 첨자로 붙은 것들은 제곱이 아니라 인덱스 번호다. 착각하지 말 것.[18] 그리고 성분의 번호는 1, 2, 3, 4가 아닌 0, 1, 2, 3으로 매겨지며, 이들 네 개를 한꺼번에 가리키는 인덱스일 경우 그리스 문자로, 0 빼고 나머지(1, 2, 3)만 나타내는 인덱스인 경우 알파벳(i, j, k, ...)으로 보통 표기한다.[19] 표기법은 이쯤 하고, 표기법만 바뀌었지 사실 첫번째 식은 3차원에서의 기존 식과 다를 게 없다. 두번째 식은 좀 다르다. 사실 3차원의 경우에는 회전 행렬의 특성 상 위 두 식이 사실 상 다를 게 없는 식들인데, 로렌츠 변환 아래에서는 그렇지 않다. 첫번째 식과 같이 변환되는 경우 주어진 물리량이 contravariant(반변)하다고 하고, 두번째 식과 같이 변환되는 경우에는 covariant(공변)하다고 한다. 수학적으로 보면 듀얼(dual)의 개념과 맞닿아 있는 것인데, 자세한 설명은 생략하자...

하나 더. 상대성 이론으로 기술되는 경우에 주어진 텐서(스칼라, 벡터 포함)들로 또다른 텐서들을 만들어 낼 수 있다. 예컨대 두 벡터 [math]A^\mu[/math][math]B^\mu[/math]를 생각해 보자. 그러면 [math]A^\mu B^\nu[/math] 같이 성분들을 곱해서 얻은 물리량은 인덱스가 2개인 텐서로 볼 수 있다. 실제로 위에서 쓴 변환을 적용시키면 저 식이 텐서의 로렌츠 변환을 잘 만족한다는 것을 알 수 있다. 한편, 이렇게 인덱스 수가 늘어나는 경우 말고 인덱스 수를 줄여주면서 로렌츠 변환을 만족하는 물리량을 만들 수 있다. 예를 들어 텐서 [math]C^{\mu \nu}[/math]가 있다고 하자. 이때 [math]\eta_{\mu \nu}[/math][math]\mu = \nu = 0[/math]일 때 1, [math]\mu = \nu = 1, 2, 3[/math]일 때 -1, [math]\mu \ne \nu[/math]일 때 0인 값이라고 하자. 그러면

[math]C^\mu_\mu := \eta_{\mu \nu} C^{\mu \nu}[/math][20]

은 로렌츠 변환을 가해도 변하지 않는다는 것을 알 수 있다. (우변의 네 인덱스에 대해 각각 로렌츠 변환을 가한 다음 정리해 보면 금방 알 수 있다.) 이런 식으로 두 개의 다른 인덱스를 줄여주는 것을 축약(contraction)이라고 부른다. 이러한 축약은 위에서 들었던 [math]A^\mu B^\nu[/math]에도 적용이 가능하다. 즉, [math]A^\mu B_\mu[/math] 같은 게 가능하다. 그리고 [math]\eta_{\mu \nu}[/math]는 하나의 텐서처럼 행동한다. 아예 주어진 contravariant 벡터를 가지고 [math]B_\mu = \eta_{\mu \nu} B^\mu[/math]와 같은 covariant 벡터를 만들 수 있다. 사실 텐서 [math]\eta_{\mu \nu}[/math]는 상대성 이론에서 매우 중요한 역할을 하는 것으로, 위에서 로렌츠 변환 행렬을 설명할 때 썼던 행렬 [math]J[/math]와 같은 것이다. 대각 성분이 모두 같지 않고 하나(시간 축에 해당하는 것)만 부호가 다른 것은 상대성 이론이 그리는 시공간의 기하학을 잘 드러낸다.

2.3 축약과 내적, 기하학적 해석

한편으로 축약은 기하학적으로 스칼라 곱 혹은 내적과 같은 것으로 볼 수 있다. 3차원 유클리드 공간에서 두 벡터의 내적은 [math]\vec{v} \cdot \vec{w} = \sum_{i = 1}^3 v_i w_i[/math]로 주어지는 것임을 우리는 안다. 이 식은 사실 이렇게 쓸 수 있다.

[math]\vec{v} \cdot \vec{w} = \sum_{i = 1}^n \sum_{j = 1}^n \delta_{ij} v_i w_j[/math].

물론 [math]\delta_{ij}[/math]는 크로네커 델타로, 두 인덱스(i, j)가 같으면 1, 다르면 0인 값이다. 생략된 [math]\delta_{ij}[/math]가 사실 '3차원 유클리드 공간'을 나타내 주는 것이라고 말할 수 있는 것이다. 모든 벡터 공간에는 이런 식으로 자연스럽게 내적을 정의할 수 있는데, 그 방법은 정말 다양하다. 그 중 하나가 바로 3차원 유클리드 공간이고. 물론 위 식에서 n을 4로 바꿔 쓰면 (혹은 n은 3으로 두고 맨 처음 인덱스만 1이 아닌 0으로 시작하게 하면) 저 식은 '4차원 유클리드 공간'에서의 내적이 되는 것이다.

다시 4차원에서 두 벡터의 축약을 보자. (이해를 돕기 위해 잠시 합 기호([math]\sum[/math])를 살렸다.)

[math]A^\mu B_\mu = \sum_{\mu = 0}^3 \sum_{\nu = 0}^3 \eta_{\mu \nu} A^\mu B^\nu[/math].

위에서 쓴 유클리드 공간에서의 내적 식과 거의 똑같다. [math]i[/math][math]\mu[/math]로, [math]j[/math][math]\nu[/math]로 바뀐 거라든가 인덱스가 한 칸 씩 옮겨진 건 바뀐 것도 아니라는 걸 여기까지 읽은 위키러들은 알 것이다 다만 [math]\delta_{ij}[/math][math]\eta_{\mu \nu}[/math]로 바뀌었을 뿐이다. 이것은 '4차원 유클리드 기하학'과 4차원 시공간의 기하학이 다르다는 것을 의미한다. 두 기하학이 다르다는 것은 위에서도 밝했던 것이지만, 그것이 내적에서 드러나는 것으로 이해하는 것은 상대성 이론을 이해하는 데 있어서 매우 중요한 내용이다. 사실 내적이 이렇게 주어진다는 것 자체만으로도 관성 좌표계 간의 좌표 변환이 반드시 로렌츠 변환이어야 한다는 것을 의미하기도 한다.[21] 즉, 축약(내적)을 정한다는 것, 그러니까 내적 식에서 [math]\delta_{ij}[/math] 혹은 [math]\eta_{\mu \nu}[/math] 또는 다른 것들 중 어떤 것이 들어가느냐 함을 정한다는 것은 곧 관성 좌표계 간의 좌표 변환을 결정한다는 것이고, 한편으로는 (시)공간의 기하학적 성질을 결정지어 준다는 것이다.

그리고 [math]\delta_{ij}[/math] 혹은 [math]\eta_{\mu \nu}[/math] 자리에 뭐가 들어가느냐 하는 문제는 나중에 일반 상대성 이론에서 중요한 역할을 하게 된다.

2.4 로렌츠 불변성의 예

특수상대성이론의 특수란 말은, 이 이론이 등속도로 운동하는 관측자가 보는 경우에 한정된 특수한 이론이라는 의미이다.
앞서 살펴본 내용들은 일반물리학에서도 잘 다루지 않을 정도로 꽤 까다로운 개념들이다. 하지만 과학에 관심이 있는 사람이라면 누구나 시간 지연, 길이 수축, 질량-에너지 동등성 등을 많이 들어보았을 것이다. 사실 광속 불변의 원리에 철저히 입각하면 시간이 늦게 흘러가거나, 길이가 줄어드는 이유를 무리 없이 설명할 수 있다. 특히 시간이 늦어지는 현상은 일반인에게 정성적으로설명하는 방식이기도 하다.

여기서 어떤 계산을 하게 되면 [math](ct)^2-(x^2+y^2+z^2)[/math]라는 값이 이 값을 관측하는 관성계와 관계 없이 같다는 결과를 얻기 때문에 4차원과 연관짓기 시작했다고 한다.[22] 이를 시공간 거리라고 부르며, 사실 로렌츠 변환을 유도함에 있어서 결정적인 역할을 하는 식이다. 또한, 위에서 말한 시공간 거리의 일정은 로렌츠 변환 아래에서 일정하다는 뜻으로, 이는 시공간 거리와 로렌츠 변환을 이용하여 새로운 기하학[23]을 만들어낼 수 있다는 의미이기도 하다. 이와 관련된 기하학이 바로 쌍곡선 기하학. 즉, 우리 우주를 지배하는 기하학은 우리가 아는 유클리드 기하학과는 판이하게 다른 것이다.[24][25]

3 일반 상대성이론

사실 이제 진짜 헬게이트 시작이다
일반상대성 이론은 가속운동계도 다룰 수 있도록 확장한 상대성 이론이다. 일반상대성 이론의 요지는, 중력-가속도 등가이다(등가원리). 곧, 중력과 가속도는 구별할 수 없다는 뜻이다.

그런데 이 등가원리도 곧이 곧대로 받아들이기에는 문제가 너무 많다. 그 중 몇 가지만 보자.

  • 가속을 받는 물체와 나란한 (비관성)계에서 가속의 효과를 '장'으로 표현하자면, 그 크기가 우주 끝까지 가도 0이 되지 않는다. 반면 중력은 무한히 멀어질 수록 0으로 접근한다.[26]
  • 중력에는 있는 조석력[27]이 비관성계에서는 어떻게 해도 나오지 않는다.

이러한 문제가 있지만, 그렇다고 해결 못하는 건 아니다. 약간의 제약을 둠으로써 등가원리를 제대로 쓸 수 있게 된다. 헌데, 제약을 주는 방법도 하나만 있는 건 아니다.

  • 그냥 '중력과 가속도는 구별이 안 된다'라고 하는 건 모든 공간에서 그렇다라고 주장하는 걸 내포한다. 이를 축소시켜, '충분히(아주) 작은 영역에서' 중력과 가속도는 구별이 안 된다라고 주장하면 위의 문제들이 모두 해결된다.[28]
  • 다 갖다 버리고, 그냥 관성질량과 중력질량이 같다고만 한다.[29]

그리고 이 가정들 각각으로부터 출발하여 일반상대론을 구축할 수 있다! [30] 정말 신기한 건, 어느 방법을 택하든, 결과는 똑같다는 것.[31]

물리학자들은 일반상대론이 물리학 이론들 중에서 가장 아름다운 이론이라고 평가하는데, 그 이유 중 하나가 바로 아주 간단하고도 대담한 몇몇 가정(특수상대론의 가정들+등가원리[32])들만 가지고 온 우주에 성립하는 법칙을 수학적으로 '유도해'냈다는 점에 있다. 즉, 순수하게 인간의 논리적 사유만으로 자연의 거대한 법칙 중 하나가 덜컥 나왔다는 것이다. 예컨대 뉴턴의 운동법칙과 중력 이론, 맥스웰 방정식 등은 수많은 실험과 관찰에서 찾아낸 '패턴'으로 인간의 사유만으로 얻어진 산물은 아니었다.[33] 하지만, 아인슈타인은 쇼파에 털썩 앉을 때 들었던 그 아이디어[34]로부터, 그것도 관성질량과 중력질량이 같을 것 같다는 것 외엔 어떠한 실험적 데이터도 없이[35] 출발하여 전 우주를 지배하는 중력의 이론을 만들어낸 것이다. 그리고 우리가 알다시피 이 이론은 우리의 우주를 아주 잘 설명해 주고 있다. 이는 인류 역사 상 단 한 번도 일어난 적이 없었던 사건으로, 다소 과장하여 말하자면 인류 지성의 위대한 승리라고 할 만한 일이다. 이것만 봐도 일반상대론이 가장 아름다운 이론이라고 칭송받을 만하다는 걸 알 수 있다.[36] 그 이후로, 논리적 사유를 최대한 이용하여 물리 법칙을 이끌어내려는 시도가 여러 차례 있었으며, 그 결과로 나온 것 중에 디랙 방정식과 양자전자기역학[37], 그리고 초끈이론이 있다.

3.1 등가원리: 시공간은 휘어져 있을 것이다

등가원리를 자세히 살펴 보자. 아인슈타인의 생각대로라면 사실 자유 낙하하는 물체는 자신이 낙하하고 있다는 것을 모를 것이다. 예를 들어 위에서 든 연구실을 다시 가져오되, 이번엔 연구실을 벽으로 둘러 싸 안에서 바깥을 아예 볼 수 없도록 만들었다고 하자. 이제 이 연구실을 공기저항 없이 지표면 근처에서 자유 낙하시키자. 그러면 이 연구실 안에서 일어나는 일은 연구실이 주변에 아무 것도 없는 텅 빈 우주 공간에 놓여 있을 때 일어나는 일과 전혀 다를 게 없다는 것이 아인슈타인의 등가원리인 것이다. 즉, 떨어지는 엘리베이터 안의 사람은 (엘리베이터가 다 닫혀 있을 때) 자신이 자유 낙하하고 있는 중인지 아니면 우주 공간에 떠 있는지 구분할 수 없다는 것이다.

가만 보면 이 역시 우리의 상식에 벗어나 보인다. 사실 우리는 떨어지는 것을 느낄 수 있다...고 생각하고 있다. 자유 낙하까진 아니더라도 바이킹이나 롤러 코스터 혹은 번지 점프 같은 걸 즐길 때 그 느낌은 지표면에 발을 붙이고 있을 때와 다르다. 그래서 우리는 낙하하고 있는 지 아닌 지를 알 수 있을 것 같다. 하지만 더 깊게 생각해 보면 그렇지 않다는 것을 알 수 있다. 우리가 지표면에 발을 붙이고 있을 때에는 내장 등의 조직들이 축 늘어져 있는 상태이다. 그리고 우리 몸은 이런 상태에 익숙해져 있는 상태이다. 이 상태에서 자유 낙하를 하면 그런 조직의 늘어짐이 풀릴테고 우리는 그것을 느끼는 것이다. 하지만 이러한 풀림은 중력이 없는 공간에서도 그대로 생길 것이다. 즉, 자유 낙하를 할 때와 중력이 없는 공간에 놓여 있을 때 우리 몸이 느끼는 것은 완전히 똑같다. [38]

이 사실을 물리학적으로 이렇게 볼 수 있다. 자유 낙하하는 물체의 좌표계는 관성 좌표계와 다를 게 없다는 것이다. 지표면에 붙어 있는 관찰자의 좌표계가 아닌, 자유 낙하하는 관찰자의 좌표계가 말이다. 이 논리대로라면 사실 지표면에 붙어있는 관찰자의 좌표계는 (수직 항력 등에 의한) 비관성 좌표계인 셈이다. 이 역시 우리의 상식에서 벗어나 보인다. 하지만 이러한 인식의 전환이 상대성 원리를 더 일반적인 케이스로 확장시키는데 있어서 지대한 공헌을 해 준다.

여기에서 하나 재밌는 걸 볼 수 있다. 자유 낙하하는 실험실 안에서 벌어지는 일은 텅 빈 우주 공간 속에서 일어나는 일과 다를 게 없다고 했다. 그러면 이 안에서 레이저를 쐈을 때 그 빛은 직진할 것이다. 그런데 이걸 지표면에서 본다면 이야기가 달라진다. 안에서 봤을 때 빛이 직진하는 것으로 보이려면 바깥에서는 그 빛이 실험실과 같이 '낙하'하고 있어야 한다는 것을 알 수 있다. 즉, 빛이 휘어져서 진행하는 것으로 보일 것이다. 중력의 영향을 받지 않을 것으로 여겼던 빛은 등가원리를 놓고 봤을 때 어느 좌표계에서 봤을 때 휘어진다는 것이다. 그런데 이것은 가만 생각해 보면 그리 놀라운 게 아니다. 예를 들어 돌고 있는 회전 목마에 카메라를 설치해 놓고 그 카메라로 바깥에 서 있는 한 사람이 쏘는 레이저 빛을 촬영한다고 해 보자. 이 카메라에 촬영된 빛은 휘어져서 진행하는 것처럼 보일 것이다. (만약 주변에 아예 아무 것도 없다면 영상만 봤을 때 카메라가 움직이고 있다는 것조차 모를테니 정말 그렇게 보일 것이다.) 사실 이 현상과 중력에 의하여 빛이 휘어져 보이는 것은 다를 게 없는 현상이다. 둘 다 비관성 좌표계에서 빛을 본 것이기 때문에 벌어지는 현상이기 때문이다. 어쨌든 이 역시 상식과 어긋나 보이는 현상이긴 하지만...

진짜 이상한 것은 따로 있다. 앞서 등가원리에 따라 자유 낙하하는 실험실 안의 일은 팅 빈 우주 공간에 있을 때 벌어지는 일과 구분이 안 간다고 했었다. 만약 지표면이 무한히 넓고 평평하다면 이 말이 완전히 맞을 것이다. 하지만 실제 지구는 둥글고, 그로 인해 위에서 설명한 것이 완전히 맞아 떨어지지는 않는다. 조석력(tidal force)이 바로 그 원인이다. 조석과는 다르다 조석과는! 다음 그림을 보자.

파일:조석력.png

왼쪽 그림은 (오른쪽에 있는)다른 천체로 인해 해당 천체가 받는 중력을 표시한 것이다. 뉴턴중력 법칙에 따르면 중력은 거리의 제곱에 반비례한다. 따라서 위 그림의 세 화살표가 위치한 각 지점에서 중력의 크기는 각기 다 다를 것이다. 이러한 차이는 천체의 좌표계(천체와 나란히 움직이는 관찰자가 봤을 때의 좌표계)에서도 드러난다. 이는 오른쪽 그림처럼 구가 양 옆으로 쭈욱 잡아당겨지는 힘을 받는 것으로 나타날 것이다. 이것이 바로 조석력이다. 그리고 조석력은 관성 좌표계에서 나타나지 않는 것이다.

이걸 놓고 보면 등가원리가 틀린 것으로 보일 것이고, 보통 사람들이었다면 등가원리를 버렸을 것이다. 하지만 아인슈타인은 달라도 너무나도 달랐다. 그는 이렇게 또 한 번 발상의 전환을 시도했다. 등가원리는 여전히 옳다. 다만 시공간이 휘어진 것이다.[39] 이러한 발상의 전환이 상대성 이론의 확장을 가능케 했던 것이다.

등가원리에 대한 대강의 설명은 끝났다. 이제 남은 것은 상대성 이론을 확장시키는 것이다.

3.2 상대성 원리의 확장: 물질시공간을 구부려야 한다

상대성 이론으로 돌아가자. 한 가지 필요한 것이 있다. 먼저 바로 위에서 설명한 것들을 모조리 잊어 버리는 것이다. 심지어 중력이 존재한다는 것마저! 즉 지금 우리는 중력이란 게 있는 지도 모른다고 친 상태이다. 어쩐지 바로 전에 비슷한 걸 한 것 같았는데 다만, 두 가지는 남겨 두자. 하나는 등가원리 그 자체인데, '중력'(자유 낙하) 같은 것 없이 이를 표현한다면 이렇게 표현할 수 있을 것이다. '어느 물리 시스템이든 적당한 좌표계가 존재하여 이 좌표계는 각 점의 (좁은) 근방에서 근사적으로 관성 좌표계와 같다.' 그리고 또 하나는 시공간이 휘어져 있을지도 모른다는 생각이다.[40] 이 두 가지를 가지고 상대성 이론을 확장시키자. 그리고 이렇게 했을 때 우리가 잊어 버렸던 중력이 어떻게 돌아오는가를 보도록 하겠다.

특수 상대성 이론에서는 관성 좌표계 간의 좌표 변환을 다뤘었다. 이때 이들 좌표계는 모두 시간축 + 직교 공간 좌표계로 기술되었다. 그런데 좌표 변환이라는 게 그런 것만 있진 않다. 예컨대 직교 좌표계에서 구면 좌표계로의 좌표 변환도 가능하다. 그리고 이러한 좌표 변환을 하고 나서 물리 법칙을 다뤄도 잘 쓰이고 있는 것을 우리는 잘 안다. 당장 쿨롱의 법칙으로 쌍극자 모멘트를 계산하려고 할 때에도 거의 항상 구면 좌표계에서 다루고 있지 않은가. 바로 여기에서 일반 상대성 이론이 출발한다. 일반 상대성 이론은 이러한 일반적인 좌표 변환에서도 물리 법칙들이 불변할 것을 요구한다.

먼저 일반적인 좌표 변환에 불변한다는 것이 무엇인지부터 따져 보자. 위에서 벡터는 다음과 같이 변환된다는 것을 설명했었다.

[math]X^\mu \to (X')^\mu = A^\mu_\nu X^\nu[/math],
[math]Y_\mu \to (Y')_\mu = (A^{-1})^\nu_\mu Y_\nu[/math].

여기서 [math]A^\mu_\nu[/math]는 로렌츠 변환 행렬이다. 그런데 사실 이 로렌츠 변환 행렬은 이렇게 쓸 수 있다.

[math]A^\mu_\nu = \frac{\partial (x')^\mu}{\partial x^\nu}[/math],
[math](A^{-1})^\nu_\mu = \frac{\partial x^\nu}{\partial (x')^\mu}[/math].

따라서 위 변환 식은 다음과 같이 쓸 수 있다.

[math]X^\mu \to (X')^\mu = \frac{\partial (x')^\mu}{\partial x^\nu} X^\nu[/math],
[math]Y_\mu \to (Y')_\mu = \frac{\partial x^\nu}{\partial (x')^\mu} Y_\nu[/math].

이제 이것을 확장시키자. 일반 상대성 이론에서는 벡터라고 불리는 것들이 모든 좌표 변환 [math]x^\mu \to (x')^\mu[/math]에 대해서 위와 같이 변환되는 것이어야 한다고 정한다. 로렌츠 변환에서만 성립하던 것을 그대로 일반화시킨 셈이다. 물론 2개 이상의 인덱스를 가지는 텐서에 대해서도 마찬가지로 로렌츠 행렬을 위와 같은 좌표 변환 행렬로 바꿔서 그 변환이 이루어진다고 보는 것이다.

이러한 확장을 하는 것은 좋은데, 그러면 기존의 특수 상대성 이론에서 기술되었던 이론들에 수정이 조금 가해져야 한다. 두 가지 정도를 들 수 있다.

첫째, 미적분을 바꿔야 한다. 특수 상대성 이론에서 [math]x^\mu \to (x')^\mu[/math]의 좌표 변환이 일어날 때 미분 연산자 [math]\frac{\partial}{\partial x^\mu}[/math]는 다음과 같이 변환된다.

[math]\frac{\partial}{\partial x^\mu} \to \frac{\partial}{\partial (x')^\mu} = \frac{\partial x^\nu}{\partial (x')^\mu} \frac{\partial}{\partial x^\nu} = (A^{-1})^\nu_\mu \frac{\partial}{\partial x^\nu}[/math].

이로부터 미분 연산자는 마치 covariant 벡터처럼 변환된다는 것을 알 수 있다. 따라서 [math]\frac{\partial B}{\partial x^\mu}[/math], [math]\frac{\partial V^\nu}{\partial x^\mu}[/math] ([math]B[/math], [math]V^\nu[/math]는 각각 스칼라와 벡터) 같은 것들은 각각 벡터와 텐서로 볼 수 있게 된다.

이제 위에서 설명했던 대로 이 변환을 관성 좌표계 간의 좌표 변환 만이 아닌 일반적인 좌표 변환에서도 성립하는 것으로 보자. 그러면 문제가 생긴다. [math]\frac{\partial B}{\partial x^\mu}[/math]는 잘 변환이 된다는 것을 알 수 있고 따라서 별 문제는 없다. 문제는 스칼라가 아닌 물리량의 도함수의 변환이다. 다음을 보자.

[math]\frac{\partial V^\nu}{\partial x^\mu} \to \frac{\partial (V')^\nu}{\partial (x')^\mu} = \frac{\partial x^\alpha}{\partial (x')^\mu} \frac{\partial}{\partial x^\alpha} \left( \frac{\partial (x')^\nu}{\partial x^\beta} V^\beta \right) \ne \frac{\partial x^\alpha}{\partial (x')^\mu} \frac{\partial (x')^\nu}{\partial x^\beta} \left( \frac{\partial V^\nu}{\partial x^\mu} \right)[/math].

만약 [math]\frac{\partial (x')^\nu}{\partial x^\beta}[/math]가 상수라면 위 식의 마지막 두 변은 일치했을 것이다. 하지만 일반적인 좌표 변환에서는 저 행렬이 상수가 아니다. 따라서 두 변은 같지 않고, 따라서 벡터의 도함수는 텐서처럼 변환이 되지 않는다. 즉, 텐서가 아니게 된다. 이것은 더 높은 인덱스를 가진 텐서의 도함수에서도 마찬가지다.

물리 법칙에 도함수가 반드시 필요하다는 것을 생각하면 이것은 반드시 고쳐야 할 문제이다. 이를 위해 아예 도함수 자체를 다른 것으로 교체해야 한다. 공변 도함수(covariant derivative)가 바로 그것인데, 이렇게 바꿔 쓰자는 것이다.

[math]\partial_\mu A^\nu \to D_\mu A^\nu = \partial_\mu A^\nu + \Gamma^\nu_{\mu \lambda} A^\lambda[/math],
[math]\partial_\mu A_\nu \to D_\mu A_\nu = \partial_\mu A_\nu - \Gamma^\lambda_{\mu \nu} A_\lambda[/math].

여기서 [math]\Gamma^\nu_{\mu \lambda}[/math]는 Christoffel 기호인데, 일단 텐서는 아니라는 것을 직접 변환시켜 보는 것으로 확인해 볼 수 있다. 하지만 저렇게 텐서가 아닌 보통 도함수와 결합하여 텐서를 만들 수 있다. (인덱스 수가 더 높은 텐서의 도함수 같은 경우, 공변 도함수는 좀 더 복잡해진다. 그래 봤자 인덱스 하나 당 Christoffel 기호가 하나 씩 더 붙는 것에 지나지 않지만.) 이런 식으로 특수 상대성 이론에서 쓰이던 도함수들을 전부 공변 도함수로 바꿔야 할 필요가 있다.

미분이 바뀌었으니 적분도 바뀌어야 할 것이다. 여러 가지 적분이 있지만 여기서는 4차원 적분만 다뤄 보겠다. 특수 상대성 이론에서 4차원 적분은 그 자체로 불변하는데, 다음 식으로부터 분명하다.

[math]d^4 x \to d^4 x' = \left| \det{\frac{\partial (x')^\mu}{\partial x^\nu}} \right| d^4 x = \left| \det{A^\mu_\nu} \right| d^4 x.[/math]

이때 로렌츠 변환 행렬의 행렬식(determinant)는 항상 1 혹은 -1이다. 따라서 [math]d^4 x' = d^4 x[/math]임을 알 수 있다. 이것은 특수 상대성 이론, 즉 좌표 변환이 관성 좌표계 간의 변환일 때의 이야기였다. 하지만 일반적인 좌표 변환의 경우, [math]\left| \det{\frac{\partial (x')^\mu}{\partial x^\nu}} \right|[/math]는 항상 1이 아니다. 따라서 [math]d^4 x'[/math][math]d^4 x[/math]는 일반적으로 같지 않다.

그런데 만약 어떤 텐서 [math]g_{\mu \nu}[/math]를 이용하면 다음을 알 수 있다.

[math]\sqrt{-\det{} g_{\mu \nu}} d^4 x \to \sqrt{-\det{} (g')_{\mu \nu}} d^4 x'[/math]
[math] = \sqrt{-\left( \det{\frac{\partial x^\alpha}{\partial (x')^\mu}} \right) \left( \det{g_{\alpha \beta}} \right) \left( \det{\frac{\partial x^\beta}{\partial (x')^\nu}} \right)} \left| \det{\frac{\partial (x')^\mu}{\partial x^\nu}} \right| d^4 x[/math]
[math] = \sqrt{-\det{} g_{\mu \nu}} d^4 x.[/math]

(여기서 행렬 [math]\frac{\partial (x')^\mu}{\partial x^\nu}[/math]의 역행렬이 [math]\frac{\partial x^\nu}{\partial (x')^\mu}[/math]이므로 이들의 행렬식이 서로 역수 관계임을 이용하였다.)

따라서 [math]\sqrt{-\det{(g')_{\mu \nu}}} d^4 x' = \sqrt{-\det{g_{\mu \nu}}} d^4 x[/math]가 성립한다. 즉, [math]\sqrt{-\det{g_{\mu \nu}}} d^4 x[/math]는 일반적인 좌표 변환에 대해서 불변이다. 이는 도함수에서 그랬던 것과 마찬가지로 특수 상대성 이론에서 쓰였던 모든 [math]d^4 x[/math][math]\sqrt{-\det{g_{\mu \nu}}} d^4 x[/math]로 교체해야 한다는 것을 말해 준다. 여기서 마치 임의인 것처럼 쓰였던 텐서 [math]g_{\mu \nu}[/math]가 있는데, 곧 이 텐서의 정체에 대해 (그리고 이 텐서의 행렬식이 항상 음수라는 것도) 설명할 것이다.

사실 이 새로운 텐서의 정체는 미적분 외의 또다른 수정에서 드러난다. 위에서 축약을 기하학적으로 내적으로 볼 수 있다고 했었고, 그 과정에서 [math]\eta_{\mu \nu}[/math]가 쓰였었다. 이 텐서 [math]\eta_{\mu \nu}[/math]는 시공간의 기하학적 구조를 결정지어 준다는 것 또한 위에서 설명된 내용이었다. 그런데 일반적인 좌표 변환과 시공간이 휘어진다는 사실을 고려한다면 [math]\eta_{\mu \nu}[/math]가 그대로 있지는 못한다는 것을 짐작할 수 있다. 즉, 위에서 정의한 [math]\eta_{\mu \nu} = 1 (\mu = \nu = 0)[/math], [math]\eta_{\mu \nu} = -1 (\mu = \nu = 1, 2, 3)[/math], [math]\eta_{\mu \nu} = 0 (\mu \ne \nu)[/math]를 만족하는 [math]\eta_{\mu \nu}[/math]가 축약 혹은 내적에 계속 쓰이기는 어렵다는 것이다. 실제로 관성 좌표계 [math](x_0, x_1, x_2, x_3) = (ct, x, y, z)[/math]에서 시간+구면 좌표계 [math]((x')_0, (x')_1, (x')_2, (x')_3) = (ct, r, \theta, \phi)[/math]로 변수 변환을 한다고 했을 때 두 벡터 [math]A^\mu[/math][math]B^\mu[/math]의 축약은

[math]A^\mu B_\mu = \eta_{\mu \nu} A^\mu B^\nu \to g_{\mu \nu} (A')^\mu (B')^\nu[/math]

로 변환되는데, 여기서 [math](A')^\mu = \frac{\partial (x')^\mu}{\partial x^\nu} A^\nu[/math], [math](B')^\mu = \frac{\partial (x')^\mu}{\partial x^\nu} B^\nu[/math]이고 [math]g_{\mu \nu}[/math][math]g_{00} = 1, g_{11} = -1, g_{22} = -r^2, g_{33} = -r^2 \sin^2{\theta}, g_{\mu \nu} = 0 \;\; (\mu \ne \nu)[/math]로 정의된다. 축약 같지 생겼는데, 분명 [math]\eta_{\mu \nu}[/math] 자리에 다른 것이 들어 갔다. 상수가 아닌 위치에 따라 축약이 바뀌는 것이다. 심지어 좀 이상한(...) 좌표 변환을 가하면 [math]g_{\mu \nu}[/math]의 대각 성분이 아닌 값([math]\mu \ne \nu[/math][math]g_{\mu \nu}[/math])마저 0이 아니게 할 수도 있다. 더군다나 시공간이 더 이상 평평하지 않은 경우, 어떤 변환을 취하더라도 [math]g_{\mu \nu}[/math]의 변환된 결과가 [math]\eta_{\mu \nu}[/math]와 같지 않을 수도 있다. 다시 말해 일반적인 좌표 변환과 시공간의 휘어짐을 고려하면 [math]\eta_{\mu \nu}[/math]에는 전혀 다른 무언가가 들어갈 수도 있다는 것이다. 그것을 흔히 [math]g_{\mu \nu}[/math]로 표기하며, 측지 텐서(metric tensor)라고 부른다.

다만 측지 텐서가 정말 아무 거나 되는 것은 곤란하다. 그렇게 되면 특수 상대성 이론과 안 맞을 수도 있기 때문이다. 이미 [math]\eta_{\mu \nu}[/math]가 전혀 다른 무언가로 교체된데다 어떠한 좌표에서도 측지 텐서가 [math]\eta_{\mu \nu}[/math]와 같지 않을 수도 있다는데, 그런 걸 어떻게 기대할 수 있겠는가 싶겠지만 사실 가능하다. 답은 임의의 한 점에서 측지 텐서 [math]g_{\mu \nu}[/math]가 매우 천천히 변하도록 좌표계를 잡는 경우를 생각하는 것인데, 그런 좌표는 각 점마다 항상 찾을 수 있으며, 근사적으로 측지 텐서가 상수이도록 할 수 있다. 여기에 대각화, 스케일 등의 변환을 더 추가하는 식으로 측지 텐서가 대각 성분만 가지며 그 성분이 1 또는 -1이도록 좌표계를 잡을 수 있다. 여기서 중요한 것은 -1의 개수인데, 만약 하나도 없다면 이 좌표계에서 벡터 간의 축약은 그야말로 [math]\sum A_i B_i[/math]로 근사될 수 있어 n차원 유클리드 기하학이 되는 것이다.[41] 여기서 이러한 좌표계가 사실 상 위에서 설명한 [math]\delta_{ij}[/math]라든가 [math]\eta_{\mu \nu}[/math]와 같은 것으로 측지 텐서를 변형시킨다는 것을 알 수 있다. 그런데 등가원리를 생각해 보면 바로 이러한 좌표계에서 해당 점의 적당한 근방을 관성 좌표계처럼 잡을 수 있다는 것을 짐작할 수 있다. 등가원리는 다름 아닌 그런 좌표 변환이 모든 점에서 항상 가능하며, 그 점의 근방에서 측지 텐서가 [math]\eta_{\mu \nu}[/math]와 같음을, 즉 특수 상대성 이론을 만족한다는 사실을 말해 준다. 즉, 등가원리는 관성 좌표계가 (근사적으로나마) 좌표 변환을 통해 나타날 수 있도록 시공간에 가해지는 제한인 셈이다. 이렇게 해서 등가원리를 통해 휘어진 시공간과 일반적인 좌표 변환을 고려하더라도 관성 좌표계라고 부를 수 있는 좌표계를 정한 것이다.

좌표 변환과 내적의 일반화와 확장을 이야기해 봤다. 상대성 이론을 확장시킨다는 것은 이런 것들을 필요로 한다는 것이다. 사실 이러한 것들, 즉 좌표 변환에 대해 [math]A^\mu \to \frac{\partial (x')^\mu}{\partial x^\nu} A^\nu[/math]와 같이 변환하면서 측지 텐서 [math]g_{\mu \nu}[/math]에 의한 내적(축약)을 갖는 대상들, 그리고 그 미적분학은 이미 수학에서 연구가 되어 있는 상태였다. 그것이 바로 미분 기하학, 특히 리만 기하학이다. 아인슈타인의 친구 그로스만이 찾아냈다던 그 리만 기하학 말이다.[42] 다만 휘어진 (시)공간과 그 일반적인 좌표 변환을 우주에다 적용시킬 용자는 아인슈타인 이전에 단 한 명도 없었다. 그렇기에 사실 상 잠들어 있었던 학문이었는데, 아인슈타인(그리고 그로스만)에 의하여 극적으로 부활한 것이다.

말이 나온 김에 미분 기하학을 좀 더 살펴 보자. 위에서 얻어진 측지 텐서로 위에서 언급한 미적분을 다시 살펴 보자. 도함수를 대체하는 공변 도함수에는 Christoffel 기호가 들어가 있다. 이때 기하학적으로 측지 텐서의 공변 도함수가 0이라는 것을 알 수 있는데, 이로부터 다음을 구할 수 있다.

[math]\Gamma^\lambda_{\mu \nu} = \frac{1}{2} g^{\lambda \alpha} \left( \partial_\mu g_{\nu \alpha} + \partial_\nu g_{\mu \alpha} - \partial_\alpha g_{\mu \nu} \right)[/math].

여기서 [math]g^{\mu \nu}[/math][math]g_{\mu \nu}[/math]의 역행렬 쯤에 해당하는 것으로, 정확하게는 [math]g_{\mu \nu} g^{\nu \lambda} = \delta_\mu^\lambda[/math]로 정해지는 텐서이다. 이런 식으로 Christoffel 기호는 측지 텐서와 그 도함수로 표현이 된다.

또한 적분에서 어떤 텐서 [math]g_{\mu \nu}[/math]를 도입했었는데, 사실 이 텐서가 바로 측지 텐서이다. 일반적으로 적분에는 이렇게 측지 텐서의 determinant가 들어가게 된다. 한 가지 특이 사항이 있는데, 위에서 설명한 등가원리에 따르면 측지 텐서는 한 좌표계(관성 좌표계)에서 (거의) [math]\eta_{\mu \nu}[/math]인데, 그 determinant는 사실 -1이다. 그런데 좌표 변환을 하게 되면 측지 텐서의 determinant는 정확하게 좌표 변환에 해당하는 야코비안(Jacobian)의 제곱 만큼 곱해지는 걸로 바뀐다. 따라서 어느 좌표계에서든 측지 텐서의 determinant는 음수이다. 제곱근 안의 마이너스 부호가 있는 이유는 바로 이것 때문이다.

아무튼 이렇게 해서 특수 상대성 이론에 맞던 물리 법칙을, 즉 관성 좌표계 간 좌표 변환에 대해 불변하던 물리 법칙을 일반적인 좌표 변환에 대해서도 그 모습이 불변하도록 수정할 수 있는 준비가 다 된 셈이다. 어차피 특수 상대성 이론과 잘 부합하는 물리 법칙들은 원하는 스칼라, 벡터, 텐서들 그리고 그것들의 도함수([math]\partial_\mu[/math] 같은 것들이 붙은 것)들을 잘 축약(내적)하여 스칼라로 만든 다음 적분한 것을 액션으로 취하여 얻어진 것이다. 예를 들어 전자기장은, 일단 소스(source)가 없을 때, 즉 [math]j^\mu = 0[/math]일 때 그 액션이 다음과 같다는 것을 위에서 봤다.

[math]S = \int \left( -\frac{1}{4\mu_0} \eta^{\mu \alpha} \eta^{\nu \beta} F_{\mu \nu} F_{\alpha \beta} \right) d^4 x = \int \left( -\frac{1}{4\mu_0} \eta^{\mu \alpha} \eta^{\nu \beta} (\partial_\mu A_\nu - \partial_\nu A_\mu) (\partial_\alpha A_\beta - \partial_\beta A_\alpha) \right) d^4 x[/math].

이것은 관성 좌표계 간의 좌표 변환에서 불변인 값이다. 하지만 위에서 봤듯이 이 식은 일반적인 좌표 변환에 대해서 불변하지 않을 것이다. 다만 간단한 교체를 통해 위 식이 일반적인 좌표 변환에 대하여 불변이도록 수정이 가능하다는 것 또한 위에서 봤었다. 단지 도함수([math]\partial_\mu[/math])를 공변 도함수([math]D_\mu[/math])로, 축약에 쓰이는 텐서 [math]\eta_{\mu \nu}[/math]를 보다 일반적인 측지 텐서 [math]g_{\mu \nu}[/math]로, 4차원 적분 [math]d^4 x[/math][math]\sqrt{-g} d^4 x[/math]로 바꾸면 된다. 여기서 [math]g[/math][math]\det{g_{\mu \nu}}[/math]를 짧게 줄여 쓴 것이다. 이런 식의 수정을 가하면 위 액션은 다음과 같이 쓸 수 있다.

[math]S = \int \left( -\frac{1}{4\mu_0} g^{\mu \alpha} g^{\nu \beta} F_{\mu \nu} F_{\alpha \beta} \right) \sqrt{-g} d^4 x[/math]
[math] = \int \left( -\frac{1}{4\mu_0} g^{\mu \alpha} g^{\nu \beta} (D_\mu A_\nu - D_\nu A_\mu) (D_\alpha A_\beta - D_\beta A_\alpha) \right) \sqrt{-g} d^4 x[/math].[43]

이렇게 해서 전자기학을 일반 상대성 이론에 맞도록 수정을 가했다. 입자가 받는 힘 또한 고려해야 하는 것일테지만 조금 어렵고 모호한 점이 있어서 생략하기로 한다. 이런 식으로 물질(전자기장을 포함)을 기술하는 일반적인 액션을 만들 수 있다. 이렇게 일반적인 좌표 변환을 해도 물리가 변하지 않는다고 (즉 상대성 원리가 적용된다고) 주장을 하기에 우리는 이 주장을 가리켜 일반 상대성 이론이라고 부르는 것이다.

이제 액션의 보다 일반적인 구조를 고찰해 보자. 그러고 보면 맥스웰 방정식을 유도할 때도 그랬고 액션에 들어갈 수 있는 것은 어떤 물리량을 가지고 만들어진 스칼라 뿐이라는 것을 봤었다. 전자기장의 경우 [math]A^\mu[/math]가 있다고 가정한 다음 이걸로 만들 수 있는 스칼라들을 고려했고 그렇게 해서 나온 전자기장의 라그랑지안이 바로 [math]-\frac{1}{4\mu_0} F_{\mu \nu} F^{\mu \nu}[/math]였다. 그런데 이 식을 보면 축약이 들어 가 있다. 사실 이미 벡터 [math]A^\mu[/math]로 스칼라를 만들겠다는 것에서부터 축약이 필요하긴 했었다. 만약 스칼라인 물리량 [math]\phi[/math]로 액션을 만든다면? 이때에는 단순히 [math]\phi^2[/math], [math]\phi^4[/math] 같은 축약이 없는 항들만으로도 충분해 보일 것이다. 하지만 물리적으로 의미 있는 양은 항상 시간과 공간에 대해 변하는 양이다.[44] 그리고 물리적으로 그 양을 기술한다는 것은 그 양이 시간과 공간에 대해 어떻게 변하는지도 같이 다뤄야 한다는 것이다. 이미 전자기학의 라그랑지안에는 [math]A^\mu[/math]의 도함수가 들어 가 있지 않은가. 따라서 스칼라만 다룬다 하더라도 올바른 라그랑지안 안에는 그 스칼라의 도함수 [math]\partial_\mu \phi[/math]가 반드시 포함되어 있어야 하며, 그러기 위해서는 역시 축약이 또 필요하다는 것을 알 수 있다. 결국 말하고 싶은 게 뭐냐면, 물질을 다루는 액션 혹은 라그랑지안은 반드시 축약을 포함한다는 것이다. 이것을 다르게 표현하자면 물질을 다루는 라그랑지안에는 측지 텐서가 반드시 포함되어 있다는 것이다. 축약을 하면 반드시 측지 텐서를 곱해서 싹 더해야 했었고, 그걸 가리킨 것이다. 이미 물질은 측지 텐서와 엮여(coupling)있는 것인 셈이다. 그런데 앞서 말했듯이 측지 텐서에는 시공간의 구조, 즉 시공간이 어떻게 휘어져 있는가 하는 정보가 담겨 있다. 이 사실은 다음과 같은 중요한 사실을 암시한다. 애초부터 물질은 시공간의 휘어짐에 대한 정보(측지 텐서)와 얽혀 있다. 그런데 전자기학의 경우에서 입자-장이 엮여 있는 액션 항이 있다면 반드시 장 만의 액션 항이 필요하다는 것을 봤었다. 지금 우리는 물질-측지 텐서가 엮여 있는 액션 항을 가지고 있다. 그렇다면 올바른 액션은 측지 텐서만을 위한 액션 항을 포함해야 할 것이다. 한편 전자기학에서는 두 액션 항(입자-장 항, 장의 항)이 있다는 것이 입자의 분포가 곧 장의 모습을 결정지어 주는 것([math]\partial_\mu F^{\mu \nu} = \mu_0 j^\nu[/math])을 봤었다. 즉, 입자가 분포해 있으니 전자기장이 생겼다. 지금 우리는 물질-측지 텐서 항과 측지 텐서 항이 있어야 함을 안다. 결국 다음을 얻는다.

물질의 분포가 시공간의 휘어짐을 결정한다.

정리해 보자. 아까 우리는 일단 중력을 깡그리 잊어버리고 (아직 우리가 아는 그 중력이 나타났다고 말할 수는 없다) 물리 법칙이 일반적인 좌표 변환에 대해 불변하고 시공간이 평평하지 않을 수도 있다는 것[45], 그리고 등가원리(어떤 좌표계는 특수 상대성 이론에서 말하는 그 관성 좌표계로 볼 수 있다)[46]를 가정했었다. 그런데 이러한 몇 안 되는 가정들로부터 우리는 물질이 시공간을 필연적으로 휘어야 한다는 것을 도출해냈다. 저 위에서 말한 아인슈타인의 빛나는 업적이 바로 이것이다. 단순한 법칙들로 중대한 결과가 튀어 나온 것이다. 하지만 아직 측지 텐서가 어떻게 변할 것인가를 다루진 않았다. 어쩌면 시공간은 휘어져 있지 않을지도 모른다. 수학적으로 측지 텐서의 액션을 봐야 알 수 있을 것이다.

3.3 아인슈타인-힐베르트 액션, 아인슈타인의 장방정식

먼저 위에서 설명한 액션을 이렇게 써 보자.

[math]S = S_M + S_G[/math].

[math]S_M[/math]는 물질의 액션으로 사실 일반 상대성 이론을 몰랐으면 총 액션은 이거 하나만 있었을 것이다. 물론 우리는 이것에 대해 안다. 모른다고 하면 지는 거다 예를 들어 물질의 액션에는 전자기장의 액션만 있거나 다른 게 또 들어 가 있을 수도 있다. 어쨌든 지금 우리의 관심은 그 정체를 모르는 [math]S_G[/math]이다. 이 항은 물론 시공간의 동역학만 다루는 항이다. 즉, 측지 텐서와 그 도함수로만 이루어진 스칼라로 구성된 항이다. 이게 이 항이 어떻게 생겼는가를 알아 봐야 한다.

측지 텐서와 그 도함수로 그럴 듯한 스칼라를 만드는 것은 사실 간단한 일이 아니다. 사실 측지 텐서의 공변 도함수는 항상 0이라는 것을 보일 수 있다. 따라서 측지 텐서의 (보통) 도함수가 들어간 전혀 다른 종류의 스칼라를 찾아야 한다. 사실 Christoffel 기호가 측지 텐서의 도함수로 구성되어 있다는 것을 보일 수 있는데, 문제는 이 기호가 텐서는 아니라는 점에 있다. (그래서 '텐서'가 아닌 '기호'로 불리는 것이다.) 다른 방법이 필요하다.

미친(...) 수학자들은 그 답을 이렇게 생각해 냈다. 벡터 [math]A^\mu[/math]가 주어져 있을 때 그 공변 도함수 [math]D_\mu A^\nu[/math][math]A^\mu[/math]와 그 도함수가 들어가 있다. 이는 [math]D_\mu D_\nu A^\lambda[/math]에서도 마찬가지다. 하지만 [math]D_\mu D_\nu A^\lambda - D_\nu D_\mu A^\lambda = (D_\mu D_\nu - D_\nu D_\mu) A^\lambda ( = [D_\mu, D_\nu] A^\lambda)[/math]는 오로지 [math]A^\mu[/math]만 들어가 있고 그 도함수는 안 들어가 있다는 것을 알 수 있다. 더군다나 그 모양에서도 보이듯이 이 식은 [math]A^\mu[/math]에 대해 선형이다. 따라서 위 식은 다음과 같이 표기할 수 있다.

[math](D_\mu D_\nu - D_\nu D_\mu) A^\lambda = R^\lambda_{\mu \nu \rho} A^\rho[/math].

공변 도함수가 미분 연산자와 Christoffel 기호로만 이루어져 있으므로 이 새로운 값 [math]R^\lambda_{\mu \nu \rho}[/math]는 Christoffel 기호와 그 도함수, 혹은 측지 텐서와 그 도함수로 구성되어 있는 것이다. 또한 [math]D_\mu D_\nu A^\lambda[/math][math]D_\nu D_\mu A^\lambda[/math] 둘 다 텐서라는 사실로부터 [math]R^\lambda_{\mu \nu \rho}[/math] 역시 텐서라는 것을 알 수 있다. 이 텐서를 가리켜 리만 텐서 혹은 곡률 텐서라고 부른다.[47] 사실 이 텐서는 시공간의 곡률에 대한 정보를 담고 있는 양이다.

좀 더 가 보자. 이제 이 텐서로 축약을 만들어 볼 것이다. 축약을 만드는 방법은, 마침 위 참자가 하나 있으므로 이 첨자와 [math]\mu, \nu, \lambda[/math] 중 하나와 엮어서 더하는 것이 있다. 그런데 계산을 해 보면 [math]R^\lambda_{\mu \nu \lambda}[/math]는 항상 0임을 알 수 있다. 한편, 정의로부터 [math]R^\lambda_{\mu \nu \rho} = -R^\lambda_{\nu \mu \rho}[/math]이므로 [math]\mu[/math][math]\nu[/math]나 어느 것을 엮어도 결과는 부호 뺴고 똑같을 것이라는 것을 알 수 있다. 따라서 사실 상 가능한 축약은 하나 뿐이다. 이제 그 축약을 이렇게 정의하자.

[math]R_{\mu \nu} = R^\lambda_{\mu \lambda \nu}[/math].

이 텐서를 가리켜 리치 텐서라고 부른다. 이 텐서는 한편 [math]R_{\mu \nu} = R_{\nu \mu}[/math]를 만족한다. 하나 더 해 보자. 이번엔 이 Ricci 텐서를 축약해 보자. 이렇게.

[math]R = g^{\mu \nu} R_{\mu \nu}[/math].

이 텐서를 가리켜 리치 스칼라라고 부른다.

앞에서 리만 텐서는 측지 텐서와 그 도함수들로만 구성되어 있다고 했었다. 그리고 그걸 축약해서 스칼라 하나를 만들어냈다. 사실 우리는 경험적으로 측지 텐서를 위한 라그랑지안이 측지 텐서의 일차 도함수의 제곱 혹은 이차 도함수까지만 포함되어 있기를 기대하고 있다.[48] 아니면 라그랑지안의 단순성도 괜찮다. 아무튼 이러한 요구사항 때문에 더 많은 스칼라는 필요하지 않고 다만 이 Ricci 스칼라만으로 우리가 원하는 라그랑지안을 구성하기에는 충분할 것이다.[49]

이제 준비물은 다 마련이 되었다. 전자기장을 다룰 때 했던 것처럼 라그랑지안에 들어갈 스칼라를 알았으면 액션을 다음과 같이 잡아야 한다는 것을 금방 할 수 있다. 물론 일반적인 좌표 변환을 고려해야 하기에 적분에는 [math]\sqrt{-g}[/math]가 포함되어 있어야 한다는 것을 잊지 말자.

[math]S_G = \int \left( \frac{c^4}{16 \pi G} R \right) \sqrt{-g} d^4 x[/math].

여기서 부호는 위에서 그랬던 것처럼 액션이 최소가 되게 하기 위해 저렇게 잡은 것이고, [math]G[/math]는 상수로, 나중에 고전적인 영역으로 근사를 취할 때 왜 그냥 [math]G[/math]가 아니고 [math]\frac{c^4}{16 \pi G}[/math]로 잡았는지를 알게 될 것이다. 아무튼 이렇게 해서 우리는 측지 텐서, 즉 시공간의 휘어짐을 다루는 액션을 얻었다. 이 액션이 그 유명한 아인슈타인-힐베르트 액션이다. 사실 힐베르트가 아인슈타인보다 일주일 정도 더 먼저 이 액션을 구했고 이를 아인슈타인과 상의하려 했으나 공교롭게도 그떄 아인슈타인은 건강이 좋지 않아서 힐베르트를 만나지 않았고, 그 후 독립적으로 이 액션을 얻었다고 알려져 있다.

그런데 사실 스칼라로는 뭐 다른 것도 있지만 그냥 상수도 있다. 그래서 위 액션은 이렇게 수정되기도 한다.

[math]S_G = \int \left( \frac{c^4}{16 \pi G} (R -2 \Lambda) \right) \sqrt{-g} d^4 x[/math].

여기서 [math]\Lambda[/math]는 어떤 상수이다. 이 상수가 그 유명한 우주 상수(cosmological constant)이다. 아인슈타인 최대의 실수로 불리워졌지만 나중에 가속 팽창을 설명하기 위해 화려하게 부활한 값이다. 그런데 이 값은 사실 물질 항에다 옮겨 넣을 수 있으며 이때 이 항은 물질의 진공 에너지를 의미하게 된다. 우리가 흔히 알고 있는 암흑 에너지(Dark energy)의 정체가 바로 이것이다. 따라서 우주의 진공이 어떤 실체를 가지느냐를 밝히는 것이 우주 상수 혹은 암흑 에너지의 정체를 밝혀줄 것이다.

이제 마무리를 해 보자. 액션을 구했으니 장방정식을 구해야 한다. 측지 텐서에 대한 변분을 취하면 장방정식을 얻을 수 있다. 그런데 물질(-측지 텐서 coupling) 액션 항에 측지 텐서에 대한 변분을 취하면 그 결과로 나오는 것이 물질의 에너지-운동량 분포, 혹은 더 정확하게 에너지-운동량 스트레스 텐서 [math]T_{\mu \nu}[/math]가 나온다는 것이 알려져 있다. 한편, 아인슈타인-힐베르트 액션에 변분을 취하면 다음이 얻어진다.

[math]-\frac{c^4}{8 \pi G} \left( R_{\mu \nu} - \frac{1}{2} g_{\mu \nu} R \right)[/math].

변분법은 두 액션의 변분, 즉 [math]T_{\mu \nu}[/math][math]-\frac{c^4}{8 \pi G} \left( R_{\mu \nu} - \frac{1}{2} g_{\mu \nu} R \right)[/math]의 합이 0임을 말해준다. 이를 정리하면 결국 다음을 얻는다.

[math]R_{\mu \nu} - \frac{1}{2} g_{\mu \nu} R = \frac{8 \pi G}{c^4} T_{\mu \nu}[/math].

이것이 바로 그 유명한 아인슈타인 장방정식이다. 이 방정식은 최종적으로 물질의 (에너지) 분포가 시공간의 휘어짐을 결정한다라는 앞서 내렸던 결론을 수학적으로 확실하게 보여주는 것이다. 이 방정식 하나로 물질의 분포로부터 시공간의 모양을 알아낼 수 있다. 짧아 보이는 이 방정식을 푸는 것은 사실 무척 어렵다. 실제로 구해야 하는 것은 측지 텐서인데, 저 방정식을 측지 텐서와 그 도함수로만 표현하면 엄청나게 복잡해지며, 무엇보다도 저 방정식은 비선형 편미분방정식이다. 이 이름만으로도 이과생들은 비명을 지릅니다 꽤 많은 특수해가 알려져 있긴 하지만 일반적인 물질 분포로부터 이 방정식을 푸는 방법은 아직 요원하다.

마지막으로 시공이 휘어졌다는 것이 고전역학에서 무엇과 매칭이 되는가를 알아 보겠다. 비선형 편미분 방정식이라고 했지만 사실 고전적인 영역(측지 텐서의 변화가 매우 작고 물질의 속도가 광속보다 작으며 물질의 분포가 별로 빽빽하지 않은 영역)에서 아인슈타인 장방정식은 충분히 간단하게 표현된다. 먼저 방정식을 조금 바꿔 써 보자. 방정식에 축약을 가하면 [math]\frac{1}{2} R = \frac{8 \pi G}{c^4} g^{\mu \nu} T_{\mu \nu} = \frac{8 \pi G}{c^4} T^\mu_\mu[/math]를 얻게 되는데, 이걸 대입해서 정리한 다음, 인덱스 하나를 위로 올려 주면 ([math]g^{\mu \nu}[/math] 하나를 곱해 축약해 주면 된다) 다음을 얻는다.

[math]R^\mu_\nu = \frac{8 \pi G}{c^4} \left( T^\mu_\nu - \frac{1}{2} \delta^\mu_\nu T^\lambda_\lambda \right)[/math].

물질 분포가 점입자 하나라면 [math]T^0_0 - \frac{1}{2} \delta^0_0 T^\lambda_\lambda = \frac{1}{2} \rho c^2[/math]으로 표현됨을 계산할 수 있는데, 여기서 [math]\rho[/math]는 질량 M의 점입자에 대한 디랙-델타 함수 모양의 질량 밀도 함수이다. 이로부터 다음을 얻는다.

[math]R^0_0 = \frac{4 \pi G \rho}{c^2}[/math].

여기서 [math]R^0_0[/math]는 다음과 같이 근사될 수 있다.

[math]R^0_0 \approx \frac{1}{2} \nabla^2 g_{00}[/math].

따라서 [math]\nabla^2 g_{00} = \frac{8 \pi G \rho}{c^2}[/math]를 얻게 된다. 여기서 [math]g_{00} = 1 + \frac{2\phi}{c^2}[/math]라고 표기하면 방정식은 다음과 같이 써진다.

[math]\nabla^2 \phi = 4 \pi G \rho[/math].

이것은 중력 퍼텐셜에 대한 미분 방정식으로, 이것을 풀면 [math]\phi = -\frac{GM}{r}[/math]를 얻는다. 정확하게 뉴턴의 중력 법칙에서 얻어지는 퍼텐셜이다! 하지만 이것만으로는 부족하다. 아직 이것은 단지 측지 텐서 중 한 성분을 조금 다르게 표현한 것에 지나지 않는다.

이 식의 의미를 알려면 휘어진 공간에서 입자의 경로가 어떻게 결정되는지 봐야 한다. 이 입자는 위에서 다룬 질량 M인 입자보다 훨씬 가벼운 입자인데 (따라서 이 입자에 의한 시공간의 휘어짐은 생각하지 않겠다), 이 입자의 경로는 다음과 같이 주어지게 된다.

[math]\frac{d^2 x^\mu}{d \tau^2} + \Gamma^\mu_{\alpha \beta} \frac{dx^\alpha}{d\tau} \frac{dx^\beta}{d\tau} = 0[/math].

사실 이 식은 측지선(geodesic) 방정식으로, 빛 같이 질량이 없는 입자에 한한 것이긴 하지만 여기서 써도 크게 상관은 없을 것이다. 아무튼 고전적인 경우 입자의 속력은 느릴 것이고 이때 [math]\mu = i = 1, 2, 3[/math]에 대하여 위 식은 다음과 같이 근사할 수 있게 된다.

[math]\frac{d^2 x^\mu}{d \tau^2} + \Gamma^\mu_{\alpha \beta} \frac{dx^\alpha}{d\tau} \frac{dx^\beta}{d\tau} \approx \frac{d^2 x^i}{dt^2} + \Gamma^i_{00} c^2 \approx \frac{d^2 x^i}{dt^2} + \frac{c^2}{2} \left( \partial_i g_{00} \right) = \frac{d^2 x^i}{dt^2} + \left( \vec{\nabla} \left( \frac{c^2}{2} g_{00} \right) \right)_i = 0[/math].

위에서 쓴 [math]g_{00}[/math]의 다른 표기를 쓰면 다음을 얻는다.

[math]\frac{d^2 \vec{x}}{dt^2} \approx -\vec{\nabla} \left( \frac{c^2}{2} g_{00} \right) = -\vec{\nabla} \phi = -\frac{GM}{r^3} \vec{r}[/math].

이것은 정확하게 뉴턴의 만유인력 법칙이다. 이로부터 중력의 정체는 다름 아닌 시공간의 휘어짐이라는 결론을 얻을 수 있게 되었다! 이렇게 해서 우리는 맨 처음에 잊어버렸던 중력을 다시 이끌어내었다. 다시 강조하지만 물질에 의해 시공간이 휘어진다는 것과 중력이 사실은 시공간의 휘어짐이라는 이 모든 결과는 단지 물리 법칙이 일반적인 좌표 변환에 대해 불변이어야 한다는 것을 요구한 것만으로부터 얻어진 것이다. 즉, 일반 상대성 이론은 필연적으로 중력을 내포할 수 밖에 없다는 것이다.

이러한 놀라운 결과를 얻어내긴 했지만 위에서도 주석으로 언급했듯이 이 모든 것은 실험과 잘 맞아야 한다. 사실 시공간이 애초부터 휘어져 있지 않았을 수도 있는 것이니까.[50] 하지만 에딩턴 등의 실험에 의하여 빛이 정말로 휘어져서 온다든가 그 유명한 수성의 근일점 문제를 해결했다는 점이라든가 하는 검증을 통해 일반 상대성 이론과 그로부터 얻어진 중력 이론은 옳은 것으로 인정 받았고, 지금도 거시적인 규모에서 실험과 위배된 적이 없는 이론으로 굳건히 서 있다. 하지만 실험이 어떻게 됐든 이러한 사유는 전에 없던 획기적인 것이었고 이론가들의 가장 주요한 무기 중 하나로 우뚝 서게 된다. 오죽 했으면 (저 위에 있는 주석 내용이지만) 아인슈타인은 실험이 틀렸으면 어쩔 거였냐는 질문에 그래도 내 이론은 옳다고 했었을까.

이 문서의 내용 중 전체 또는 일부는 상대성이론문서에서 가져왔습니다.</div></div>
  1. 다만 특수 상대성 이론과 잘 맞는 변환이어야 한다. 등가 원리가 이 기준을 마련해 준다.
  2. 물론 지자기라든가 중력의 영향 같은 것을 무시한다든가 관계 없는 실험이라든가 해야 한다. 그래서 맨 처음 가정이 주변에 지구도 태양도 아무 것도 없는 텅 빈 우주 공간에 실험실에 놓여 있다는 것이었다.
  3. 이런 상황에서 '절대 좌표계'라느니 '절대 속도' 같은 말은 그 가치를 상실해 버린다. 오로지 물리적으로 의미 있는 것은 (관성) 좌표계 간의 변환에도 그 모양이 변하지 않는, 즉 불변하는 것들인데, '절대 ...' 같은 것들은 이런 것에 해당되지 않기 때문이다.
  4. A 와 B 의 상대적인 관측을 비교했을 때, 결과를 물을 수가 없다. 둘이 만나기 위해서는 광속으로 이동한 A 가 B 와 만나야 하는데, A 가 되돌아오기 위해서는 '가속' 해야한다.
  5. 사실 저 두 원리를 만족하는 4차원 벡터 장을 만들어내면 튀어 나오는 게 바로 맥스웰 방정식이다! 물론 이 사실이 두 원리를 거부하였을 때 맥스웰 방정식이 부정된다는 걸 지지하는 건, 논리적으로 전혀 아니지만, 어쨌든 상당히 강력한 근거임은 분명하다. 아니, 일단 과거의 뉴턴 역학이 전자기학과 대립하던 상황을 생각해 보자.
  6. QED의 창시자인 그 유명한 리차드 파인만은 이런 식으로 QED를 평했다. 이건 마치 위성 궤도에서 지상의 개미를 정확하게 관찰하는 것과 같은 정확도라고.
  7. 아래에 서술되어 있듯이 GPS 계산에 상대론적 효과를 고려하지 않으면 오차가 꽤 커진다.
  8. 슈뢰딩거 방정식은 비상대론적인 방정식으로, 지금도 많이 쓰인다. 물론 저 깊은 영역에선 못 쓰이지만. 지못미
  9. 더 파고들면, 심지어 에너지 보존 법칙과 운동량 보존 법칙마저 수정된 셈이다! 아예 정의 자체가 바뀐 것이니. (하지만 뇌터 정리를 고려하면 사실 상 보존법칙이 먼저인 셈이다. 당장 뉴턴도 정확히는 [math]F=ma[/math]가 아닌 [math]F = \frac{dP}{dt} = \frac{d(mv)}{dt}[/math]이나 (여기서 [math]P[/math]는 운동량이다.) [math]m[/math]이 불변량이므로 가속도 [math]dv \over dt[/math][math]a[/math]로 치환한 것 뿐이다.) 더군다나 아예 일반형으로 수정되기에 이르는데, 대학원 수준에선 소위 '에너지-운동량 텐서'라는 것으로 묶어서 다룬다! 물론, 계속 이야기됐던 것이지만, 그렇다고 뉴턴 역학이 부정됐다는 건 절대로 아니다. 어디까지나 잘 수정했다는 뜻이다.
  10. 스피너 같은 특이한 케이스는 일단 넘어가자.
  11. 수학에서 말하는 텐서와는 다르다. 하지만 물리에서 말하는 텐서의 추상화 버전이 결국 수학에서의 텐서. 그렇다기엔 수학에서 텐서가 차지하는 위상이 엄청나게 크지만... 일단 텐서 대수학(tensor algebra)이 자유 목적(free object)들 중 하나라는 것만 봐도... 무슨 소리야
  12. 값이 불변이라는 뜻이 아니다. (스칼라에겐 해당되는 얘기지만.) 형태가 불변이라는 뜻인데, 이마저도 오해의 소지가 있다. 제대로 알려면 적어도 학부 과정의 수리물리학 과목을 이수해야 하는데, 이것도 초보적인 수준...안습
  13. 시간축 방향으로 이동한 양(cdt)의 제곱과, 공간 축에서 이동한 거리의 제곱의 크기가 서로 같다
  14. 부호가 반대, 즉 -1, 1, 1, 1로 놓을 수도 있다. 바뀌는 건 거의 없다. 물리적인 거는 아예 없고. 성가신 부호 차이만 날 뿐인데, 문제는 이 두 가지 방법이 지금까지도 잘 쓰인다는 것이다. 입자 물리학에서는 본문의 부호를, 우주론에서는 이 주석의 부호를 흔히 쓴다.
  15. 회전이라는 기하학적인 아이디어는 아인슈타인 본인의 생각이 아니었다. 민코프스키에 의해 4차원 시공간이 정립되었고 바일(Weyl) 등에 의해 로렌츠 변환의 기하학적 그리고 대수학적 해석이 덧붙여진 것이다. 심지어 아인슈타인은 처음에 이 아이디어를 접하고 나서 별로 좋아하지 않았다고 한다. 나중엔 완전히 받아들였지만.
  16. 사실 하나 더 있다. 계속 회전 얘기만 했지만 시간+공간에 대한 평행 이동에 대한 불변성도 필요하다. 로렌츠 변환과 평행 이동 모두를 아우르는 변환을 모은 군(group)을 푸앵카레 군(Poincaré group)이고 관성 좌표계 간의 변한 전체는 로렌츠 변환 뿐만 아니라 푸앵카레 군에 포함된 모든 변환에 관한 것이어야 할 것이다. 하지만 평행 이동에 대한 이야기는 이 문서에서 그리 중요한 것이 아니고, 따라서 이 문서에서 관성 좌표계 간의 변환은 로렌츠 변환만 따지는 것으로도 충분하다.
  17. 편의 상 contravaraint인지 covariant인지는 구분하지 않았다. 어차피 3차원에서는 별 의미가 없지만.
  18. 상대론 하에서 식을 쓰다 보면 성분의 제곱을 그대로 쓸 일이 그렇게 많지 않다. 어차피 다들 알아서 헷갈리지 않게 잘 표기하다 보니 (정말 거듭제곱일 경우 그게 딱 봐도 거듭제곱인 것 같이 써 놓긴 한다) 정작 헷갈릴 일은 없다.
  19. 아예 반대로 적용하는 경우가 있다. Landau, Lifshitz의 The Classical Theory of Fields에서 그렇다.
  20. 합 기호 [math]\sum_{\nu = 0}^3[/math]을 생략했다. 물리학자들은 이런 생략을 자주 쓴다. 이런 생략을 가리켜 아인슈타인 규약(Einstein's convention)이라고 부른다. 생략하되, (1) 같은 기호가 두 개만 쓰였고 (2) 그 두 기호 중 하나는 위 첨자에 다른 하나는 아래 첨자에 있는 경우에만 가능하다. 사실 그렇지 않은 경우는 물리적으로 의미가 없는 경우지만...
  21. 직접 임의의 두 벡터에 대해 좌표 변환을 해 보면 금방 알 수 있다. 그러면 좌표 변환을 시키는 행렬이 [math]A[/math]라고 했을 때 저 위에 쓴 [math]A^t J A = J[/math]가 만족되어야 함을 알 수 있는데, 이미 우리는 이걸 만족하는 행렬 [math]A[/math]가 (일반적인) 로렌츠 변환 행렬이라는 것을 봤었다. 따라서 변환 행렬은 반드시 로렌츠 변환 행렬이어야 한다.
  22. 4차원과 로렌츠 변환을 조금 더 부연 설명하면, 이렇게 할 수 있다. 한 평면의 가로축을 공간, 세로축을 시간이라고 하자. 그런데, 관측자의 속도가 바뀌면, 이 두 축의 방향이 바뀐다! 이는 두 축이 회전한다는 뜻이고, 이것이 로렌츠 변환이다. 축이 회전했으니, 시간과 거리가 바뀔 수밖에 없다. 그리고 이렇게 생각하려면, 시간과 공간을 통합해서 생각해야 하고, 이것이 흔히 말하는 4차원 시공간, 혹은 최초로 고안해 낸 사람의 이름을 딴 민코프스키 시공간.
  23. 현대 기하학에선 새로운 '길이'와 그 길이를 일정하게 하는 변환을 가지고 기하학을 구축할 수 있다고 본다. 이런 관점에서 유클리드 기하학은 단지 한 예시일 뿐.
  24. 시공간 거리는 3차원 유클리드 기하학에서의 거리를 단순히 4차원 버전으로 바꾼 것과 전혀 다른 것이다. 그랬으면 [math](ct)^2 + x^2 + y^2 + z^2[/math] (부호 주의)이 일정해야 했을 것이다.
  25. 하지만 시간축을 뺀 나머지 공간축이 이루는 '공간'을 지배하는 기하학은 (일반상대론을 뺀다면) 여전히 유클리드 기하학이다. 사실, 특수상대론에서 다루는 기하학은 유클리드 기하학을 일종의 부분집합으로 포함한다. 전문 용어로 하자면, 특수상대론의 시공간을 지배하는 군 O(3, 1)은 유클리드 기하학을 지배하는 군 O(3)를 부분군으로 갖는다.
  26. 이 내용은 란다우, 립쉬츠(Landau, Lipshitz)의 장의 고전 이론(The classical theory of field)에서 소개된 내용이다. 이 책 보면 한두 가지는 더 나온다.
  27. 이는 어떤 관측자와 지구 중심 방향으로 나란히 떨어지는 다른 물체를 생각해 봄으로서 알 수 있다. 이 관측자가 떨어지면서 자기 옆에 있는 물체를 보면, 가만히 있지 않고(즉, 자신과 완전히 평행하게 떨어지지 않고) 관측자 옆으로 슬금슬금 가속을 받으며 움직이는 것을 알 수 있다. 이는 지구 중력장이 지구 중심을 향하는 방향으로, 평행한 방향이 아니라는 이유에 기인한다. 우주 스케일로 가면 크기가 있는 물체가 받는 중력에서 이 효과는 결코 무시할 수 없는 것이다. 참고로 블랙홀에 빨려들어가면 미친 듯이 가늘어지다가 끊어지고 산산히 분해되는 것도 이 효과 때문.
  28. 물리에 매우 익숙한 사람이라면 이 아이디어가 미분과 유사하다는 걸 알 수 있을 것이다. 사실, 이 아이디어로 정의되는 수학적 대상 중 하나가 바로 다양체(manifold)이며, 이 다양체를 다루는 학문이 바로 미분기하학이다. 이러니, 애초부터 일반상대론은 미분기하학으로 다뤄질 수 밖에 없는 학문인 셈이다.
  29. 이를 최소 등가원리라고 부른다. 그리고 이것은 아인슈타인 이전부터 계속 논의 되어 왔으며, 아인슈타인 이전에 실험을 시작하여 일반상대론 발표 이후까지 실험을 계속한 과학자도 있다.
  30. 첫번째 가정을 이용하는 과정은 Landau, Lipshitz의 'The classical theory of field'에서, 두번째 가정을 이용하는 과정은 한스 오하니언의 '중력과 시공간'에서 찾을 수 있다.
  31. 두 제약의 연관성도 제법 강하다. 하지만 이를 설명하기엔... 더 이상의 자세한 설명은 생략한다.
  32. 사실 라그랑지안을 만들 때 조건 하나가 더 붙긴 하지만...
  33. 한편, 전술하였듯이, 같은 방법으로 (즉 순전히 논리적 사유만으로) 맥스웰 방정식을 '유도해'낼 수 있다! 바로 앞의 주석에서 소개한 두 책에서 이를 중력장 방정식 유도하기 전에 준비운동 겸 해서 유도하고 있다. 하지만 이 내용은 아인슈타인의 업적 이후에 그 업적을 본따서 만든 것이다.
  34. 등가원리
  35. 공부하면 알겠지만, 뉴턴의 중력 이론이 일반상대론의 구축에서 쓰이는 일은, 비례 상수 맞추는 것하고 일반상대론의 근사가 뉴턴 법칙과 맞는다는 걸 보일 때 말고는, 아예 없다. 더군다나 빛이 휘어서 온다느니 블랙홀이 있다느니 하는 내용은 훗날 관측된 것이다. 아인슈타인이 중력 이론을 새로 구축하겠다고 한 것도 어떤 관측을 보고 그걸 설명하려고 한 건 아니고 단지 뉴턴의 중력 이론이 자신의 특수상대론과 모순(뉴턴의 중력이론은 원격작용으로, 그 힘의 전달속도가 무한이기 때문에 특수상대론과 안 맞음)이라는 걸 보고 아예 중력이론을 새로 만들겠다고 해서 시작된 것이다.
  36. 최종적으로 얻어진 아인슈타인의 장방정식, 즉 모든 중력을 기술하는 방정식의 모양이 너무나도 간단해서 아름답다고 할 수도 있겠지만, 이는 다소 과장이 없지 않은 게, 그 방정식을 측지텐서 성분들로 분해하여 나타내면 그것만큼 끔찍한 녀석도 드물 것이기 때문이다. 표준모형은?
  37. 그 연장선 상에 표준모형이 있다.
  38. 여담이지만, 우주 멀미의 큰 원인 중 하나가 이것 때문이라고도 한다.
  39. 그래서 국소적인 영역에서만 관성 좌표계와 같다고 저 위에서 설명한 것이다. 휘어진 공간이라도 엄청 작은 영역에서 보면 평평할 것이고, 이 영역에서는 관성 좌표계와 같다고 볼 수 있을 것이기 때문이다.
  40. 사실 이건 위의 조석력을 가지고 한 사유 없이도 가져봄직한 아이디어이다. 더군다나 시공간이 아예 평평하다는 것보단 더 일반적이고. 하지만 가만 생각해 보면 아무도 모르는 상태에서 시공간이 휘어져 있다는 생각을 감히 해낼 수 있을까 하는 생각도 든다.
  41. 이런 경우 해당 기하를 리만 기하라고 부른다. 일반 상대성 이론에서 다룰 기하는 사실 이와 조금 다른 유사-리만 기하(pseudo-Riemann geometry)이다.
  42. 위에서 주석으로 언급했듯이 실제로는 유사-리만 기하 중 하나가 바로 아인슈타인이 원하던 것이다. 실제로 상대성 이론에 적합한 유사-리만 기하을 가리켜 로렌츠 기하(Lorentz geometry)라고도 부른다.
  43. 물론 [math]F_{\mu \nu} = D_\mu A_\nu - D_\nu A_\mu[/math]로 정의된다. 신기하게도, 공변 도함수의 정의를 그대로 정의하면 [math]D_\mu A_\nu - D_\nu A_\mu = \partial_\mu A_\nu - \partial_\nu A_\mu[/math]와 같다는 것을 보일 수 있다. 하지만 이런 게 모든 물리에서 나타나는 것은 또 아니다.
  44. 그렇지 않아도 물리적으로 의미 있는 양이 있긴 하다. 애매하긴 하지만... 우주 상수가 바로 그것인데, 조금 있다가 다루겠다.
  45. 지금 와서 이야기하는 것이지만 사실 이 가정은 처음부터 안 잡아도 됐었다. 이미 축약의 [math]\eta_{\mu \nu}[/math]는 측지 텐서로 교체되어야 했었고 이것은 일반적인 좌표 변환을 고려했을 때 이미 상수는 아니기에 측지 텐서의 동역학, 혹은 액션을 고려해야 하긴 했었다. 여기서 좀 더 계산을 해 봐야, 즉 측지 텐서의 액션을 구해 봐야 진짜로 시공간이 평평한지 아닌지를 확실하게 말할 수 있을 것이지만 말이다.
  46. 단지 리만 기하일 것인가, 로렌츠 기하일 것인가, 아니면 다른 유사-리만 기하 중 하나일 것인가 중에서 로렌츠 기하일 것인가만 정하는 게 어떻게 보면 등가원리의 전부인 것으로 보인다. 그래도 등가원리가 갖는 또 하나의 의의를 꼽자면 특수 상대성 이론에서 성립하던 물리 법칙들을 일반 상대성 이론으로 끌고 올 수 있는 동기 정도이겠다.
  47. 책마다 [math]\mu, \nu, \rho[/math]의 순서가 다르다. 그렇다고 해도 [math]\rho[/math]가 맨 앞에 있느냐 맨 뒤에 있느냐 차이 뿐이다. 아무튼 주의할 것.
  48. 사실 이차 도함수는 기대하지 않는 것이다. 다만 적당한 변형을 통해 이것을 일차 도함수의 제곱으로 생각할 수 있다. 다소 테크니컬하고 지금 중요하진 않은 이야기라 자세한 내용은 생략하겠다. 더 알고 싶으면 Landau, Lifshitz의 The Classical theory of Fields 93절을 참고할 것.
  49. 이는 leading term이 Ricci scalar라는 것이 실험적으로 증명되었기 때문에 다음과 같이 쓴다. 또한 더 정밀한 블랙홀 솔루션을 고려하는 경우 다른 리만 텐서 또는 리치 텐서의 곱도 추가된다. Ricci 스칼라만 있는 경우는 어디까지나 퍼스트 오더 어프록시메이션이다. 이런 경우가 아닌 것은 conformal gravity, gauss bonnet gravity가 있는데 이에 대한 이야기는 arXiv를 참고하라.
  50. 측지 텐서 혹은 곡률 만을 위한 액션 항은 사실 상 임의로 정할 수 있다. 만약 정말로 시공간이 휘어져 있지 않다면 그 항은 0일 것이다. 반대로 라그랑지안이 얼마든지 더 복잡해 질 수도 있다. 예컨대 Ricci 스칼라의 2차 혹은 그 이상의 다항식이 될 수도 있다. 실험은 제일 간단한 1차식을 지지해 주지만. 불행하게도 양자장론에서 쓰이는 재규격화 가능성 같은 제약이 시공간의 액션에는 없다. 끈이론에는 있지 않을까