Lorentz transformation.
1 개요
광속 불변의 원리을 만족하는 관성 좌표계 간 좌표 변환[1] 방법이다. 원래는 갈릴레이 변환이 맥스웰 방정식과 모순되는 점이 있었기 때문에, 헨드릭 안톤 로런츠(Hendrik Antoon Lorentz)가 새로 만든 좌표 변환법이다. 정작 로런츠 자신은 이 식을 만들 때 상대성 이론 같은 개념은 고려하지 않았던 듯. 하지만 알베르트 아인슈타인이 특수상대론에서 이 변환을 주워먹고(?) 유용하게 쓰고 있다.
전자기학이 갈릴레이 변환에 의해 변한다는 점이 드러나게 되며 뉴턴 역학과 전자기학은 맞지 않는다는 걸 찾아냈는데, 그래서 맥스웰 방정식을 갈릴레이 변환에 맞게 고쳐봤더니 쓸모도 없고 영혼도 없는 잡공식이 되어버렸다. 즉 맥스웰 방정식에는 이상이 없었고, 그 반대로 맥스웰에 대해 불변인 것을 찾는 흐름이었는데, 로런츠가 처음 이 변환을 발견한 것은 그저 맥스웰 방정식의 꼴이 불변인 좌표 변환을 찾고 싶어서 그런 것일 뿐이었다. 말 그대로 수학적인 트릭을 찾고자 했던 것 그 이상도 그 이하도 아니었다. 하지만 이 식에 숨겨진 진짜 물리적인 의미인 자연의 진정한 관성 좌표계 간 좌표 변환 식이라는 사실은 상대성 원리의 확고함과 광속 불변의 원리로부터 얻어질 수 있는 의미였다. 푸앵카레가 가장 먼저 깨닫고 아인슈타인이 정립한 것이 바로 이것이었으며 먹튀(...)라고 불릴 수 없는 이유이기도 하다. 하지만 어쨌든 변환 식 자체는 로런츠가 먼저 찾아냈으니 이 변환식의 이름은 아인슈타인 변환이 아니라 로런츠 변환이 된 것이다. 이로부터 파생된 '로런츠 군'이라든가 '로런츠 불변성' 같은 단어들도 있다. 이래서 최초가 중요한 거다 아인슈타인 이름 붙은 건 없나 없긴 왜 없어 직접적인 관계는 없지만 이건도
제대로 된 로런츠 변환 식은 널리 알려진 식보다 더 복잡하다. 하지만 그래 봤자 공간에서의 회전 두어 개랑 아래에 설명할 로런츠 부스트를 짬뽕시킨 것에 불과하긴 하지만. 현재 일반적인 로런츠 변환은 공간 좌표계들끼리의 회전까지도 모두 포함하고 있다. 여기에서 군(group) 이론, 특히 리 군(Lie group) 이론으로 로런츠 변환을 묘사할 수 있으며 로런츠 군이 바로 그 결과.
2 의미
살...살려주세요 빛의 속도로 포기해 본 적 있나?
두 관성계 S,S′
x′=γ(x−βct)y′=y
z′=z
ct′=γ(ct−βx)
여기서 c
β=vc
이다. 특히 여기서 γ
여기서 x1=x,x2=y,x3=z,x0=ct
(x′)0=γx0−γβx1
(x′)1=−γβx0+γx1
(x′)2=x2
(x′)3=x3
물론 행렬로도 쓸 수 있다.
((x′)0(x′)1(x′)2(x′)3)=(γ−γβ00−γβγ0000100001)(x0x1x2x3).
같은 방식으로 y
((x′)0(x′)1(x′)2(x′)3)=(γ0−γβ00100−γβ0γ00001)(x0x1x2x3),
((x′)0(x′)1(x′)2(x′)3)=(γ00−γβ01000010−γβ00γ)(x0x1x2x3).
여기서 로런츠 부스트에 해당하는 행렬을 Λ
(x′)μ=Λμνxν.
여기서 우변은 원래 3∑μ=0Λμνxν귀찮아서 생략한다. 이를 가리켜 아인슈타인 규약(Einstein convention)이라고 부른다. 이는 몇 가지 규칙으로 정해진다.
- 같은 인덱스가 두 번 써져 있으면 그 인덱스에 대한 총합(summation)이라는 뜻이다. 예를 들어 AμBμ는 3∑μ=0AμBμ에서 3∑μ=0가 생략되어 있다는 것이다.
- 같은 인덱스는 두 번만 쓸 수 있으며, 같은 인덱스를 그보다 많이 쓴 것은 잘못된 표기다. 예를 들어 AμBμCμ같은 것은 잘못되었다.
- (두 개의) 같은 인덱스들 중 하나는 위 첨자에, 다른 하나는 아래 첨자에 있어야 한다. 예를 들어 AμBμ같은 것은 잘못되었다.[2]
이 문서에서 당장 중요한 것은 아니지만 로런츠 변환을 다룬다고 한다면 워낙 많이 쓰이는 표기라 여기서 소개하는 것이다.
한편, 다음을 알 수 있다.
(γ0−γβ00100−γβ0γ00001)=(100000100100000−1)(γ−γβ00−γβγ0000100001)(100000100100000−1)−1,
(γ00−γβ01000010−γβ00γ)=(1000000100−100100)(γ−γβ00−γβγ0000100001)(1000000100−100100)−1.
이런 식으로 y
설명했듯이 일반적인 로런츠 변환은 임의의 방향의 로런츠 부스트에 3차원 공간에서의 임의의 회전변환을 포함하는 개념이다. 위에서 설명한 것까지 생각하면 결국 일반적인 로런츠 변환은 다음과 같다는 것을 알 수 있다.
Λ=O2Λx,βO−11.
여기서 Λx,β
Oi=(100˜Oi).
위에서 쓴 y
덧붙여서 O′2=O2O−11
- ˆn을 ˆx와 같은 방향이 되도록 좌표를 돌린다.
- x축 방향으로 속력 β만큼 로런츠 부스트를 작용시킨다.
- ˆx방향이 ˆn방향이도록 좌표를 도로 돌린다.
그런데 이 작용을 가만히 보면 사실 다음과 똑같은 것임을 알 수 있다. 여기서 →v=βˆn
- 속도 →v에 해당하는 로런츠 부스트를 작용시킨다.
즉, 일반적인 로런츠 부스트를 이런 식으로 간단하게 표현할 수 있다. 실제로 O1Λx,βO−11
3 일반적인 정의
로런츠 변환이 광속 불변의 원리를 만족하는 식이라고 했었다. 그 말은 즉 광속 불변의 원리로부터 로런츠 변환이 유도된다는 뜻이다. 물론 상대성 원리와 관성 좌표계의 정의가 필요하긴 하다.
관성 좌표계에 대한 설명은 대칭성 항목과 상대성 이론/심화 항목에서 어느 정도 다루긴 했으나 여기서 다시 설명할 것이다. Landau, Lifshitz 시리즈 중 Mechanics에 따르면 관성 좌표계는 다음과 같이 정의된다.
관성 좌표계는 시간과 공간에 대해 균질(homogeneous)하고 공간의 방향에 대해 등방(isotropic)한 좌표계를 말한다.
위의 책에 따르면 평행 이동을 제외한 관성 좌표계 간 좌표 변환은 다음과 같은 꼴을 갖는다.
((x′)0(x′)1(x′)2(x′)3)=Λ(x0x1x2x3).
여기서 Λ
(Λv,Λw)=(v,w).
만약 x0
여기서 선형대수학 이론을 잠깐 꺼내 보겠다. 지금 우리가 다루는 좌표 공간은 벡터 공간이다. 따라서 기저(basis)를 생각할 수 있다. 이때 임의의 symmetric bilinear form (⋅,⋅)
그러한 기저에서 벡터들의 성분을 xμ
(3∑μ=0xμ2vμ,3∑ν=0xν1vν)=3∑μ=0aμxμ2xμ1=xT2Jx1.
여기서 J
한편 우리에게 익숙한 좌표계라면 각 성분들이 서로 수직한 것이어야 한다는 것을 알 수 있다. 공간 성분들(v1,v2,v3
이때 관성 좌표계 간 좌표 변환 Λ
xT2Jx1=(Λx2)TJ(Λx1)=xT2(ΛTJΛ)x1.
x1,x2
ΛTJΛ=J.
따라서 J
다시 관성 좌표계의 정의로 돌아가 보자. 이 정의에서는 공간의 등방성을 가정하고 있다. 이 가정에 따라 공간 좌표들은 유클리드 기하학을 만족해야 한다고 앞에서 말했었다. 공간이 유클리드 기하학을 만족한다는 것은 공간 좌표에 해당하는 세 성분이 있어 이들이 직교한다는 것을 말한다. 위에서 정한 기저 중 세 개 성분 v1,v2,v3
그런데 관성 좌표계의 정의만으로는 둘 중 어느 것이냐를 결정할 수 없다. 다른 무언가가 필요하다는 것이다. 바로 지금이 광속 불변의 원리를 적용할 때이다. 광속 불변의 원리에 따르면 어떤 관성 좌표계에서 −(x0)2+(x1)2+(x2)2+(x3)2=0
xTJ′x=0⇒(Λx)TJ′(Λx)=xT(ΛTJ′Λ)x=0.
여기서 J′
실제로 만약 둘이 다르다면 모순이 일어난다는 것을 볼 수 있다. J′≠J
Λ=(0100−100000100001).
이때 다음을 계산할 수 있다.
ΛTJ′Λ=(0−100100000100001)(−1000010000100001)(0100−100000100001)=(10000−10000100001).
이제 (xμ)=(1,1√2,1√2,0)
xTJ′x=−12+(1√2)2+(1√2)2+02=0
이다. 여기서 광속 불변의 원리에 따라 (Λx)TJ′(Λx)=xT(ΛTJ′Λ)x=0
xT(ΛTJ′Λ)x=12−(1√2)2+(1√2)2+02=1≠0
이다. 이는 모순이다. 따라서 처음 했던 가정은 부정이 되어 결국 J=J′
정리하자. 모든 관성 좌표계 간 좌표 변환 Λ
ΛTJΛ=J(J=diag(−1,1,1,1)).
관성 좌표계 간 좌표 변환이 만족해야 할 중요한 조건을 얻었다. 이제 이 조건으로부터 저 위에서 얻었던 일반적인 로런츠 변환을 이끌어낼 것이다.
구하기에 앞서 몇 가지 성질을 살펴 보자. 위 조건을 만족하는 두 행렬 Λ1,Λ2
(Λ1Λ2)TJ(Λ1Λ2)=ΛT2(ΛT1JΛ1)Λ2=ΛT2JΛ2=J.
따라서 Λ1Λ2
(Λ−1)TJΛ−1=(Λ−1)T(ΛTJΛ)Λ−1=J
임을 통해 Λ−1
로런츠 변환을 이끌어내는 문제로 돌아가자. ΛTJΛ=J
Λμνuν=eμ0
혹은
Λ0νuν=1,Λiνuν=0(i=1,2,3)
인 uμ
−(u0)2+(u1)2+(u2)2+(u3)2=uTJu=eT0Je0=−1
임을 통해 (u0)2=(u1)2+(u2)2+(u3)2+1>1
이제 →v
O2
이제 확실한 건 O−12ΛO1
(O−12ΛO1)−1=(γA0100γβA110000100001).
이제 ΛTJΛ=J
ΛT0JΛ0=(γγβ00A01A110000100001)(−1000010000100001)(γA0100γβA110000100001)
=(−γ2(1−β2)γ(−A01+βA11)00γ(−A01+βA11)−(A01)2+(A11)20000100001).
이 식이 J
−A01+βA11=0,(A11)2−(A01)2=1.
이걸 연립해서 풀면 다음이어야 함을 알 수 있다.
A11=γ,A01=γβ.
여기서 둘 다 부호가 반대인 결과도 위 식을 만족한다는 것을 알 수 있다. 따라서 가능한 경우는 두 가지이다. 그런데 두 값의 부호가 둘 다 음수인 경우는 둘 다 양수인 경우에서 O2
결국 다음을 얻는다.
(O−12ΛO1)−1=(γγβ00γβγ0000100001).
이걸 최종적으로 다음과 같이 쓸 수 있다.
Λ=O2(γ−γβ00−γβγ0000100001)O−11.
이 결과는 전 섹션에서 로런츠 변환이 일반적으로 가질 꼴과 일치한다. 따라서 관성 좌표계 간 좌표 변환은 모두 로런츠 변환이라는 것을 알 수 있다.
...라고 했지만 사실 몇 가지 짚고 갈 것이 있다. 먼저 O1,O2
또 하나 눈여겨 봐야 할 것은 이 변환이 패리티를 바꾸는 변환일 수 있다는 것이다. 즉, 공간 성분을 거울 대칭시킨 것이다. 앞서 말한 O1
여기서 아까 하나 은근슬쩍 가정했던 것 하나를 꺼내 보자. (uμ)
Λ=O2(−γγβ00γβ−γ0000100001)O−11.
로런츠 부스트의 x0
Oi=(100˜Oi)
와 같은 꼴이고 이 꼴로부터 O−12ΛO1
결국 일반적인 로런츠 변환 Λ
ΛTJΛ=J.
앞서 밝혔듯이 이를 만족하는 변환은 회전 변환-로런츠 부스트-회전 변환 혹은 회전 변환-(부호가 뒤집힌 로런츠 부스트)-회전 변환으로 쓸 수 있었다. 실제로 계산을 할 때에는 이런 식으로 간단한 꼴로 분해해서 쓴다.
덧붙여서, J머리 속도 그때마다 리폼해야 하고 해야 하는 부분이다.
- 이동 ↑ 관성 좌표계가 아닌 보다 일반적인 좌표계들 간의 좌표 변환에 대해서는 일반 상대성 이론 영역이다. 상대성 이론/심화 항목 참조.
- 이동 ↑ 이 규칙들이 편의에 의해 이렇게 정해진 것처럼 보일 수도 있겠지만 첫번째만 제외하면 어떤 수학적인 이유가 있어서 그런 것이다. 이렇게 같은 인덱스로 묶어서 더하는 것을 축약(contraction)이라고 부르는데, 여기에는 기하학적 의미가 숨겨져 있다. 간단하게 말하자면 축약은 일종의 내적이며(후술하겠지만 같은 벡터끼리의 '내적'이 0보다 작은 경우도 있어 정확한 의미의 내적은 아니다.) Aμ와 Aμ와 같이 인덱스가 위와 아래로 차이가 나는 것은 이 '내적'에 의해 정의된 듀얼(dual) 관계에 있다는 것이다. 그리고 이 '내적'을 보통 듀얼끼리의 연산으로 보기도 한다. 자세한 것은 상대성 이론/심화 항목 참조.
- 이동 ↑ (v,w)가 어떤 스칼라이되, v,w에 대해 각각 선형이며 임의의 v,w에 대해 (w,v)=(v,w)인 것을 말한다.
- 이동 ↑ 3차원에서는 내적이라고 할 수 있다. 하지만 미리 말하자면 4차원 시공간에서는 더 이상 내적이 아니다. 0이 아닌 v에 대해 (v,v)가 0보다 커야 내적인데, 나중에 밝히겠지만 (v,v)≥0인 0이 아닌 v가 얼마든지 존재하기 때문이다.
- 이동 ↑ 증명은 S. Lang의 Algebra 중 XV, 4절을 참고할 것. 선형대수학을 어느 정도 배웠다면 바로 봐도 어렵지 않은 증명이다.
- 이동 ↑ 뒤집어져도 좋다. 즉, 한 쪽이 -1을 3개 가지고 있는데 다른 한 쪽이 -1을 1개 가지고 있다면 (혹은 1을 3개 가지고 있다면) 그래도 둘은 실질적으로 똑같은 기하학을 표현한다.
- 이동 ↑ 관성 좌표계 간의 좌표 변환이 아니다. 훨씬 더 일반적인 것이다.
- 이동 ↑ 시공간의 구조가 좀 더 일반적인 상황을 보면 vi가 좌표 방향이 아닌 미분으로 놓고 다뤄야 할 필요가 있다. 일반 상대성 이론에서는 그렇게 해야 한다. 그럼에도 어차피 미분들로도 벡터 공간을 잘 만들 수 있으며 등가 원리를 잘 쓰면 거의 똑같은 논리를 쓸 수 있다는 것으로부터 특수 상대성 이론이 일반 상대성 이론으로 잘 확장될 수 있게 된다.
- 이동 ↑ 예를 들어 O1가 패리티를 바꿀 변환일 필요충분조건은 detO1<0인 것이다.
- 이동 ↑ 패리티를 뒤집는 변환이 한 공간 축의 방향을 뒤집는 변환인 것과 비슷하다. 이런 두 종류의 변환(P, T)은 전하의 부호를 뒤집는(혹은 입자-반입자를 뒤바꾸는) 변환(C)와 더불어 이론물리에서 중요한 요소로 작용한다.