Processing math: 72%

선형변환에 대한 고찰

2023. 12. 2. 15:46Mathematics/Linear Algebra

선형변환(Av=w)은 두 가지 관점으로 해석할 수 있다.

 

1). Movement(=Rotate+Scale): 선형변환 A에 의해, 벡터 v에서 벡터 w로의 이동.

또는, 서로 다른 두 벡터 공간을 매핑하는 함수(=function) 개념으로 봐도 된다.

 

2). Translation: 표준기저벡터를 a1, a2로 둔 좌표계에서 ˆi, ˆj로 둔 좌표계로의 전환.

벡터 그 자체는 변하는 것이 아니라, 표현 방식이 달라진 것이다. (A=[a1a2])

 

본문에서는 첫번째 관점 즉, Movement로 고윳값 분해, 특잇값 분해 등의 개념을 해석해볼 것이다.

 

1. 선형변환 (Ax, Λx)

Ax=(aˆi+cˆj)x+(bˆi+dˆj)y이다.

여기서 선형변환 A=[abcd]는 "선형변환 A로 인해, ˆiˆj이 각각 aˆi+cˆjbˆi+dˆj로 이동함"을 의미한다.

본문에서는 이를 "선형변환 Aˆi, ˆj를 기준기저벡터로 삼는다"라고 표현할 것이다.

 

2. 고윳값 분해

2.1. VAV1x, VΛV1x

VΛV1x: movement(=V) → scale(=Λ) (by ˆi and ˆj) → inverse movement(=V1)

(V is matrix where every row is basis vector)

 

여기서, scale(=Λ) (by ˆi and ˆj)는 "Λ가 기준기저벡터를 ˆi, ˆj로 삼고 있음"을 의미한다.

2.2. QAQx, QΛQx

QΛQx: Rotate(=Q) → scale(=Λ) (by ˆi and ˆj) → inverse Rotate(=Q)

(Q is orthogonal matrix where every row is orthonormal vector)

 

해석1. QAQQΛQv1, v2를 기준기저벡터로 삼고 있는 선형변환 A와 Λ이다.

Q=[v1v2]일 때, QAQx(av1+cv2)v1x+(bv1+dv2)v2x로 전개할 수 있다.

위 수식으로 선형변환 QAQ을 "내적(vix)으로, 벡터 x를 서로 직교하는 v1v2로 정사영하고,

선형변환 Av1v2이 각각 av1+cv2bv1+dv2로 이동함"으로 해석할 수 있다.

즉, "기준기저벡터를 v1, v2로 삼는 선형변환 AΛ"라고 표현할 수 있다.


QΛQxλ1v1v1x+λ2v2v2x로 전개할 수 있다.

이는 "x를 서로 직교하는 벡터 v1v2로 정사영하고, 각각을 λ1, λ2만큼 Scale한 후, 조합한다."로 표현할 수 있다.

 

+MORE. Λx vs QΛQx

Λx는 "x를 ˆi, ˆj로 정사영한 후, 각각을 λ1, λ2만큼 Scale한 후, 조합함"을 의미한다.

즉, 기준기저벡터가 ˆiˆj이다.

반면, QΛQx는 "xv1, v2로 정사영한 후, 각각을 λ1, λ2만큼 Scale한 후, 조합함"을 의미한다.

즉, 기준기저벡터가 v1v2이다.

 

AxQAQx의 관계도 이와 같다.

 

해석2. QΛQ는 서로 직교하는 n개의 "det인 rank-1 matrix"로 분해하고, 각 행렬에 가중치를 부여한 후, 조립하는 선형변환이다.

QΛQ=λ1v1v1+λ2v2v2이다.

즉, QΛQ "서로 직교하는 n개의 rank-1 matrix인 vivi로 분해하고, 가중치 λi(=eigen value)를 부여한 후,

inλivivi으로 조립한 선형변환"으로 해석할 수 있다.

 

응용: λi를 내림차순으로 정렬한 후, 크기가 작은 λi를 제거하여, 데이터 압축을 한다.

더보기

Question. 왜 vivi는 rank-1 matrix냐?

Answer. 만약 vi=[abc]이면, vivi=[avibvicvi]이다.

즉, vivi의 column space는 vi의 생성 공간이다.

3. 특잇값 분해 (UΣVx)

UΣVx: Rotate(=U) → scale(=Σ) (by i^ and j^) → another Rotate(=V)

(U and V are both orthogonal matrix where every row is orthonormal vector)

 

해석1. 수직 관계를 갖고 있는 벡터들(V)A에 통과시켜도, 여전히 수직 관계를 유지하고 있는 벡터들(U)이 존재한다.

A=UΣVAV=UΣ로 전개할 수 있으며, 이는 Av1=σ1u1, Av2=σ2u2로 나타낼 수 있다.

v1v2, u1u2이기 때문에, "A를 통과하기 전에 수직했던 벡터들(V)을 통과시켰을 때, 여전히 수직 관계를 유지하는 벡터들(U)가 존재"한다. 다시 말해, 위 명제를 만족하는 V, U 쌍이 존재한다.