어떤 함수의 역함수는, 원래의 함수가 하는 일을 거꾸로 되돌리는 함수이다. 즉 함수 f의 역함수를 g라고 했을 때, f(x)=y라면 g(y)=x이며, 이것의 역도 성립한다.

이를 엄밀하게 서술하면 다음과 같다.

함수 f:XYg:YX가 있다. 그리고 모든 xXyY에 대해, f(x)=yg(y)=x는 필요충분조건이다. 그러면 gf의 역함수라고 한다. (또한 f 역시 g의 역함수이다.)

위의 정의를 약간 변형하여 다음과 같이 쓸 수도 있다.

함수 f:XYg:YX가 있다. 그리고 모든 xX에 대해 g(f(x))=x를 만족하고, 모든 yY에 대해 f(g(y))=y를 만족한다. 그러면 gf의 역함수라고 한다. (또한 f 역시 g의 역함수이다.)

위의 정의를 살펴보면 g가 역함수가 되기 위해서는 g(f(x))=xf(g(y))=y를 모두 만족해야 한다. 만약 이중 하나만 만족한다면 어떻게 될까? 이럴 경우 일종의 “불완전한” 역함수가 된다. 이 글에서는 이에 해당하는 개념인 왼쪽 역함수(left inverse function)와 오른쪽 역함수(right inverse function)에 대해 알아볼 것이다.

왼쪽 역함수Permalink

함수 f:XY가 있다. 함수 g:YX가 모든 xX에 대해 g(f(x))=x를 만족하면, gf왼쪽 역함수(left inverse function)라고 한다.

조금 더 간결하게 표현하면, gf=idX를 만족하는 g이다. idXX에서 정의된 항등함수이다. 즉 모든 xX에 대해 idX(x)=x이다.

왼쪽 역함수 예시Permalink

f:R0R,f(x)=x,g:RR0,g(x)=x2

로 정의하자. 이때 gf의 왼쪽 역함수이다. 모든 xR0에 대해 g(f(x))=x이기 때문이다.

왼쪽 역함수가 존재하기 위한 필요충분조건Permalink

f의 왼쪽 역함수 g가 존재하기 위한 필요충분조건은 f가 단사함수(injective, one-to-one)인 것이다.

직관적으로 생각하면, yY를 입력받으면 f(x)=y를 만족하는 xX를 출력하는 것이 왼쪽 역함수 g인데, 이러한 x가 유일해야 g가 함수로써 잘 정의된다. 따라서 f는 단사함수여야 한다.

왼쪽 역함수 예시에서 왼쪽 역함수를 가지는 f는 단사함수임을 확인할 수 있다.

왼쪽 역함수는 유일하지 않다Permalink

일반적으로 왼쪽 역함수는 유일하지 않다. g가 왼쪽 역함수가 되기 위해서는 g(f(x))=x를 만족하면 되는데, f의 치역에 있지 않은 yY, 즉 어떤 xX에 대해 f(x)=y가 아닌 y에 대해서는 g(y)의 값이 하나로 결정되지 않기 때문이다.

그 예로 앞의 예시를 가져오자.

f:R0R,f(x)=x

f의 왼쪽 역함수 gg(f(x))=x를 만족해야 하는데, 항상 f(x)0이다. 따라서 f의 치역에 포함되지 않는 y<0에 대한 g(y)의 값은 상관이 없다. 따라서

g:RR0,g(y)={y2if y0h(y)if y<0

는 함수 h:RR0가 무엇인지는 상관없이 f의 왼쪽 역함수이다. 왼쪽 역함수라는 조건으로 값을 하나로 결정할 수 없는 일종의 “사각지대”인 셈이다.

만약 f가 전사함수라면 치역이 공역과 같으므로 이러한 사각지대가 사라지게 된다. 따라서 왼쪽 역함수는 유일하게 된다. 후술하겠지만 이 경우 일반 역함수가 된다.

오른쪽 역함수Permalink

함수 f:XY가 있다. 함수 g:YX가 모든 yY에 대해 f(g(y))=y를 만족하면, gf오른쪽 역함수(right inverse function)라고 한다.

조금 더 간결하게 표현하면, fg=idY를 만족하는 g이다.

만약 fg의 왼쪽 역함수라면, gf의 오른쪽 역함수가 된다. 대칭성에 따른 당연한 결과이다.

오른쪽 역함수 예시Permalink

대칭성에 의해, 왼쪽 역함수의 예시를 뒤집으면 오른쪽 역함수의 예시가 된다. 왼쪽 역함수 예시에서 fg의 오른쪽 역함수이다. 또한 g는 전사함수로 오른쪽 역함수를 가질 필요충분조건을 만족함을 확인할 수 있다.

오른쪽 역함수가 존재하기 위한 필요충분조건Permalink

f의 오른쪽 역함수 g가 존재하기 위한 필요충분조건은 f가 전사함수(surjective, onto)인 것이다. (단 후술하겠지만 이는 선택공리(axiom of choice)가 참이라는 전제 하에 성립한다.)

필요충분조건의 의미를 직관적으로 생각하면 다음과 같다. 우선 모든 yY에 대해 f(g(y))=y라는 것은, f의 출력값이 y가 되는 경우가 있음을 뜻한다. 따라서 f의 치역은 모든 yY를 포함해야 한다. 따라서 f의 치역은 공역 Y와 같아야 하므로 전사함수여야 한다. 또한 f가 전사함수라면, 임의의 yY에 대해 f(x)=y를 만족하는 공집합이 아닌 xX의 집합 Xy가 존재하는데, Xy에서 x를 하나 뽑아 g(y)=x로 설정함으로써 오른쪽 역함수 g를 만들 수 있다. (이 과정이 선택공리를 필요로 한다.)

선택공리와의 연관성Permalink

ZF 공리계에서 이 필요충분조건은 선택공리와 동치인 명제이다. 즉 이 필요충분조건은 선택공리가 참이라는 가정 하에서 유효하며, 선택공리가 거짓일 경우 이것 역시 거짓이 된다. 일반적으로 선택공리는 참으로 여겨지므로 이 필요충분조건도 일반적으로 성립한다.

앞에서 설명한 것처럼 선택공리가 필요한 이유는 f(x)=y를 만족하는 x의 집합에서 하나를 뽑아 g를 구성하기 위함이다. 일반적인 경우에서는 이것을 가능하게 하기 위해서 선택공리가 필요하다. 그러나 간단한 함수의 경우 x를 뽑는 과정을 명시적으로 결정할 수 있으며, 이 경우 선택공리에 의존하지 않는다. 다음 문단에 이에 대한 예가 있다.

오른쪽 역함수는 유일하지 않다Permalink

일반적으로 오른쪽 역함수는 유일하지 않다. 이 역시 앞에서 문제가 되었던 선택 과정과 연관이 있다.

앞의 예시를 가져오자. 기호의 혼동을 막기 위해 fg의 이름을 바꾸었다.

f:RR0,f(x)=x2

f는 전사함수이므로 오른쪽 역함수를 가진다. 이때 모든 yR0에 대해 f(x)=y를 만족하는 집합을 Xy라고 하면

Xy={y,y}

이다. 이 Xy에서 하나의 x를 뽑는 과정은 명시적으로 이루어질 수 있으며, 그 방법도 유일하지 않다. 예를 들어 Xy에서 음이 아닌 원소 y를 뽑아 오른쪽 역함수

g:R0R,g(y)=y

를 만들 수 있다. 만약 양이 아닌 원소 y를 뽑는다면 또 다른 오른쪽 역함수인

g:R0R,g(y)=y

를 만들 수 있다. 이 외에도 g를 구성하기 위한 방법은 무한히 많다. 조금 더 복잡한 방법으로,

g:R0R,g(y)={yif yR0Qyif yR0Q

가 있다. 유리수와 무리수 여부에 따라 선택할 원소를 결정하는 방식으로, 상당히 병리적인 함수이지만 여전히 f의 오른쪽 역함수이다.

만약 Xy의 원소가 항상 1개라면 선택의 방법은 하나로 고정되므로 오른쪽 역함수도 유일하다. 이는 임의의 yY에 대해 f(x)=y를 만족하는 xX가 유일함을 뜻한다. 즉 f가 전단사함수일 경우 오른쪽 역함수는 유일하다. 후술하겠지만 이 경우 일반 역함수가 된다.

양쪽 역함수가 모두 존재하는 경우Permalink

만약 함수 f가 왼쪽 역함수와 오른쪽 역함수를 모두 가진다면, 이 둘은 동일하고 유일하게 존재한다. 이는 f의 역함수(inverse function)와 같다.

증명은 다음과 같다. f의 왼쪽 역함수와 오른쪽 역함수를 각각 gl, gr이라고 하자. 그러면 모든 yY에 대해

gl(y)=(gl(fgr))(y)=((glf)gr)(y)=gr(y)

이다. 따라서 g=gl=gr이다. 따라서 왼쪽 역함수와 오른쪽 역함수는 동일하다. 또한 앞의 문단에서 설명한 것처럼 왼쪽 역함수나 오른쪽 역함수는 f가 전단사함수일 경우 유일하다. f는 양쪽 역함수를 다 가지므로 단사함수이며 전사함수이다. 따라서 g는 유일하다.

g는 왼쪽 역함수이면서 오른쪽 역함수이므로, 모든 xX에 대해 g(f(x))=x이고 모든 yY에 대해 f(g(y))=y이다. 따라서 역함수에 정의를 만족하므로 gf의 역함수이다.

역함수가 존재할 필요충분조건 역시 왼쪽 역함수와 오른쪽 역함수의 필요충분조건을 합친, f가 전단사함수인 것이다. 단 오른쪽 역함수와는 다르게, 역함수 존재의 필요충분조건은 선택공리와 무관하다. 이에 대한 직관적인 이유는 오른쪽 역함수를 구성하는 방법을 살펴보면 알 수 있다. f가 전단사함수이면, yY에 대해 f(x)=y를 만족하는 집합 Xy는 항상 하나의 원소를 갖는다. 따라서 선택공리를 통한 선택 과정이 필요하지 않다.

한쪽 역함수가 존재하나 역함수는 존재하지 않는 경우Permalink

왼쪽 역함수 예시를 다시 돌아보자. 이때 gf의 왼쪽 역함수이고, fg의 오른쪽 역함수이다. 모든 xR0에 대해 g(f(x))=x이기 때문이다. 그러나 fg는 서로 역함수 관계는 아니다. 모든 yR에 대해 f(g(y))=y가 성립하지는 않기 때문이다 (y<0인 경우 f(g(y))=y이다).

만약 f의 공역과 g의 정의역을 R0으로 축소시킨다면 서로 역함수 관계가 된다. 이러면 fg는 모두 전단사함수가 되어 필요충분조건 역시 만족한다.

추가 예시Permalink

유한 차원 선형 변환Permalink

행렬로 표현되는 선형 변환의 경우 왼쪽 역함수와 오른쪽 역함수의 개념은 행렬의 rank와 연관이 있다. 다음과 같은 선형 변환 f를 생각하자.

f:RnRm,f(x)=Ax

rank(A)=nm이라고 하자. 그러면 A의 영공간(null space)의 차원은 nrank(A)=0이다 (rank-nullity theorem). 따라서 f는 단사함수이다. 따라서 f는 왼쪽 역함수를 가진다.

rank(A)=mn이라고 하자. 그러면 A의 열공간(column space)은 f의 공역 Rm과 같다. 따라서 f는 전사함수이다. 따라서 f는 오른쪽 역함수를 가진다.

rank(A)=m=n이라고 하자. 그러면 f는 전단사함수이므로 역함수를 가진다. 그리고 (유일한) 역함수는 A의 역행렬 A1로 표현되는 선형 변환이다.

f가 역함수를 가지는 경우 역함수는 역행렬로 간단히 표현됨은 쉽게 알 수 있지만, 일반적인 왼쪽 또는 오른쪽 역함수는 어떤 형태인지 의문이 들 수 있다. 앞에서 설명한 대로 f가 전단사함수가 아니면(n<m) 왼쪽 역함수는 유일하지 않다. 또한 선형 변환이라는 보장도 없다. 그러나 그 중 선형 변환인 것은 유일하다. 선형인 왼쪽 역함수를 g(x)=Bx라고 하면

B=(ATA)1AT

이다.

마찬가지로 f가 전단사함수가 아니면(m<n) 오른쪽 역함수는 유일하지 않고 일반적으로 선형 변환도 아니지만, 선형 변환인 것은 유일하다. 선형인 오른쪽 역함수를 g(x)=Bx라고 하면

B=AT(AAT)1

이다.

이 내용은 Moore–Penrose inverse와 관련이 있다. 위에서 설명한 선형 변환인 왼쪽 역함수와 오른쪽 역함수를 표현하는 행렬은 Moore–Penrose inverse에 해당한다.

참고문헌Permalink

Leave a comment