젠센 부등식
덤프버전 :
분류
1. 개요 및 진술[편집]
Jensen inequality
덴마크의 수학자 요한 옌센(Johan Jensen)[1] 에 의해 발표된 부등식이다. 덴마크인이므로 원어를 존중하자면 J를 반모음[2] 으로 발음하는 '옌센' 부등식이 맞으나 사용빈도가 밀리는 편이고, 영어식으로 J를 자음[3][4] 으로 발음하여 '젠센'[5] 부등식이라 부르는 일이 보통 잦다.
수학경시 등 고교 과정의 이산적인 버전
[math(\lambda_1 f\left(x_1\right)+\lambda_2 f\left(x_2\right)+\cdots+\lambda_n f\left(x_n\right)\geq f\left(\lambda_1 x_1+\lambda_2 x_2 +\cdots+\lambda_n x_n\right))][6] }}}이다. 만약 [math(f)]가 오목함수이면, 위 부등식의 부호가 반대이다.함수 [math(f:I\to\R)]이 볼록함수라고 하자. 그러면, 임의의 [math(x_1,x_2,\dots,x_n\in I)]와 [math(\lambda_1+\lambda_2+\cdots+\lambda_n=1)]을 만족하는 임의의 음이 아닌 실수 [math(\lambda_1,\lambda_2,\dots,\lambda_n)]에 대하여 {{{#!wiki style="margin: 10px 0; text-align:center"
또는 확률론 등에서 나오는 일반화된 버전
이 있다. 볼록함수에 대해서는 문서 참조.[8] 아래의 버전에서 [math(X)]를 [math(P(X=x_i) = \lambda_i)]인 이산확률변수로 설정하면 위의 버전이 됨을 확인할 수 있다.볼록함수 [math(f)]와 적분가능한 확률변수 [math(X)]에 대해, [math(\mathbb{E}\left[f(X)\right] \ge f\left(\mathbb{E}[X]\right))]가 성립한다.[7]
한마디로 요약하면 아래로 볼록한 함수에서 함숫값의 산술평균값이 산술평균값의 함숫값보다 크거나 같다는 내용이다.
수학 경시대회의 젠센 부등식은 절대부등식을 증명하는 데에 있어 반드시 알아놔야 할 아주 강력한 부등식으로 평가받는다. 특히 수학 경시대회에서 출제된 부등식 문제가 볼록 (오목) 함수에 관한 것이라 추측이 가능하면 대부분 이 젠센 부등식으로 해결이 가능하다. 합이 주어진 상황에서 함수값의 최적화를 생각하는 사실상의 일반적인 방법으로 생각할 수 있다.
물론 젠센 부등식의 진가는 경시대회에 국한되지 않는다. 마치 벡터만 있으면 나오는 코시-슈바르츠 부등식처럼, 볼록성과 관련된 다방면에 걸친 현상을 설명하는 근본적인 부등식으로 간주되어 확률론, 통계학, 통계 역학, 금융수학, 기대효용이론 등 정말 다양한 분야에서 자연스럽게 등장하곤 한다.
2. 증명[편집]
[math(f)]가 두번 미분가능할 때의 증명은 다음과 같다. [math(x_0 = \mathbb{E}[X])]에 대해 볼록함수에 대한 부등식 [math(f(x) \ge f'(x_0)(x-x_0)+f(x_0))]을 생각한다. (증명은 구간 [math([x_0,x])] 또는 [math([x,x_0])]에서 평균값 정리를 쓰면 된다.) 여기서 [math(x=X)]로 놓고 기대값을 취해주면 끝. 미분가능하지 않은 일반적인 볼록함수에 대해서도, 어떤 상수 [math(a)]가 존재해
를 만족시킨다는 사실은 변함없기 때문에 그대로 진행하면 된다.
경시대회 등에서 이산적인 경우는 보통 수학적 귀납법을 이용해 다음처럼 증명한다.
3. 활용[편집]
[math(f\left(x\right)=\ln x)], [math(\lambda_i=\frac{1}{n})]라 하자. 로그함수는 오목함수이므로 위 부등식의 방향을 뒤집고 잘 정리해주면 산술·기하 평균 부등식이 튀어나온다! 한 줄짜리 증명이 되어버리는 것.[9] 이 외에도 삼각형의 세 각 [math(\alpha,\beta,\gamma)]에 대해 [math(\sin\alpha+\sin\beta+\sin\gamma\leq\frac{3\sqrt{3}}{2})] 같은 유명한 부등식을 증명하는 데에도 젠센 부등식이 가장 효과적이다.
[math(L^p )] 공간을 연구할 때 쓰이는 횔더 부등식(Hölder's inequality)을 유도할 때 중요하게 쓰이는 부등식이다. 또한 해당 부등식으로부터 민코프스키 부등식 (Minkowski inequality) 를 유도하면 해당 공간에 노름을 정의할 수 있다.
여러 응용수학에서도 확률변수와 볼록함수가 같이 튀어나오면 무조건 사용되는 부등식이다. 정보 이론에서 나오는 엔트로피에 대한 Gibbs 부등식 [math( - \sum p_i \log p_i \le - \sum p_i \log q_i )]이나, 통계역학의 여러 상황들이라던지. 금융수학 계열에서도 많이 등장하는데, 보험계리사 보험수리 시험에 나오는 젠센 부등식 (2013년) 이나 FRM: Market Risk management - fixed income 파트에서 젠센 부등식을 채권의 볼록성과 연관지어 학습하게 된다거나(증명과정까지는 요구하지 않지만 기본적인 concept을 이해하고 계산까지 할 줄 알아야 한다.) 등등의 사례가 있다.
4. 확장[편집]
개요에서 언급했듯이 젠센 부등식은 산술평균값의 함숫값과 함숫값의 산술평균값을 비교한 부등식이다. 산술평균 대신 다른 평균 (기하평균, 조화평균, 멱평균, 가중치 멱평균)을 넣어도 가능하다. 주의할 점은, 이 때는 함수를 그래프로 나타내었을 때 꼭 아래로 혹은 위로 볼록일 필요는 없다는 것이다.
양의 실수 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)]의 [math(r)]차 멱평균을 [math(M_n^r \left\{ x_i \right\})]라고 하자. 즉,
그리고, 양의 실수 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)]의 합이 [math(1)]이고 모두 양수인 가중치 [math(\lambda_1)], [math(\lambda_2)], [math(\cdots)], [math(\lambda_n)]에 대한 [math(r)]차 가중치멱평균을 [math(M_n^r \left\{ x_i | \lambda_i \right\})]라고 하자. 즉,
멱평균으로 일반화한 젠센 부등식은 다음과 같다.
그리고 가중치 멱평균으로 일반화한 젠센부등식은 다음과 같다.함수 [math(f:I \rightarrow \R)]와 실수 [math(r)]이 주어져 있다. 임의의 [math(x_1)], [math(x_2 \in I)]에 대하여, [math(M_2^r \left\{ f(x_i) \right\} \ge (\le) f \left( M_2^r \{ x_i \} \right))]이 성립하면, 임의의 자연수 [math(n)]과 임의의 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)]에 대하여 [math(M_n^r \left\{ f(x_i) \right\} \ge (\le) f \left( M_n^r \{ x_i \} \right))]이 성립한다.
[math(M_2^r \left\{ f(x_i) |\lambda_i \right\} \ge (\le) f \left( M_2^r \{ x_i |\lambda_i \} \right))]}}}이 성립하면, 임의의 자연수 [math(n)]과 임의의 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)], 그리고 합이 [math(1)]인 임의의 양의 실수 [math(\lambda_1)], [math(\lambda_2)], [math(\cdots)], [math(\lambda_n)]에 대하여함수 [math(f:I \rightarrow \R)]와 실수 [math(r)]이 주어져 있다. 임의의 [math(x_1)], [math(x_2 \in I)]와 임의의 합이 [math(1)]인 양의 실수 [math(\lambda_1)], [math(\lambda_2)]에 대하여, 부등식{{{#!wiki style="text-align:center; margin: 10px 0"
하지만, 이게 끝이 아니다! 위 젠센 부등식을 더욱 일반화할 수 있는데, 일반화 내용은 부등식 양변의 멱평균의 차수가 같을 필요가 없다는 것이다. 즉, 멱평균과 가중치 멱평균으로 더욱 일반화된 젠센 부등식은 각각 다음과 같다.
함수 [math(f:I \rightarrow \R)]와 실수 [math(r)], [math(s)]가 주어져 있다. 임의의 [math(x_1)], [math(x_2 \in I)]에 대하여, [math(M_2^r \left\{ f(x_i) \right\} \ge (\le) f \left( M_2^s \{ x_i \} \right))]이 성립하면, 임의의 자연수 [math(n)]과 임의의 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)]에 대하여 [math(M_n^r \left\{ f(x_i) \right\} \ge (\le) f \left( M_n^s \{ x_i \} \right))]이 성립한다.
[math(M_2^r \left\{ f(x_i) |\lambda_i \right\} \ge (\le) f \left( M_2^s \{ x_i |\lambda_i \} \right))]}}}이 성립하면, 임의의 자연수 [math(n)]과 임의의 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)], 그리고 합이 [math(1)]인 임의의 양의 실수 [math(\lambda_1)], [math(\lambda_2)], [math(\cdots)], [math(\lambda_n)]에 대하여함수 [math(f:I \rightarrow \R)]와 실수 [math(r)], [math(s)]가 주어져 있다. 임의의 [math(x_1)], [math(x_2 \in I)]와 임의의 합이 [math(1)]인 양의 실수 [math(\lambda_1)], [math(\lambda_2)]에 대하여, 부등식{{{#!wiki style="text-align:center; margin: 10px 0"
증명은 멱평균 부등식을 이용할 경우 [math(n)]에 대한 확장된 귀납법 (즉, [math(n)]이 [math(2)]의 거듭제곱일 때 수학적 귀납법으로 증명하고, [math(2)]의 거듭제곱이 아닌 경우를 나중에 증명하는 방법)으로 증명하고, 가중치 멱평균 부등식을 이용할 경우 [math(n)]에 대한 일반적인 수학적 귀납법을 이용하면 된다.