[include(틀:절대부등식)] [목차] == 개요 및 진술 == {{{+1 Jensen inequality}}} [[덴마크]]의 [[수학자]] 요한 옌센(Johan Jensen)[* 참고로 옌센의 본업은 수학이 아니였고, [[엔지니어]]였다.]에 의해 발표된 부등식이다. 덴마크인이므로 [[덴마크어|원어]]를 존중하자면 J를 [[반모음]][* 전문용어로는 [[경구개음#경구개 접근음|경구개]] [[접근음]]이라 하며, 음성기호로 로마자 소문자 j를 그대로 쓴다.]으로 발음하는 '옌센' 부등식이 맞으나 사용빈도가 밀리는 편이고, [[영어]]식으로 J를 [[자음]][* 이쪽은 [[유성음|유성]] [[후치경음#후치경 파찰음|후치경]] [[파찰음]]이며 반모음과 구분되게 음성기호를 ǰ나 d͡ʒ로 쓴다.][* 물론 반모음도 자음에 들어가긴 한다. 정확히는 여기서 J를 자음으로 읽는다는 것은 반모음에 대비되는 [[장애음|진자음]](true consonant)이라는 말이다. 다만 본문에서는 문서의 주제와 먼 수학 외 분야의 복잡한 개념의 사용을 회피하려고 간략히 기술한 것이다.]으로 발음하여 '젠센'[* 사실 [[모음]]까지 제대로 영어식 발음을 한다면 [[강세]] 때문에 '젠슨'이겠지만, 이 부등식 이름의 국문 표기에서만큼은 애매한(?) 영어식이지만 [[경로의존성|고착화]]된 '젠센'보다 훨씬 안 쓰인다. 그래서 본문에서는 가장 흔하거나 가장 근본있는 단지 두 경우만 언급하고 있다.] 부등식이라 부르는 일이 보통 잦다. 수학경시 등 고교 과정의 이산적인 버전 >함수 [math(f:I\to\R)]이 [[볼록함수]]라고 하자. 그러면, 임의의 [math(x_1,x_2,\dots,x_n\in I)]와 [math(\lambda_1+\lambda_2+\cdots+\lambda_n=1)]을 만족하는 임의의 음이 아닌 실수 [math(\lambda_1,\lambda_2,\dots,\lambda_n)]에 대하여 {{{#!wiki style="margin: 10px 0; text-align:center" [math(\lambda_1 f\left(x_1\right)+\lambda_2 f\left(x_2\right)+\cdots+\lambda_n f\left(x_n\right)\geq f\left(\lambda_1 x_1+\lambda_2 x_2 +\cdots+\lambda_n x_n\right))][* n=2라면 볼록함수의 정의가 된다.]}}}이다. 만약 [math(f)]가 [[오목함수]]이면, 위 부등식의 부호가 반대이다. 또는 [[확률론]] 등에서 나오는 일반화된 버전 >볼록함수 [math(f)]와 적분가능한 [[확률변수]] [math(X)]에 대해, [math(\mathbb{E}\left[f(X)\right] \ge f\left(\mathbb{E}[X]\right))]가 성립한다.[* [math(f(X))]가 적분가능할 필요는 없다. [math(f(X))]의 [[음수]] 부분이 적분가능하며, 양수 부분의 적분이 발산하는 경우가 이에 해당한다. 저 부등식은 그대로 성립.] 이 있다. [[볼록함수]]에 대해서는 문서 참조.[* 간단히 설명하면, 그래프가 아래로 볼록하게 생긴 함수를 볼록함수라 한다. 즉, 그래프 위의 어느 두 점을 찍더라도 그 점을 이은 선분보다 그래프가 밑에 있다.] 아래의 버전에서 [math(X)]를 [math(P(X=x_i) = \lambda_i)]인 이산[[확률변수]]로 설정하면 위의 버전이 됨을 확인할 수 있다. 한마디로 요약하면 아래로 볼록한 함수에서 ''함숫값의 산술평균값이 산술평균값의 함숫값보다 크거나 같다''는 내용이다. 수학 경시대회의 젠센 부등식은 [[절대부등식]]을 증명하는 데에 있어 반드시 알아놔야 할 아주 '''강력한''' 부등식으로 평가받는다. 특히 수학 경시대회에서 출제된 부등식 문제가 볼록 (오목) 함수에 관한 것이라 추측이 가능하면 대부분 이 젠센 부등식으로 해결이 가능하다. 합이 주어진 상황에서 함수값의 최적화를 생각하는 사실상의 일반적인 방법으로 생각할 수 있다. 물론 젠센 부등식의 진가는 경시대회에 국한되지 않는다. 마치 벡터만 있으면 나오는 [[코시-슈바르츠 부등식]]처럼, 볼록성과 관련된 다방면에 걸친 현상을 설명하는 '''근본적인''' 부등식으로 간주되어 확률론, [[통계학]], 통계 역학, 금융수학, [[기대효용이론]] 등 정말 다양한 분야에서 자연스럽게 등장하곤 한다. == 증명 == [math(f)]가 두번 미분가능할 때의 증명은 다음과 같다. [math(x_0 = \mathbb{E}[X])]에 대해 볼록함수에 대한 부등식 [math(f(x) \ge f'(x_0)(x-x_0)+f(x_0))]을 생각한다. (증명은 구간 [math([x_0,x])] 또는 [math([x,x_0])]에서 [[평균값 정리]]를 쓰면 된다.) 여기서 [math(x=X)]로 놓고 기대값을 취해주면 끝. 미분가능하지 않은 일반적인 [[볼록함수]]에 대해서도, 어떤 상수 [math(a)]가 존재해 {{{#!wiki style="text-align: center" [math(f(x) \ge a(x-x_0)+f(x_0)\quad\ldots \left(*\right))]}}} 를 만족시킨다는 사실은 변함없기 때문에 그대로 진행하면 된다. || '''[math(\left(*\right))]의 자세한 증명''' || || {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="text-align:left" 구간 [math([a,b])]에서의 평균변화율을 [math(df_{p,q} = \dfrac{f(q)-f(p)}{q-p})]라 표기하자. 다음을 먼저 증명한다. {{{#!wiki style="margin-bottom: -20px" >{{{#!wiki style="margin:1em calc(2em + 25px) 1em 1em" [math(ph_2>0)]에 대해 {{{#!wiki style="text-align:center" [math(df_{x_0-h_1, x} \le df_{x_0-h_2, x} \le df_{x_0,x_0+h_2} \le df_{x_0,x_0+h_1})]}}} 을 알 수 있고, 따라서 좌미분 [math(d_{-}f(x_0) = \displaystyle\liminf_{h \rightarrow 0+}df_{x_0-h,x_0})]와 우미분 [math( d_{+}f(x_0) = \displaystyle\liminf_{h\rightarrow 0+}df_{x_0,x_0+h})]가 존재하고 [math(d_{-}f(x_0) \le d_{+}f(x_0))]임을 알 수 있다. 이제 [math(a)]를 [math(\left[d_{-}f(x_0),d_{+}f(x_0)\right])] 사이의 아무 숫자로 잡으면, [math(x>x_0)]에 대해 {{{#!wiki style="text-align:center" [math(f(x)-f(x_0) = df_{x_0,x}(x-x_0) \ge d_{+}f(x_0)(x-x_0) \ge a(x-x_0))]}}} 이고, [math(x {{{#!folding [ 증명 펼치기 · 접기 ] {{{#!wiki style="text-align:left" [math(n=2)]일 때는 볼록함수의 정의에 의해 성립한다. 이제 [math(n=k)]일 때 성립한다고 가정하자. [math(\lambda_k>0)]이고 [math(\lambda_1+\lambda_2+\cdots+\lambda_k+\lambda_{k+1}=1)]일 때 {{{#!wiki style="text-align:center" [math(\displaystyle\sum_{i=1}^{k+1}\lambda_i f\left(x_i\right)=\left(1-\lambda_{k+1}\right)\sum_{i=1}^{k}\frac{\lambda_i}{1-\lambda_{k+1}}f\left(x_i\right)+\lambda_{k+1}f\left(x_{k+1}\right)\quad\ldots \left(1\right))]}}} 이다. 이 때 [math(\lambda_1+\lambda_2+\cdots+\lambda_k=1-\lambda_{k+1})]이므로 [math(\displaystyle\sum_{i=1}^{k}\frac{\lambda_i}{1-\lambda_{k+1}}=1)]이다. [math(n=k)]일 때 성립한다고 가정했으므로 [math(\displaystyle\sum_{i=1}^{k}\frac{\lambda_i}{1-\lambda_{k+1}}=1)]일 때 {{{#!wiki style="text-align:center" [math(\displaystyle\sum_{i=1}^{k}\frac{\lambda_i}{1-\lambda_{k+1}}f\left(x_i\right)\geq f\left(\sum_{i=1}^{k}\frac{\lambda_i x_i}{1-\lambda_{k+1}}\right))]}}} 가 성립한다. 이 식을 [math(\left(1\right))]에 대입하면 ||[math(\begin{aligned}\displaystyle\sum_{i=1}^{k+1}\lambda_i f\left(x_i\right)&=\left(1-\lambda_{k+1}\right)\sum_{i=1}^{k}\frac{\lambda_i}{1-\lambda_{k+1}}f\left(x_i\right)+\lambda_{k+1}f\left(x_{k+1}\right)\\&\geq\left(1-\lambda_{k+1}\right)f\left(\sum_{i=1}^{k}\frac{\lambda_i x_i}{1-\lambda_{k+1}}\right)+\lambda_{k+1}f\left(x_{k+1}\right)\\&= f\left(\sum_{i=1}^{k+1}\lambda_i x_i\right)\end{aligned})]|| 가 성립하게 되어 [math(n=k+1)]일 때도 성립한다. [math(\blacksquare)]}}}}}} || 함수 [math(f)]가 오목함수일 때도 같은 방법으로 증명이 가능하다. [math(f)]가 오목함수이면 [math(-f)]가 볼록함수이므로 부호만 바꿔주면 된다. == 활용 == [math(f\left(x\right)=\ln x)], [math(\lambda_i=\frac{1}{n})]라 하자. [[로그함수]]는 오목함수이므로 위 부등식의 방향을 뒤집고 잘 정리해주면 [[산술·기하 평균 부등식]]이 튀어나온다! 한 줄짜리 증명이 되어버리는 것.[* [math(\lambda_i)]를 임의의 실수라고 두면 가중치가 붙은(weighted) 산술 기하 부등식이 나온다.] 이 외에도 [[삼각형]]의 세 각 [math(\alpha,\beta,\gamma)]에 대해 [math(\sin\alpha+\sin\beta+\sin\gamma\leq\frac{3\sqrt{3}}{2})] 같은 유명한 부등식을 증명하는 데에도 젠센 부등식이 가장 효과적이다. [math(L^p )] 공간을 연구할 때 쓰이는 [[횔더 부등식]](Hölder's inequality)을 유도할 때 중요하게 쓰이는 부등식이다. 또한 해당 부등식으로부터 민코프스키 부등식 (Minkowski inequality) 를 유도하면 해당 공간에 [[노름(수학)|노름]]을 정의할 수 있다. 여러 응용수학에서도 확률변수와 볼록함수가 같이 튀어나오면 무조건 사용되는 부등식이다. 정보 이론에서 나오는 [[엔트로피]]에 대한 Gibbs 부등식 [math( - \sum p_i \log p_i \le - \sum p_i \log q_i )]이나, 통계역학의 여러 상황들이라던지. 금융수학 계열에서도 많이 등장하는데, [[보험계리사]] 보험수리 시험에 나오는 [[http://www.mies.co.kr/upload/avanboard_v3/%EB%B3%B4%ED%97%98%EC%88%98%EB%A6%AC.pdf|젠센 부등식]] (2013년) 이나 [[FRM]]: Market Risk management - fixed income 파트에서 젠센 부등식을 채권의 볼록성과 연관지어 학습하게 된다거나(증명과정까지는 요구하지 않지만 기본적인 concept을 이해하고 계산까지 할 줄 알아야 한다.) 등등의 사례가 있다. == 확장 == 개요에서 언급했듯이 젠센 부등식은 [[평균#s-2.1|산술평균]]값의 함숫값과 함숫값의 [[평균#s-2.1|산술평균]]값을 비교한 부등식이다. 산술평균 대신 다른 평균 ([[평균#s-2.2|기하평균]], [[평균#s-2.3|조화평균]], 멱평균, 가중치 멱평균)을 넣어도 가능하다. 주의할 점은, 이 때는 함수를 그래프로 나타내었을 때 꼭 아래로 혹은 위로 볼록일 필요는 없다는 것이다. 양의 실수 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)]의 [math(r)]차 멱평균을 [math(M_n^r \left\{ x_i \right\})]라고 하자. 즉, {{{#!wiki style="text-align:center" [math(M_n^r \left\{ x_i \right\} = \left\{ \begin{array}{l} \sqrt[r]{\dfrac{x_1^r + x_2^r + \cdots + x_n^r}{n}} & r \neq 0\\ ~ \\ \sqrt[n]{x_1 x_2 \cdots x_n} & r=0\end{array} \right.)]이다.}}} 그리고, 양의 실수 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)]의 합이 [math(1)]이고 모두 양수인 가중치 [math(\lambda_1)], [math(\lambda_2)], [math(\cdots)], [math(\lambda_n)]에 대한 [math(r)]차 가중치멱평균을 [math(M_n^r \left\{ x_i | \lambda_i \right\})]라고 하자. 즉, {{{#!wiki style="text-align:center" [math(M_n^r\left\{x_i,\lambda_i\right\} = \left\{\begin{array}{l}\sqrt[r]{\lambda_1 x_1^r+\lambda_2 x_2^r+\cdots+\lambda_n x_n^r} & r\ne 0\\~\\ x_1^{\lambda_1}x_2^{\lambda_2}\cdots x_n^{\lambda_n} & r=0\end{array}\right.)]이다.}}} 멱평균으로 일반화한 젠센 부등식은 다음과 같다. >함수 [math(f:I \rightarrow \R)]와 실수 [math(r)]이 주어져 있다. 임의의 [math(x_1)], [math(x_2 \in I)]에 대하여, [math(M_2^r \left\{ f(x_i) \right\} \ge (\le) f \left( M_2^r \{ x_i \} \right))]이 성립하면, 임의의 자연수 [math(n)]과 임의의 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)]에 대하여 [math(M_n^r \left\{ f(x_i) \right\} \ge (\le) f \left( M_n^r \{ x_i \} \right))]이 성립한다. 그리고 가중치 멱평균으로 일반화한 젠센부등식은 다음과 같다. >함수 [math(f:I \rightarrow \R)]와 실수 [math(r)]이 주어져 있다. 임의의 [math(x_1)], [math(x_2 \in I)]와 임의의 합이 [math(1)]인 양의 실수 [math(\lambda_1)], [math(\lambda_2)]에 대하여, 부등식{{{#!wiki style="text-align:center; margin: 10px 0" [math(M_2^r \left\{ f(x_i) |\lambda_i \right\} \ge (\le) f \left( M_2^r \{ x_i |\lambda_i \} \right))]}}}이 성립하면, 임의의 자연수 [math(n)]과 임의의 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)], 그리고 합이 [math(1)]인 임의의 양의 실수 [math(\lambda_1)], [math(\lambda_2)], [math(\cdots)], [math(\lambda_n)]에 대하여{{{#!wiki style="text-align:center; margin: 10px 0" [math(M_n^r \left\{ f(x_i) |\lambda_i \right\} \ge (\le) f \left( M_n^r \{ x_i |\lambda_i \} \right))]}}}이 성립한다. '''하지만, 이게 끝이 아니다!''' 위 젠센 부등식을 더욱 일반화할 수 있는데, 일반화 내용은 부등식 양변의 멱평균의 차수가 같을 필요가 없다는 것이다. 즉, 멱평균과 가중치 멱평균으로 더욱 일반화된 젠센 부등식은 각각 다음과 같다. >함수 [math(f:I \rightarrow \R)]와 실수 [math(r)], [math(s)]가 주어져 있다. 임의의 [math(x_1)], [math(x_2 \in I)]에 대하여, [math(M_2^r \left\{ f(x_i) \right\} \ge (\le) f \left( M_2^s \{ x_i \} \right))]이 성립하면, 임의의 자연수 [math(n)]과 임의의 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)]에 대하여 [math(M_n^r \left\{ f(x_i) \right\} \ge (\le) f \left( M_n^s \{ x_i \} \right))]이 성립한다. >함수 [math(f:I \rightarrow \R)]와 실수 [math(r)], [math(s)]가 주어져 있다. 임의의 [math(x_1)], [math(x_2 \in I)]와 임의의 합이 [math(1)]인 양의 실수 [math(\lambda_1)], [math(\lambda_2)]에 대하여, 부등식{{{#!wiki style="text-align:center; margin: 10px 0" [math(M_2^r \left\{ f(x_i) |\lambda_i \right\} \ge (\le) f \left( M_2^s \{ x_i |\lambda_i \} \right))]}}}이 성립하면, 임의의 자연수 [math(n)]과 임의의 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)], 그리고 합이 [math(1)]인 임의의 양의 실수 [math(\lambda_1)], [math(\lambda_2)], [math(\cdots)], [math(\lambda_n)]에 대하여{{{#!wiki style="text-align:center; margin: 10px 0" [math(M_n^r \left\{ f(x_i) |\lambda_i \right\} \ge (\le) f \left( M_n^s \{ x_i |\lambda_i \} \right))]}}}이 성립한다. 증명은 멱평균 부등식을 이용할 경우 [math(n)]에 대한 확장된 귀납법 (즉, [math(n)]이 [math(2)]의 거듭제곱일 때 수학적 귀납법으로 증명하고, [math(2)]의 거듭제곱이 아닌 경우를 나중에 증명하는 방법)으로 증명하고, 가중치 멱평균 부등식을 이용할 경우 [math(n)]에 대한 일반적인 수학적 귀납법을 이용하면 된다. == 관련 문서 == * [[절대부등식]] * [[볼록함수]] * [[산술·기하 평균 부등식]] [[분류:절대부등식]]