집합 판별 함수

덤프버전 :




1. 설명
1.1. 중등교육 수준의 설명
2. 유리수 판별 함수(디리클레 함수)
3. 활용
4. 관련 문서


1. 설명[편집]




특수함수의 하나로, 지시 함수(, indicator function), 특성 함수(, characteristic function)라고도 한다.[1] [math(\bold{1}_{A}(x))][2]로 표기하거나 characteristic function의 머리글자인 Ch의 그리스어인 χ를 사용하여 [math(\chi_A)]로 표기하며, 정의는 다음과 같다.

[math( \bold{1}_{A}(x) := \begin{cases} 1 & (x \in A) \\ 0 & (x \notin A) \end{cases} \qquad )] (단, [math(A)]는 집합)
[1] 다만 '특성 함수(characteristic function)'라는 말은 다른 개념을 일컫기도 한다. 적률생성함수와 유사하게, 확률 분포를 특정해 주는 역할을 하는 함수를 뜻하기도 하는 것이다.[2] 숫자 [math(1)]과 구별하기 위해 볼드체로 표기한다. indicator function의 머리글자인 I를 사용하여 [math(\mathbb{I}_A)], [math(I_A)] 혹은 1을 겹친 𝟙[math({}_{A})]를 쓰기도 한다.


또한 집합판별함수는 특히 측도적분을 이어주는 데 자주 사용된다.
  • 측도 [math(\mu)]와 집합 [math(A)]에 대해 다음이 성립한다.

[math(\displaystyle \int\bold{1}_{A}\,\mathrm{d}\mu= \int_{ A } 1\,\mathrm{d}\mu= \mu(A))]

  • 고등학교 수학에서는, 구간 [math(A= [a,\, b])]에 대해 다음이 성립한다.

[math(\displaystyle \int_{-\infty}^\infty\bold{1}_{A}(x) \, \mathrm{d}x= \int_a^b1\,\mathrm{d}x= b- a)]

또한 기댓값이 본질적으로 적분이고 확률측도임을 생각하면, 다음처럼 확률과 기댓값을 이어주는 데 사용된다는 것도 바로 알 수 있다.

[math(\begin{aligned}\displaystyle \mathbb{E}[\bold{1}_A(X) ] &= \int_A1\,\mathrm{d}P = P(A)\\\mathbb{E}[X]&=\int_AX\,\mathrm{d}P=\sum_{i=1}^ra_iP(A_i)\end{aligned})]
단, 각 [math(A_i)]들은 상호 배반이며 [math(\displaystyle\bigcup_{i=1}^rA_i=A)]이다.


1.1. 중등교육 수준의 설명[편집]


의외로 간단한 함수이다. 이 함수는 [math(\bold{1}_{A}(x))]로 표기되는데, [math(x)]가 집합 [math(A)] 안에 포함되는 원소이면 함숫값이 [math(1)]이 되고 아니면 [math(0)]이 된다. 예를 들어서, 자연수 전체의 집합을 [math(\mathbb{N})]이라고 하면, [math(5)]는 자연수이므로 [math(\bold{1}_{\mathbb{N}}(5)=1)]이고, [math(\sqrt2)]는 자연수가 아니므로 [math(\bold{1}_{\mathbb{N}}(\sqrt2)=0)]이다.

아래는 몇몇 예시를 나타낸 표이다.

함수
함숫값
[math(\bold{1}_{\mathbb{N}}(7))]
[math(1)]
[math(\bold{1}_{\mathbb{N}}(-3))]
[math(0)]
[math(\bold{1}_{\mathbb{Z}}(-3))]
[math(1)]
[math(\bold{1}_{\mathbb{Q}}(7))]
[math(1)]
[math(\bold{1}_{\mathbb{Q}}(\sqrt2))]
[math(0)]
[math(\bold{1}_{A}(4))]
([math(A = \{3,\,4,\,5\})])
[math(1)]
[math(\bold{1}_{A}(6))]
([math(A = \{3,\,4,\,5\})])
[math(0)]

여기서 [math(\mathbb{N})]은 자연수 집합, [math(\mathbb{Z})]는 정수 집합, [math(\mathbb{Q})]는 유리수 집합이다.

한편 소수 [math(\mathbb{P})]를 판별하는 소수 판별 함수 [math(\bold{1}_{\mathbb{P}})]도 생각해볼 수 있는데, [math(\bold{1}_{\mathbb{P}}(x) = 1)]을 만족시키는 수를 찾는 과정이 다름 아닌 에라토스테네스의 체이다.


2. 유리수 판별 함수(디리클레 함수)[편집]





개중에 유리수 집합 [math(\mathbb Q)]를 판별하는 디리클레 함수(Dirichlet function)[3] [math(\bold{1}_{\mathbb Q}(x))]라는 것이 있는데, 집합 판별 함수 중 아래와 같은 특이한 성질을 보이기 때문에 실해석학에서 주로 다뤄진다.
  • 모든 실수에서 불연속인 완전 불연속 함수로, 병리적 함수의 일종이다. 그래서 해석기하학그래프를 그릴 수 없다.
  • 짝함수이다: [math(\bold{1}_{\mathbb Q}(x) = \bold{1}_{\mathbb Q}(-x))]
  • 리만 적분[4]으로는 적분이 불가능하고, 르베그 적분으로 적분할 수 있으며 그 값은 0이다.
  • 오일러-마스케로니 상수, 브룬 상수, 카탈랑 상수 등 특이점이 무수히 많이 존재한다.[5]
  • 삼각함수로 정의가 가능하다: [math(\displaystyle \bold{1}_{\mathbb{Q}}( x ) = \lim_{m \to \infty} \left[ \lim_{n \to \infty} \cos^{2n}( m! \cdot \pi x ) \right] )] (단, [math(m)], [math(n)]은 정수)
이 항등식은 현실적으로는 거의 쓸모없으며 단지 학문적 유희를 위한 식이다. 그러나 유리수, 팩토리얼, 삼각함수, 지수, 그리고 극한 등 중요 개념들을 제대로 이해하고 있는지를 테스트할 수 있는 매우 좋은 식이므로, 수학에 관심 있다면 이 항등식 증명에 도전해보자.
[증명의 스케치 보기]
---
주어진 식의 우변이 [math(x)]가 유리수일 때는 [math(1)], 무리수일 때는 [math(0)]의 값을 가짐을 증명하면 된다.

우선 [math(x)]가 유리수인 경우를 생각하자. 그러면 [math(x=p/q)] 로 나타낼 수 있다. (단, [math(p)], [math(q)]는 정수, [math(q>0)]이며, 증명을 위해선 서로소일 필요는 없다.)

극한이 중첩되어 있어 혼란스러울 수 있으나, [math(\displaystyle f(m):= \lim_{n \to \infty} \cos^{2n}( m! \cdot \pi x ) )] 와 같이 안쪽 극한의 값을 [math(m)]의 함수로 생각하면 편하다. 즉, 우리의 목적은 수열 [math(\lbrace f(m) \rbrace_{m= 1}^\infty)]의 극한을 구하는 것.

[math(m)]이 충분히 큰 경우, 특히 [math(m\geq q)]인 경우 [math(m)]을 고정하고 [math(f(m))]의 값을 살펴보자. 이 경우 제일 안쪽의 식에서 [math(\pi)]를 제외한 부분은

[math(\displaystyle m!\cdot x = m!\times\frac{p}{q} = p\times \frac{m!}{q})]

이 된다. 이때 [math(m\geq q)]이므로, 팩토리얼의 정의에 의해 분자가 분모에 의해 나누어떨어지게 되어 [math(m!/q)]는 정수가 된다. 따라서 제일 안쪽 [math(m!\cdot\pi x)]는 '정수[math(\times \pi)]'의 꼴이 된다. 다음으로 이를 이용하면 코사인의 성질에 의해 [math(\cos(m! \cdot \pi x))]는 [math(-1)] 또는 [math(1)]일 수밖에 없다. 둘 중 어느 경우든지간에, [math(2n)]승 취하면 ([math(n)]이 무슨 값이든지) [math(1)]이 된다.[1] 따라서 결국 우리가 택한 [math(m\geq q)]에 대해서는, 다음이 성립한다.

[math(\displaystyle f(m) = \lim_{n\to\infty}\cos^{2n}(m!\cdot\pi x) = \lim_{n\to\infty}1 = 1)]

즉, 우리가 처음에 고정한 유리수 [math(x)]에 대해, 수열 [math(\lbrace f(m) \rbrace_{m= 1}^\infty)]은 유한한 갯수의 항을 제외하고는 [math(1)]의 값을 갖는 수열이다. 따라서 극한의 정의에 의해

[math(\displaystyle \lim_{m \to \infty} \lim_{n \to \infty} \cos^{2n}( m! \cdot \pi x ) = \lim_{m\to\infty}f(m) = 1)]

이 성립한다. 이 등식이 임의의 유리수 [math(x)]에 대해 성립함을 주목하자.

무리수의 경우도 유사하게 증명하면 된다. 이 경우 무리수의 성질에 의해 [math(m)]이 어떤 값이든지 [math(m!\cdot x)]는 정수가 될 수 없다. 코사인의 성질에 의해 [math(\cos(m!\cdot\pi x)\in(-1, 1))]이고, 이를 [math(2n)]제곱을 해나가면 [math(n)]이 커짐에 따라 [math(0)]으로 수렴한다. 즉, [math(\displaystyle\lim_{n\to\infty}\cos^{2n}(m!\cdot\pi x) = 0)]이다. 따라서 [math(x)]가 무리수인 경우, 수열 [math(\lbrace f(m) \rbrace_m^\infty)]는 0으로만 이루어진 수열이고, 이 수열이 [math(0)]으로 수렴함은 자명하다.



3. 활용[편집]


집합 판별 함수는 여러 변수들의 범위에 따라 함수식이 달라지는 복잡한 함수를 한 번에 나타낼 수 있게 해 준다. 이러한 테크닉을 사용하면 결합확률밀도함수를 인수분해하여 충분통계량을 찾아내거나, Lindeberg's condition과 같이 르벡-스틸체스 적분을 계산할 때 집합 판별 함수를 사용하는 등 다양한 곳에서 요긴하게 사용되는 수학 개념이다.

예를 들어 보자. 확률변수 [math(X_1, \cdots\!, X_n)]의 확률밀도함수가 [math(i = 1, \cdots\!, n)]에 대하여 각각

[math(
f(x_i|\theta) = \theta x_i^{-2} \quad (0 < \theta \leq x_i < \infty)
)]
[3] 고안자인 페터 디리클레(Johann Peter Gustav Lejeune Dirichlet)의 이름을 따왔다.[4] 고등학교 때 배우는 적분법을 미분적분학 기준 대학교 1학년 및 해석학 기준 대학교 2학년 수준에서 확장한 것. 주어진 구간을 [math(n)]등분하는 대신 아무렇게나 쪼개고, 오른쪽 값이나 왼쪽 값 등을 고르는 것이 아니라 각 구간에서의 최댓값과 최솟값을 고르는 정도의 차이가 존재한다. 고등학교식 적분이 리만 적분이 아니라는 증거이기도 하다. 고등학교식으로 0부터 1까지 적분하면 각 구간마다 [math(\displaystyle \frac{1}{n} \in \mathbb{Q})]이므로 [math(\bold{1}_{\mathbb{Q}}( x )=1)]이 돼서 1로 적분된다.[5] 사실 당연한 것이, 이들은 유리수인지 무리수인지가 아직 밝혀지지 않았기 때문이다. 언젠가는 저 점들도 특이점이 아닐 날이 올 것이다.

일 때 인수분해 정리(factorization theorem)를 이용하여 모수 [math(\theta)]에 대한 충분통계량을 구해 보자.

우선 해당 확률변수들의 결합확률밀도함수는 다음과 같다.

[math(
f(x_1, \cdots\!, x_n | \theta) = \begin{cases} \displaystyle \prod_{i=1}^n f(x_i|\theta) \quad &\theta \leq x_1, \cdots\!, x_n \\
0 \quad &\mathsf{otherwise} \end{cases}
)]

또한 [math(x_1, \cdots\!, x_n)]이 모두 [math(\theta)] 이상이라는 것은 [math(\min_i x_i \geq \theta)]라는 것과 같다. 따라서 위 식을 다시 쓰면

[math(
f(x_1, \cdots\!, x_n | \theta) = \begin{cases} \displaystyle \prod_{i=1}^n f(x_i|\theta) \quad &\theta \leq \min_i x_i \\
0 \quad &\theta > \min_i x_i \end{cases}
)]

그러나 이런 상태로는 결합확률밀도함수를 함수끼리의 인수분해 꼴로 나타내기 힘들거니와 무엇보다도 충분통계량을 얻어낼 수 없다. 이때 집합 판별 함수가 빛을 발한다.

[math(
\bold{1}_{[\theta,\infty)} (\min_i x_i) = \begin{cases} 1 \quad &\theta \leq \min_i x_i \\
0 \quad &\theta > \min_i x_i \end{cases}
)]

로 집합 판별 함수를 정의하면 조각적 정의를 명시적으로 쓰지 않고도 결합확률밀도함수를 다음과 같이 간단히 나타낼 수 있는 것이다.

[math(\displaystyle \begin{aligned}
f(x_1, \cdots\!, x_n | \theta) &= \prod_{i=1}^n f(x_i|\theta) \times \bold{1}_{[\theta,\infty)} \!\left( \min_i x_i \right) \\
&= \theta^n \prod_{i=1}^n x_i^{-2} \times \bold{1}_{[\theta,\infty)} \!\left( \min_i x_i \right)
\end{aligned})]

인수분해 정리를 사용하기 위하여 이를 다시 쓰면

[math(\begin{aligned}
f(x_1, \cdots\!, x_n | \theta) &= {\color{red} g(T(x)|\theta) } \,{\color{blue} h(x) } \\
&= {\color{red} \theta^n \times \bold{1}_{[\theta,\infty)} \!\left( \min_i x_i \right) } \,{\color{blue} \prod_{i=1}^n x_i^{-2} }
\end{aligned})]

으로 훌륭하게 인수분해되므로, 충분통계량은 다름 아닌 [math(T(x) = \min_i x_i)]이다. 집합 판별 함수를 사용하기 전에는 결합확률밀도함수에 [math(\min_i x_i)]가 명시적으로 드러나 있지 않았으나, 집합 판별 함수를 통해 이를 명시적으로 표시할 수 있게 되어 인수분해 정리가 적용된 것이다. 집합 판별 함수의 도움 없이는 불가능한 일이다.


4. 관련 문서[편집]




파일:크리에이티브 커먼즈 라이선스__CC.png 이 문서의 내용 중 전체 또는 일부는 2023-12-18 06:47:43에 나무위키 집합 판별 함수 문서에서 가져왔습니다.