[include(틀:다른 뜻1, other1=실제로 t-검정을 실시하는 기술적 절차, rd1=통계적 방법/분석)] [include(틀:통계학)] [목차] [[https://www.youtube.com/watch?v=v8QBYFNoC-U| 수식 없이 설명하는 t분포의 의미]]를 참조 == 개요 == 독립적인 표준정규분포 확률 변수 [math(X)]와 자유도가 [math(k)]인 [[카이제곱분포]] 확률 변수 [math(Y)]에 대해[* 즉 [math(X\sim N(0, 1))]이고 [math(Y \sim\chi^2(k))]] [math(X/\sqrt{Y/k})]가 가지는 분포를 '''스튜던츠 t 분포'''(Student’s t-distribution) 또는 '''t분포'''라고 한다. t-분포로 하는 [[검정]](test)은 스튜던츠 t-검정(Student's t-test) 또는 t-검정(t-test)이라고 부른다. == 역사 == 특이하게도 분포 이름이 [[학생]](Student)인데, 이것은 이 분포를 처음 제안한 통계학자인 윌리엄 고셋(William Sealy Gosset)이 1908년에 해당 논문을 낼 때 [[가명]]으로 Student를 사용했기 때문이다.[* 이 때문에 간혹 선생님의 t분포는 어디 있느냐는 유머도 나온다...] 윌리엄 고셋은 [[기네스]] 양조 공장에서 일하고 있었는데 적은 샘플에 대한 통계적 추정치가 잘 맞지 않은 점을 착안하여 t 분포를 제안하였다고 한다. 당시 기네스는 자사의 직원이 자사의 제품과 연관이 있는 연구 발표를 금지하고 있었다. 그래서 사측과의 협의하에 가명으로 논문을 내었고, 고셋은 Student라는 이름으로 유명해졌다. == 기본 정보 == [math(Z\sim N(0,\,1))]이고 [math(U\sim\chi^2_v)]이며 [math(Z)]와 [math(U)]가 독립일 때 t분포를 다음과 같이 정의한다. {{{#!wiki style="text-align: center;" [math(t=\dfrac{Z}{\sqrt {U/v}}\sim t_v)]}}} [[평균]]은 [math(E(t)=0)]이고 [[분산]]은 [math({\rm Var}(t)=\dfrac{v}{v-2}\;(v>2))]이다. 표준정규분포와 평균은 같으나 [math(\dfrac{v}{v-2}>1)]이므로 분산은 t분포가 더 크다. 만약 [math(v)]의 값이 커지면 분산은 갈수록 작아져 1에 근접하며, 표준정규분포와 비슷한 분포를 이루게 된다. == 공식 및 쓰임새 == [math(Z=\dfrac{\bar X-\mu}{\sigma/{\sqrt n}}\sim N(0,\,1))]이고 [math(U=\dfrac{(n-1)s^2}{\sigma^2}\sim \chi^2_{n-1})]이면 {{{#!wiki style="text-align: center;" [math(\begin{aligned}t&=\dfrac{Z}{\sqrt{U/v}}\sim t_v\\&=\dfrac{\cfrac{\bar X-\mu}{\sigma/\sqrt{n} }}{\sqrt{\cfrac{(n-1)s^2}{\sigma^2}/(n-1)}}\\&=\dfrac{\bar X-\mu}{s/\sqrt{n}}\sim t_{n-1}\end{aligned})]}}} 곧, [math(t)]분포는 표본평균 [math(\bar X)]의 표준화 식에서 모표준편차 [math(\sigma)]를 표본표준편차 [math(s)]로 대체한 것이다. 만약 모표준편차를 안다면 표본평균을 표준화한 표준정규분포로 모평균을 추측하는 것이 더욱 정확하다. 그러나 일반적으로 모표준편차를 잘 알지 못한다. 왜냐하면 모평균을 정확히 모르는데 모표준편차는 안다는 것 자체도 이상하거니와 모집단 전부를 조사하기란 현실적으로 어렵기 때문이다. 따라서 모표준편차 대신 표본표준편차의 값을 이용한 [math(t)]분포로 모평균을 추측하는 것이다. == 그래프 == || [[파일:360px-Student_t_pdf.svg.png]] || [[파일:Student_t_cdf.svg.png]] || || [[확률 밀도 함수]] || [[누적 분포 함수]] || 매개변수: [[자유도]](실수값) [[ν|[math(\nu)]]] [math(>0)] == 종류 == * 독립 표본 t-검정(independent samples t-test)과 * 대응 표본(짝지은 표본) t- 검정(paired samples t-test, 종속 표본 t-검정, dependent samples t-test)이 있다. === 독립표본 t검정 === 독립 표본 t-검정은 두 개의 집단이 동일한 [[분산]]을 가진 경우(등분산, equal variance)와 두 개의 집단이 다른 분산을 가지고 있는 경우(이분산, unequal variance)가 있다. 독립 표본 t-검정은 두 반의 성적 평균 차이가 통계적으로 유의한 차이가 있나 등을 검증할 때 쓴다. [[F-검정]]으로 등분산인지 이분산인지 검증해봐서 F-검정의 [[p-값]]이 0.05보다 작으면 이분산, 크면 등분산이다. t-검정의 [[p-값]]이 0.05보다 작으면 두 반의 성적 차이는 통계적으로 유의미하게 차이가 난다는 의미이다. [[https://www.youtube.com/watch?v=xhUzK9U4bdgt|SPSS를 활용하여--(만만한게 spss)--검정을 수행할 수 있다.]] === 대응표본 t검정 === 두 집단 간의 차이를 비교하는 독립 표본 t-test와는 달리, paired t-test는 같은 집단의 전후 차이를 비교한다. 특정 수업을 들은 전후의 성적 차이나, 약물 복용 후 효과 차이와 같은 것이 있을 수 있다. [[p-값]]이 0.05보다 작으면 수업 또는 약물이 효과가 있다는 의미이다. == 엑셀로 t-검정 하기 == [[https://blog.naver.com/stat833/220068721499|엑셀로 t-검정(t-test) 하기 (독립표본 t-검정)]] [[https://blog.naver.com/stat833/220071056929|엑셀로 대응표본 t-검정 (Paired t-test) 하기]] [[https://blog.naver.com/stat833/220067316440|엑셀로 통계 분석하는 방법]] == 기타 == [[z-분포]]와 [[t-분포]]에서 [[귀무 가설]] H,,0,,는 μ=0이나 μ,,1,,=μ,,2,, 등이고, [[대립 가설]] H,,1,,은 μ≠0나 μ,,1,,≠μ,,2,,같은 것이다. μ,,1,,=μ,,2,,처럼 변수가 2개인 경우 μ,,1,,-μ,,2,,=0으로 바꾸고 μ,,1,,-μ,,2,,를 d로 [[치환]]하면 d=0과 같은 [[변수]]가 하나인 식으로 바꿀 수 있다. 또다른 유명 통계 검정인 피셔의 정확검정(Fisher’s exact test)은 로널드 피셔가 [[홍차]]와 관련된 통계 실험을 하는 과정에서 개발된 검정이다.[* 다름 아니라 한 연구원이 홍차에 우유를 먼저 넣은 [[밀크티]]와 우유에 홍차를 넣은 밀크티를 구분할 수 있다고 한 걸 실험해보려 한 것.[[https://en.wikipedia.org/wiki/Lady_tasting_tea|#]]] 스튜던트(윌리엄 고셋)가 t 분포의 개념을 개발한 것이 [[맥주]]의 품질을 개선하기 위해서였는데, 이처럼 통계학의 굵직한 방법론들 중에 마실 것과 관련이 있는 것이 둘이나 있다는 점이 재미있다. == 관련 문서 == * [[확률 분포]] * [[정규 분포]] * [[표준 정규 분포]](z-분포) * [[F-분포]] * [[카이-제곱 분포]](χ2 분포) * [[Microsoft Excel/함수 목록]]: 간단한 [[통계학]] 계산은 [[엑셀]]이나 [[Calc]]로 할 수 있다. [[분류:확률 분포]]