통계학 (문단 편집)

=== 추론 통계학 ===
 * [[추론 통계학]](inferential statistics 또는 inductive statistics) 또는 [[추측 통계학]] 또는 [[통계적 추론]](statistical inference): 자료에 내포되어 있는 정보를 분석해서 불확실한 사실에 대해서 추론하여 [[검정]], [[추정]], [[예측]] 등을 하는 것이다.
 * [[모수]](parameter): [[모 평균]], [[모 분산]], [[모 표준 편차]] 등 [[모집단]](population)의 데이터이다.
 * [[통계량]](statistic): [[표본 평균]], [[표본 분산]], [[표본 표준 편차]] 등 [[표본]](sample)에서 나온 데이터이다.
 * [[점 추정]](point estimation): 표본의 [[통계량]]으로 [[모수]]를 추정하는 것이다.
 * [[구간 추정]](interval estimation): 점 추정만으로는 [[모수]]가 얼마나 정확하게 추정되었는지 모르므로 모 평균이 존재할 구간을 확률적으로 추정하는 것이다.
 * [[유의 수준]](significance level): [[제1종 오류]]를 범할 확률의 최대 허용 한계이다. 보통 [[α]]로 표시한다. 95%의 신뢰도를 기준으로 하면 1-0.95인 0.05가 유의 수준 값이다. [[제2종 오류]]를 범할 확률의 최대 허용 한계는 [[β]]라고 한다.
 * [[신뢰 구간]](confidence interval, CI): 실제로 [[모수]]가 존재할 것으로 예측되는 구간이다. 보통 [[신뢰도]] 95%의 신뢰 구간을 쓰지만 99%도 많이 쓰고, 가끔 90%도 쓴다. (a, b)라고 써놓으면 a는 구간의 시작, b는 구간의 끝을 의미한다. 100(1-α)%의 신뢰 구간이라고 부른다. 반복적으로 [[모 평균]] μ에 대한 [[구간 추정]]을 시행하면 이들 중 95%에 해당하는 신뢰 구간이 참값 μ를 포함한다는 의미이다.
 * [[신뢰 수준]](confidence interval level) 또는 [[신뢰도]](reliability): 신뢰 수준이 95% 라면 H,,0,, 가설이 참인데 기각할 확률이 5% 이다. 1-α나 100(1-α)%로 적는다. '신뢰도 95%의 신뢰 구간'과 같은 식으로 쓴다.
 * [[p-값]](p-value, probability value) 또는 [[유의 확률]](significance probability, asymptotic significance): [[귀무 가설]] H,,0,,를 기각할 수 있는 최소한의 [[유의 수준]]([[α]])이다. [[제1종 오류]]가 발생할 확률이다. 즉, H,,1,,을 선택했을 때 틀릴 확률이다.
 * [[임계 값]](critical value, threshold value): 검정 통계량의 분포에서 [[유의 수준]] α에 해당하는 선 위의 값이다.
 * [[확률]](probability): 모집단으로부터 특정 표본이 관측될 가능성이다.
 * [[우도]](likelihood)
 * [[독립 변수]](independent variable) 또는 [[설명 변수]](explanatory variable): 다른 변수에 영향을 주는 변수이다.
 * [[종속 변수]](dependent variable) 또는 [[반응 변수]](responsible variable): 다른 변수에 의해 영향을 받는 [[변수]]이다.
 * [[교란변수]] 또는 [[혼란변수]](confounder): [[인과관계]]와 [[상관관계]]를 혼동시킬 수 잇는 변수이다. 교회가 많으면 범죄율도 높지만 그건 교회 숫자가 원인이고 범죄율이 결과가 아니라 인구가 많으면 교회도 많고, 범죄율도 높다는 의미이다.
 * [[교호작용]](interaction): 독립변수 사이에 상호 작용을 하여 서로의 작용에 영향을 주는 것을 말한다.
 * [[연속 확률 분포]](continuous probability distribution): [[z-분포]], [[t-분포]], [[카이-제곱 분포]], [[F-분포]] 등.
 * [[표준 정규 분포]]([[z-분포]], standard normal distribution): [[σ]]^^2^^을 아는 경우 [[μ]]를 구할 때 사용한다.
 * [[스튜던츠 t-분포]](t-분포, Student's t-distribution): [[σ]]^^2^^을 모를 때 표본 분산 s^^2^^으로 대체하여 [[μ]]를 구할 때 사용한다. 즉, 모 평균 검정에 사용한다. [[z-분포]]와 [[t-분포]]에서 [[귀무 가설]] H,,0,,는 μ=0이나 μ,,1,,=μ,,2,, 등이고, [[대립 가설]] H,,1,,은 μ≠0나 μ,,1,,≠μ,,2,,같은 것이다. μ,,1,,=μ,,2,,처럼 변수가 2개인 경우 μ,,1,,-μ,,2,,=0으로 바꾸고 μ,,1,,-μ,,2,,를 d로 [[치환]]하면 d=0과 같은 [[변수]]가 하나인 식으로 바꿀 수 있다.
 * [[카이-제곱 분포]](χ^^2^^ 분포, chi-squared distribution): [[σ]]^^2^^을 구할 때 사용한다. 모 분산 검정, 적합도 검정, 독립성/동질성 검정 등에 사용한다. [[귀무 가설]] H,,0,,는 σ^^2^^=1같은 것이고, [[대립 가설]] H,,1,,은 σ^^2^^≠1같은 것이다. 또는 H,,0,,는 μ,,1,,=μ,,2,,이고, H,,1,,은 μ,,1,,≠μ,,2,,와 같은 것으로 H,,0,,는 "μ,,1,,과 μ,,2,,의 약효가 비슷하다", H,,1,,은 "μ,,1,,과 μ,,2,,의 약효에 차이가 있다"와 같은 것이다.
 * [[F-분포]](F-distribution): [[σ]],,1,,^^2^^ / [[σ]],,2,,^^2^^ 을 구할 때 사용한다. [[카이-제곱 분포]]를 따르는 두 [[확률 변수]]들의 비를 구한다. 분산 비 검정, [[분산 분석]], [[회귀 분석]] 등에 사용한다.
 * [[분산 분석]]: 분산 분석의 [[귀무 가설]] H,,0,,는 "μ,,1,,=μ,,2,,=μ,,3,,"같은 것이고, [[대립 가설]] H,,1,,은 "H,,0,,가 아니다"와 같은 것이다. 구체적인 예를 들자면, H,,0,,는 "약품 세 가지가 효과 차이가 없다"와 같은 것이고, H,,1,,은 "효과 차이가 있다"와 같은 것이다.
 * [[회귀 분석]]: 회귀 분석의 [[귀무 가설]] H,,0,,는 "기울기 [[β]],,1,,=0이다"같은 것이고, [[대립 가설]] H,,1,,은 "기울기 β,,1,,≠0이다"와 같은 것이다. 구체적인 예를 들자면, H,,0,,는 "약이 효과가 있다"이고, H,,1,,은 "약이 효과가 없다"이다. [[회귀 분석]]에서 [[절편]]은 β,,0,,라고 하고, [[기울기]]는 β,,1,,이라고 한다.

저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,
기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.
이 동의는 철회할 수 없습니다.

통계학 (문단 편집)

캡챠