p-해킹 (문단 편집)

== 개요 ==
{{{+1 '''p-hacking''' / data seeking / statistical significance seeking}}}

[[논문]]을 작성함에 있어서 널리 사용되는 [[통계적 방법]] 중 하나인 유의확률 [[p-값]](p-value)에 관련된 관행.

[[통계학]]에서는 틀렸다고 기각할 [[영 가설]](null hypothesis)과 맞았다고 검증하고 싶은 [[대립 가설]](alternative hypothesis)의 쌍을 만들어놓고 영 가설이 틀렸음을 검증해보인다.

영가설이 맞다고 가정할 경우 관측된 데이터 이상으로 극단적인 데이터가 관측될 확률이 p값이다. p값은 0~1 사이의 값이며 그 값이 작을수록 영가설과 데이터가 불일치한다고 생각하면 된다. 즉, p값이 작을수록 데이터가 영가설을 반박한다는 것으로 해석할 수 있다. [[http://scienceon.hani.co.kr/402347|사이언스온: 통계적으로 유의미한 결과는 얼마나 유의미할까 2016. 05. 20.]]

주어진 신뢰 수준에서 [[영 가설]]을 기각하고 대립가설을 채택하기 위해 연구자들은 손쉽게 p-값을 사용한다. 물론 주지하듯이 95% 신뢰수준일 때 p-값은 0.05 이하여야 하고, 99% 신뢰수준일 때는 0.01 이하여야만 한다. 만일 그 이상의 p-값이 나온다면 신뢰수준을 바꾸든지 아니면 영 가설을 기각해서는 안 된다는 결론을 도출해야 한다.[* 영가설을 "채택한다" 는 표현은 쓸 수 없다. 확실히 아니라고는 못하는 것 뿐이기 때문.] 연구자가 확신할 수 있을 만큼 강고한 p-값이 나타나면 [[애스터리스크]] 기호 *나 ∗를 붙여 표시하기도 한다.

여기서 우리의 [[데이터]]는 종종 우리의 기대를 저버리기도 한다. 아예 확실하게 p-값이 엉망으로 나오면 아예 단념하고 말면 끝인데, 이게 아슬아슬하게 살짝 걸릴 것 같은 수치로 나온다는 점이다. 그러면 연구자들은 저도 모르게 '''p-값을 슬쩍 조작하려는 동기를 갖게 된다.''' 무슨 말인고 하니, 표본 측정값 중에서 일부 [[아웃라이어]]들을 살리거나 버리는 등의 방식을 통해서 그 통계적 정보가 더 선명하게 드러나게 만드는 것이다. 그렇게 해서 p-값이 간신히 0.05 값에 턱걸이를 하면 비로소 안심하고 출판한다. 이것이 바로 p-해킹의 전말.

예컨대 90건의 관측값을 갖고 있다면, 그 중에서 대략 15건 정도를 버리고( = 파일 서랍장에 숨겨놓고) 나머지 75건만 가지고 '''마치 처음부터 75건의 관측만을 한 것마냥 발표하면 되기 때문이다.''' 이런 표본이 실제로 표본 표집에 따라서는 우연히 만들어질 수 있다는 사실 때문에 더욱 골치아픈 문제인 것이 바로 p-해킹이다. 이러한 성격 때문에 p-해킹은 종종 '''파일 서랍장 문제'''(file drawer problem)라고도 불린다. 최초로 이 표현이 제안된 것은 1979년의 일(Rosenthal, 1979.)이나, p-값에 대한 불신이 연구자들 사이에 싹트면서 [[성지순례|갑자기 인기몰이 중.]]

저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,
기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.
이 동의는 철회할 수 없습니다.

p-해킹 (문단 편집)

캡챠