문서의 임의 삭제는 제재 대상으로, 문서를 삭제하려면 삭제 토론을 진행해야 합니다. 문서 보기문서 삭제토론 상자 수염 그림 (문서 편집) [include(틀:통계 자료의 시각화)] [include(틀:주식투자 관련 정보)] [목차] ||<#FFFFFF> [[파일:can1.jpg|width=100%]] || || '''상자 수염 그림''' || == 개요 == 상자 수염 그림(box-and-whisker plot, box-and-whisker diagram) 또는 [[상자 그림]](box plot, boxplot) 또는 [[상자-수염 그림]], [[상자 도표]]는 [[다섯 숫자 요약]]으로 그린, 자료의 특성을 요약하는 그래프이다. [[주식]] 관련해서는 봉차트, [[캔들차트]](candle chart) 등으로 부르기도 한다. == 상세 == Q1에서 Q3 사이인 [[사분위간 범위]](IQR)로 몸통을 구성하고 근접값들로 꼬리를 구성한다. 단위척도(step)는 1.5 x IQR이다. * 안 울타리(inner fence)는 Q1에서 왼쪽으로 1 step만큼 간 것과 Q3에서 오른쪽으로 1 step만큼 간 것이다. * 바깥 울타리(outer fence)는 Q1에서 왼쪽으로 2 step만큼 간 것과 Q3에서 오른쪽으로 2 step만큼 간 것이다. * 근접 값(adjacent value)은 안 울타리 안쪽의 값 중에서 안 울타리에 가장 가까운 값이다. * 보통 이상점(mild outlier)은 같은 방향에 있는 안 울타리와 바깥 울타리 사이에 있는 값이다. * 극단 이상점(extreme outlier)은 바깥 울타리 바깥의 값이다. 허리에 굵은 선이 그려진 박스가 있고 위 아래로 두 개의 세로선이 그어져 있으며, 종종 별표나 X표 같은 것도 둥실둥실 떠 있는 것이 특징. 전체 관찰값들의 범위(range)에 기초한 시각화 방식인데, 그것이 포함하는 통계적 정보가 꽤 많아서 연구자들이 적극 활용하고 있다. 박스의 이쪽 끝에서 저쪽 끝은 주어진 분포의 사분위수 간 범위(IQR; inter-quartile range)를 의미한다. 그리고 2Q, 즉 두 번째 사분위수이자 전체 분포의 중앙값(median)에는 굵은 가로선이 대응한다. 위쪽 수염의 끝부분은 최댓값(max), 아래쪽 수염의 끝부분은 최솟값(min)을 의미하며, 위아래로 나타나는 점 표시는 이상점([[아웃라이어]])이다. 상자도표는 [[정규분포]]와 함께 설명하는 것이 가장 정확한데, 전체 분포 범위의 가운데 50%가 상자의 범위와 정확히 일치한다. 박스의 양쪽 끝부분은 ±0.6745σ, 수염의 양쪽 끝부분은 ±2.6980σ 이다. 위쪽 수염과 아래쪽 수염은 각각 24.65%씩의 범위가 할당되어 있다. 상자도표는 여러 모로 굉장한 장점들을 갖고 있다. 우선 이상점을 처리하는 데 뛰어나고, 데이터 전체의 편포 여부를 확인하는 것이 쉽다. 또한 데이터의 집단 간 비교, 데이터의 타당도(validity)를 체크하는 것도 용이하다. == 국내 교과 과정 == [[2022 개정 교육과정]]부터 '''중학교 3학년''' 수학 교과에 최초로 들어올 예정이다. 다만, 이미 세계적으로는 중학교 시기에 다루는 나라가 많았으므로, 이는 대한민국이 뒤늦게 편승했을 뿐이다. 여담으로, 수학교육과 측에서는 새로 들어오는 내용에 대해 반대가 굉장히 심한 편인데, 이 '상자 그림' 내용 최초 도입엔 무려 60%가 넘는 동의표를 받았다. (에듀넷-티클리어 2022년 4월 중순에 열린 토론회 참조) [include(틀:문서 가져옴, title=통계적 방법, version=131)] [[분류:통계학]]저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.이 동의는 철회할 수 없습니다.캡챠저장미리보기