문서의 임의 삭제는 제재 대상으로, 문서를 삭제하려면 삭제 토론을 진행해야 합니다. 문서 보기문서 삭제토론 시사IN (문단 편집) ==== 후속기사 등장 ==== [[http://www.sisain.co.kr/?mod=news&act=articleView&idxno=26989| 나무위키 데이터 이렇게 분석했다]] 후속기사가 나왔다. 결론부터 말하면 분석방법에 문제가 없다는 주장이다. 하지만 앞의 기사와 주장내용이 다른 것은 차처하고, 자체 문답에서도 말을 얼버무리고 있다. > Q1. <시사IN>이 공개한, 분석 대상이 된 수정 글자수는 299만7430글자다. 대규모 삭제(‘반달리즘’)로 발생한 삭제 글자수를 대거 포함하고 있다. 반달리즘과 같은 정크 데이터를 포함했으니 오류 아닌가? > > A. '''분석 대상이 된 수정 글자수는 299만7430글자다'''. 반달리즘을 정크 데이터로 분류해 제거하는 과정은 분석 과정의 일부이다. 분석팀은 이 데이터를 분석하는 과정에서 문서 전체에 대한 광역 삭제 및 복원과 같은 다양한 문서 반달리즘을 확인했다. 이번 분석 기사의 핵심은 반달리즘을 포함한 수정 행위를 통해 나무위키 이용자들이 민감하게 느끼는 쟁점이 무엇인지를 발견하고 드러내는 일이다. 그러므로 수정 전쟁의 결과물을 폐기하는 것이 오히려 타당하지 않다. > 그러나 문서를 통으로 삭제하는 악의적 반달리즘은 의미 있는 수정이라고 보기 어렵기 때문에 필터링할 필요가 있다. 분석팀은 반달리즘을 “A문서와 B문서 간의 수정값 합이 0인 문서”로 정의했다. 예를 들어 나무위키 ‘메갈리아’ 항목의 990버전과 991버전은 4만2163자의 문서가 통째로 삭제되고 그 즉시 복원한 경우로, 이 경우 두 문서 수정값의 합은 0이다. 이럴 경우 반달리즘으로 판단한 것이다. 이런 기준에 따라 삭제된 문서는 245건, 수정 글자수로 따지면 249만2203자가 분석에서 제외되었다. 그 결과 '''의미가 있는 것으로 확인된 데이터는 총 2423건의 원문 가운데 2178건의 문서를 대상으로 50만5227글자이다'''. > > - 나무위키 데이터 이렇게 분석했다 1번 질문부터 이 모양이다. 결론부터 말하면, 태백산맥 운운했던 내용은 당연히 뻥튀기였고, 의미없는 데이터라는 것인데, 글 쓴 사람이 원 저자가 아니라, '김학준 (아르스 프락시아 미디어분석팀장)'이라서 앞선 기사의 문제에 대해서는 구렁이 담넘어가는 것처럼 넘어간다. 이전 기사가 잘못되었다는 것도, 이전 기사에서 데이터가 오해가 있었다는 것도, 지적이 맞았다는 말도 없다. 이 문답이 전부 다 이런 식이다. 분석한 사람이 자기 책임은 없다고 주장하는 내용으로 가득차 있다.저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.이 동의는 철회할 수 없습니다.캡챠저장미리보기