문서의 임의 삭제는 제재 대상으로, 문서를 삭제하려면 삭제 토론을 진행해야 합니다. 문서 보기문서 삭제토론 LHC (문단 편집) === 데이터 분석 === LHC의 데이터를 이용해 어떤 방식으로 분석(Analysis)을 하는 지 대략적으로 소개하고자 한다. 여기서 힉스 입자 발견과 같은 결과들이 나온다. 다만 현대에 들어 입자물리학, 혹은 더 많은 분야들에서 수행하는 대다수의 실험들이 흔히 쓰는 방식이기도 하다. 따라서 이 섹션이 더 적절한 항목에 들어갈 수도 있을 것이다. 먼저 검출기로부터 받은 데이터로부터 어떤 입자들이 검출되었는가를 알아야 한다. 검출기가 내놓는 데이터는 그야말로 어디가 켜졌는지, 어느 구역에 에너지가 얼마나 박혔는지 정도 뿐이다. 잘 이해가 안 간다면 CMS 항목의 두번째 그림을 보자. 입자들의 궤적을 자세히 보면 군데군데 X자 표시가 되어 있거나 (트랙커) 뭔가 터진 것처럼 퍼져 있거나 (칼로리미터) 아니면 칸들이 켜져 있거나 (뮤온 검출기) 할 것이다. 검출기가 실제로 받는 데이터는 입자의 흔적, 즉 이들 X자 혹은 퍼진 에너지 혹은 켜진 구획이 어딘가 하는 정도이다. 실제 궤적은? 그런 거 없다. 그저 입자가 지나갔을 때 남겼을 저런 흔적들 뿐이다. 이것들을 가지고 정말로 입자가 지나갔는지, 지나갔다면 얼마의 운동량과 에너지 그리고 전하를 가지고 간 건지 재구성을 해야 한다. 비유하자면 범죄 현장에 남겨진 흔적들만 가지고 그 곳에서 무슨 일이 있었는지를 추리하는 것과 같은 일이다. 데이터를 받았으면 먼저 하는 일이 바로 이러한 재구성이다. 이게 쉬운 일이 절대 아니다. 입자가 한두 개 생기면 별로 어려운 일이 아닐 것이다. 하지만 [[https://inspirehep.net/files/10ad0d417996af04b8f1da482d5adff4|반응이 일어났을 때 생기는 입자는 보통 엄청나게 많다]].[* 사실 이러한 복잡함의 대부분의 쿼크나 글루온으로부터 온다. 이 녀석들(링크된 그림에서 빨간색, 파란색, 보라색 직선 및 용수철 모양 선들, 특히 용수철 모양은 글루온)은 결코 단독으로 보여질 수 없고 반드시 강입자(링크된 그림에서 녹색 동그라미들)로만 검출이 되어야 하는데, 이 과정으로부터 생겨나는 강입자의 개수가 보통 많다. 더군다나 양성자-양성자 충돌에서 양성자 전부가 반응에 참여하지 않기 때문에 상당 부분이 따로 떨어져 날아가는 것(링크된 그림에서 보라색 타원으로부터 생성된 것들)도 있어서 상황이 한층 더 복잡해진다.][* 더군다나 이 그림 상에서는 안 나타나는데, 사실 양성자 덩어리와 양성자 덩어리를 충돌시키면 양성자 하나만 반응하지 않고 여러 개가 반응할 때가 많다. 그래야 원하는 반응을 더 많이 얻어낼 수 있는데, 대신에 충돌로부터 나오는 입자가 [[혼파망|훨씬 더 많이 나오게 된다]].] 따라서 충돌이 일어났을 때 받는 데이터는 무수히 많은 신호들이 여기저기 흩뿌려진 모양으로 나타나게 될 것이다. 거기다 노이즈도 잔뜩 박혀 있을 것이다. 이걸 가지고 입자들의 경로, 에너지 등을 찾아내야 하는 것이다. 그리고 상당히 다양하고 복잡한 알고리즘들이 적용되어 이 [[혼파망]]에서 제일 가능성이 높은 궤적, 에너지 등을 찾아내어 입자들을 찾아내는 것이다. 검출기 성능이 좋은데다 수많은 물리학자들을 숫돌 삼아 알고리즘들을 하도 갈아댄 덕에 통계적으로 굉장히 믿을 만한 수준으로 입자들을 분별해 낸다. 주로 시뮬레이션으로부터 나온 모사 신호에 알고리즘을 적용한 결과와 옛날 실험들로부터 이미 잘 알려진, 그리고 엄청 많이 만들어낼 수 있는 반응들을 재현한 데이터에 알고리즘을 적용한 결과를 비교하는 식으로 알고리즘들이 잘 작동하는지, 그렇지 않으면 뭐가 문제인지 판단한다. 그렇게 해서 검출된 입자들이 뭔지 알아내는 것이다. 그런데 한 가지 주의할 게 있다. '검출'된 입자들이라고 했는데, 사실 직접 검출이 가능한 입자들은 생각보다 별로 없다는 것이다. 끽해야 [[광자]], [[전자]], [[뮤온]], 파이온±[* 중성 파이온의 수명은 엄청나게 짧다.], [[케이온]]±, 중성 케이온[* 물론 K-Long이다.], [[양성자]][* 굉장히 무거운 중입자가 생성되었을 때 이게 양성자나 중성자로 붕괴할 확률이 꽤 크다. 가속기에서 날아온 양성자와는 다르다.], [[중성자]] 등등 10개 정도 밖에 없다. 실제로 표준 모형에서 나오는 기본 입자들 중에 검출기 등으로 '직접' 볼 수 있는 건 광자, 전자, 뮤온, 중성미자 정도 뿐이다. 쿼크와 글루온은 어차피 단독으로 못 보는데다 charm, bottom, top 쯤 되는 쿼크들이 포함된 강입자는 아무리 멀리 가도 검출기에 박히기 전에 다 터진다.[* 단 bottom이 포함된 강입자는 좀 특이하다. 좀 멀리 가서 터지는 특성이 있다. 그래 봐야 검출기의 가장 최중심부보다 한참 안 쪽이긴 하지만 검출기들이 입자들의 경로를 잘 추적하면 양성자-양성자 충돌 지점보다 좀 벗어난 곳에서 터져 생긴 입자들을 찾기도 한다. 이렇게 터져서 나온 입자들의 뭉치를 b-제트(jet)이라고 부르며, 이름이 따로 붙을 만큼 굉장히 중요한 녀석으로 분석에서 요긴하게 쓰인다.] 더군다나 중성미자는 아예 안 보인다고 쳐도 상관 없을 정도로 반응을 안 한다.[* 이렇게 검출기에 안 잡히는 입자가 생기면 전체 운동량(특히 x, y축) 합이 0이 안 되게 된다. 이 차이를 가리켜 MET(Missing E,,T,,; 여기서 E,,T,,는 Trasnverse Energy로 보통 x, y축 운동량을 말한다. (왜 운동량이 아니라 에너지라고 하는 지는 신경쓰지 말자)라고 부르는데, 이것도 굉장히 중요한 대상 중 하나이다. 실제로 SUSY에서 예견하는 입자들 중에는 안정하지만 중력 외에 아무런 상호작용도 안 하는 입자가 있어서 이 MET의 분포를 통해 SUSY를 테스트하는 방법도 있다.] 물론 힉스 입자도 절대 직접 못 본다. 다만 힉스 입자는 어떤 특별한 반응 방식을 통해 붕괴하는데, 힉스 입자가 붕괴해서 나올 것으로 여겨지는 충돌 이벤트들을 잘 모으면 이걸로부터 힉스 입자가 존재한다는 것을 밝힐 수 있다. 말하자면 스모킹 건을 찾아서 힉스 입자가 존재한다는 걸 밝힌다는 것이다. 힉스 입자 뿐만 아니라 LHC에서의 모든 실험적 결과들이 다 이런 식으로 얻어진 것이다. 바로 아래에 더 자세한 설명을 달아두었다. [[파일:The-4-lepton-invariant-mass-distribution-in-the-CMS-experiment-clearly-showing-the-Higgs.png]] 이제 데이터 하나하나로부터 입자들을 구성해냈으면, 이걸로부터 충돌 시에 무슨 일이 있었는지 볼 차레다. 즉, 본격적으로 이론으로부터 얻어진 결과와 실험 데이터를 비교할 차례다. 당연한 이야기겠지만, 수식 놀음을 하는 거랑은 거리가 있는 일이다. 오히려 이미 만들어진 수식으로부터 얻어진 예측과 데이터를 비교하는 일을 많이 한다. 다만 입자 충돌에서 일어나는 현상들이 복잡하다 못해 지저분하기도 하고[* 주로 jet 같은 QCD 반응을 모사하는 게 매우 더럽다. 그에 못지 않게 pile-up을 모사하는 것도 많이 더럽고.] 검출기의 구조가 매우 복잡하기도 해서 수식을 직접 계산해서 예측을 하는 건 한계가 있다. 대신에 이 수식들을 기반으로 해서 확률적 기반[* 결국 양자역학적 반응들이기 때문에 확률적으로 할 수 밖에 없다]을 통한 양자역학 & 검출기 시뮬레이션을 잔뜩 수행하고 이걸 이용해 예측 그래프를 만드는 것이다. 좀 더 직관적으로 (그리고 대강) 말해서 충분히 많은 수[* 단, 실제 데이터로 얻은 것보다 배로 더 많은 횟수이어야 한다. 언뜻 이상하게 들릴 수 있지만 어차피 '''확률 분포'''를 구하는 것인 이상 실제 개수와 같을 필요는 없으니까 괜찮다. 오히려 확률 분포 그 자체의 '오차'를 줄이기 위해서라도 그 수가 많을 수록 좋은 것이다. 어차피 확률 분포인 이상, 적당히 정규화를 다시 해서 (전문적으로, 휘도(luminosity)와 산란 단면적(cross section)을 곱한 값이 예측되는 이벤트 개수일텐데, 전체 이벤트 개수가 이거랑 같도록 정규화를 하는 것이다) 데이터랑 비교를 할 수 있는 것이다.]의 가상 실험을 시뮬레이션으로 구현을 한 다음, 이걸 데이터랑 비교하는 식이다. 참고로 덧붙이자면, 이 시뮬레이션은 실제 실험을 거의 그대로 재현하는 급이다! 어느 정도냐면 시뮬레이션을 통해 검출기가 얻는 거의 가장 낮은 레벨의 데이터 포맷까지 재현한 다음, 이걸 마치 검출기에서 받은 진짜 데이터처럼 취급을 해서 검출된 입자들을 재구성하는 단계를 가진다. 이런 식으로 철저하게 예측을 수행하는 것이다. 한편, 실제로 위에 올린 힉스 입자 증거 중 하나를 보여주는 그래프를 보면 검은색 선과 점으로 표시된 데이터들이 있고, 그 나머지가 예측들인데, 이게 전부 시뮬레이션을 통해 얻어진 것들이다. 참고로 이러한 확률 기반 시뮬레이션을 보통 몬테카를로(Monte-Carlo; MC) 시뮬레이션이라고 부르고, 현장에서는 아예 이러한 예측 부분을 가리켜 MC라고 부르고 그 시뮬레이션으로부터 얻은 이벤트들을 MC 이벤트라고 부르는 경우가 많다. 이런 MC 이벤트들을 개개인이 만들 수도 있지만, 그건 지극히 제한적인 경우고, 보통 콜라보레이션에서 제공해 주는 MC 이벤트들을 가지고 예측을 얻어낸다. 안 그래도 용량 엄청 잡아 먹고 만드는 데에도 엄청난 연산량과 시간이 소요되는 게 MC 이벤트들인데 수많은 분석가들이 중구난방으로 만들게 하느니 차라리 중앙에서 일괄적으로 만들어 주고 제공하는 게 더 나으니까. 게다가 개인적으로 만든 것보다 그쪽 분야 전문가'''들'''이 모여서 만든 것이 더 믿을 만한 것도 있고.[* 워낙 규모가 큰 실험이다보니 분업화가 잘 되어 있다.][* 그리고 중요한 게, 해당 실험(예컨대 ATLAS, CMS)에서 나오는 결과는 분석한 사람 이름으로 발표되는 게 아니다. 그 실험 이름이 내걸리고 발표되게 된다. 예를 들어 CMS 검출기에서 얻은 데이터로 분석을 해서 논문을 쓰게 되면 그 논문 저자명은 분석가 이름이 아닌 The CMS Collaboration으로 나오게 된다는 것이다. 즉, '''단체의 이름을 걸고''' 결과를 내는 것이다. 그러다 보니 분석을 하든 서비스워크를 하든 뭘 하든 사람들이 대충 넘어 가는 법 없이 나온 결과들을 철저하리만치 따지고 든다. 그러다 보니 공인된 것이 아닌 것을 쓰는 건 불가항력적이고 타당한 이유가 있지 않는 한 (아니, 그런 이유가 있어도 설득하자면) 매우 피곤한 일이 된다. 이런 상황이니 당연히 공인된 것을 다들 쓰게 되는 것이다.] 그리고 설령 정말 타당한 이유가 있어서 개인이 만들겠다고 해도, 말했듯이 충분히 많은 이벤트를 만들기 위해 소요되는 시간과 비용이 워낙 막대하기 때문에 보통 엄두가 날 일이 아니다. 지금도 CERN에 있는 컴퓨터 센터는 물론이고 전 세계에 있는 수많은 클러스터 컴퓨터들이 열심히 MC 시뮬레이션을 돌리고 있는 중이다. MC를 돌려서 데이터랑 같이 히스토그램을 그냥 그리기만 하면 되는 게 아니다. 물리적으로 관심이 있는 부분만 똑 떼내서 보는 걸 하는 것도 중요하다. 아니, 사실 이게 분석가들이 하는 일의 절반 이상이라고 봐도 좋다. 많은 이들이 이 작업을 가리켜 조각을 하는 것과 같다고 말하는데, 왜냐하면 어떤 변수들을 통해 쓸모 없는 부분과 쓸모 있는 부분을 구분하여 쓸모 없는 데이터와 MC를 쳐 내고 나머지만 취하는 걸 끝없이 반복하기 때문이다. 그 변수들은 관심 있는 입자들, 예컨대 뮤온이나 제트(jet) 등의 운동량, 에너지, 혹은 방향, 개수 등이 되며, 심지어 둘 이상의 입자들 간 사이각이라든가 다양한 변수들이 쓰인다. 분석가들은 다양한 변수들에 대한 그래프를 그린 다음, 그 그래프들 중에서 어디에서 신호(signal)와 배경 사건(background events)의 구분이 잘 되는가를 낱낱이 파악해 그 중에 구분을 잘 하는 변수들을 가져다 쓴다. 사실 여기에서 MC 시뮬레이션을 활용한 예측 기법이 빛을 발하는데, MC 이벤트들을 가지고 그래프들을 그리면 따로 계산을 할 필요 없이 신호와 배경 사건을 구분하는 것을 시각적으로 쉽게 할 수 있게 된다. 더군다나 곧 소개하겠지만 머신 러닝 기법을 쓰기에도 안성맞춤이고. 말했듯이, MC 이벤트들은 실제 검출기를 기반으로 해서 실제 실험을 엄청난 구현도로 가상 재현한 것이라 (적어도 배경 사건들의 예측이 담당 파트들에서 정확하다면[* 이걸 따로 밝히는 작업이 필요하다. 소위 validation이라고 불리는 작업인데, 최종 결과를 내놓기 앞서 반드시 수행되어야 하는 작업이다. 심지어 최종 결과를 보여주는 그래프에서도 어느 정도 보여질 필요가 있는데, 예를 들어 위의 힉스 입자 증거 그래프를 보면 126 GeV 근처만 사실 신호 영역인데 반해 그보다 더 넓은 영역의 MC 및 데이터를 그리고 있는 것을 볼 수 있다. 일종의 신뢰도를 높여주는 방식.]) MC에서 신호를 분리해내는 방법을 그대로 똑같이 실제 데이터에다 적용시키면 그게 곧 우리가 원하는 실제 신호가 될 것이니, 이걸 통해서 원하는 신호에 해당하는 실제 데이터들을 추려낼 수 있는 것이다. 위 힉스 입자 그래프로 다시 가 보자. 이 그래프도 사실 수많은 컷(cut)들이 적용되고 나서 살아님은 엄선(?)된 이벤트들만 보여주는 것이다. 못 해도 수십억 번의 유효 충돌이 있었을텐데 필요한 것들만 추리고 추려서 결국 힉스 입자의 증거로 보여지기 위해 마련된 데이터들의 개수는 끽해야 200개도 채 못 된다. 그마저도 위 그래프에 있는 것들을 그냥 다 합친 거지, 정말 신호 영역에 있는 (즉, 빨간 색 선이 도드라진 영역에 있는) 데이터 이벤트의 개수는 고작 (배경일 것 같은 애들 빼고) 고작 20개 정도 뿐이다.[* 물론 전체 데이터에서 실제 힉스 입자가 생겨서 4개 렙톤으로 봉괴된 경우는 훨씬 많을 것이다. 다만 배경 사건이랑 구분하기가 어려워 어쩔 수 없이 대부분 버려진 것이다. 사실 배경 사건을 최대한 많이 줄이되 신호를 최대한 많이 살리는 것이 분석에 있어서 최대 관건 중 하나이다.] 이런 식으로 입자물리학에서 분석이 진행되는 것이다. 다만 익숙한 변수들 만을 가지고 컷을 주는 방식은 그다지 만족스럽지 못할 수도 있다. 예를 들어 두 변수 x, y가 있다고 할 때 이 둘의 분포를 그린 결과로는 신호와 배경 사건이 잘 구분되지 않는 반면, [math(x^2 + y^2)]의 분포를 그리면 구분이 확연히 잘 될 수도 있다. 물리적 통찰을 통해 이런 조합을 찾을 수도 있겠지만, 아무래도 한계가 있을 수 밖에 없다. 심지어 변수가 3개를 넘어가는 순간 시각화도 불가능해져 더 이상의 분석이 어렵다. 이를 극복하기 위해 대두된 것이 바로 머신 러닝(machine learning) 기법이다. 이 기법을 활용하면 적절한 변수들의 조합을 통해[* 더 자세하게 말하자면 변수들이 이루는 다차원 공간에서 신호와 배경 사건이 잘 구분되는 구분법을 찾아낸 다음, 이걸 한 개 혹은 여러 변수들로 정리하는 것이다.] 신호와 배경 사건을 더 잘 구분해내는 방법을 찾을 수 있다. 사실 이 기법이 유행을 타기 훨씬 전부터 입자물리학자들은 이 기법을 잘 활용해 왔다. 물리학자들의 선구자적인 면을 볼 수 있는 대목 중 하나. 물론 딥러닝이 대두되고 나서는 딥러닝도 잘 써먹고 있고. 이제 신호들을 모았다고 해서 연구가 끝나는 것은 아니다. 모든 과학적 결과가 그렇듯, 원하는 값을 계산했으면 이 결과가 통계적으로 얼마나 믿을 만한 것인지도 정리해서 보여야 한다. 신호의 존재 유무, 예컨대 힉스 입자의 존재 유무라든가 아니면 초대칭 입자의 검출 유무를 결론지을 때 이 결과에 대한 신뢰도라든가, 아니면 특정 파라메터를 측정했을 때의 그 오차라든가 하는 것들을 보여야 한다. 이게 충분히 좋아야 좋은 결과가 되는 것이다. 결국 분석의 최대 관건 중 하나로 얼마나 신뢰도를 높일 수 있는가, 혹은 오차를 얼마나 줄일 수 있는가 하는 것이 있다. 신호의 개수를 최대한 많이 확보하되 배경 사건을 최대한 줄이는 것이 사실 이를 극대화하기 위한 것이다. 다시 위의 힉스 입자 그래프를 보면, 검은 점들이 데이터 포인트들이고 검은 선들이 데이터의 (통계) 오차인데, 이 오차가 너무 크다 못해 그 범위가 배경 사건까지 훌쩍 파고들면 정말 힉스 입자에 해당하는 이벤트가 생긴 건지 아닌지를 말하기가 더 어렵게 된다. 그런 이유로 어떻게 해서든 (물론 합리적이고 오류 없는 방식으로) 저 오차들을 줄이는 게 관건인 셈이다. 그 외에도 계통 오차(systematic uncertainty)를 줄이기 위해 갖은 노력을 해야 한다. MC 이벤트를 최대한 늘려야 하는 것도 사실 계통 오차를 줄이기 위한 한 방편이다. 그리고 검출기의 성능 역시 계통 오차에 직접적인 영향을 준다. 더군다나 MC 시뮬레이션 자체에도 부여된 파라메터들의 오차라든가 아니면 계산하는 방식, 아니면 아예 생성 프로그램[* 예를 들어 (간단하게 말해서) 제트를 만드는 파트를 담당하는 프로그램이 여럿 있는데 (Pythia, Herwig, Sherpa 등), 이걸 교체했을 때 어떤 차이가 나는가를 보는 것이다.] 자체를 바꿨을 때 나타나는 차이 같은 걸 통해 계통 오차가 나타나기도 한다. 그래서 데이터를 최대한 잘 받아내고 또 MC가 다양한 영역에서 얼마나 잘 맞춰지는가를 치밀하게 연구해야 한다. 다행히 이런 건 또 전문으로 하는 사람들이 있어서 이들이 내놓는 매뉴얼 대로 하는 식으로 상당 부분을 소화할 수 있으며, 심지어 자기와 비슷한 영역에서 분석을 수행한 사람들이 괜찮은 결과를 내놓으면 그걸 활용할 수도 있으니, 그렇게 고생스러운 건 아니다. 어쨌든 이러한 오차들을 최대한 줄이는 게 결국 입자물리 분석의 최대 관건 중 하나라고 말할 수 있겠다. 이걸 위해 통계학을 잘 알아야 하는 것은 물론 다양한 통계적 기법들도 활용할 줄 알아야 한다. 여기까지 읽었으면 느꼈겠지만 어쩐지 물리보다 컴퓨터 다루는 능력이 더 중요해 보일 수도 있는데, 사실 맞다. 지금도 입자실험물리 하는 사람들은 종종 자신이 물리학자인지 프로그래머인지 헷갈려 한다. 그런 이유로 입자물리를 하고 싶다면 물리 뿐만 아니라 프로그래밍, 특히 [[C++]]과 [[파이썬]]을 많이 공부해야 한다.[* 물론 C++로 연산량이 많이 필요한 코어 부분을 짜는 동시에 파이썬으로 이 코어 부분들을 조합함과 동시에 인터페이스를 구성하도록 하는 전형적인 방식으로 일을 하게 될 것이다. 그래도 툴들이 많이 발전했고 지금도 계속 발전하고 있어서 파이썬만 알아도 많은 부분들이 커버된다. 하지만 여전히 많은 부분들을 C/C++로 짜야 하는 걸 생각하면 (특히 아래의 서비스워크를 하려면 필수다) 어느 쪽도 소홀할 수는 없다. 그래도 언어 하나를 제대로 파고 나서 다른 언어를 배우는 건 그다지 어려운 일이 아니니 너무 걱정하지는 말자.] 아니, 하다 못해 물리는 물리학과에서 코스웤으로 체계적으로 배우기라도 하지, 프로그래밍은 몇몇 학교를 제외하면 잘 안 가르치기 때문에[* 사실 요즘 이공계열이면 이제 프로그래밍이 필수처럼 되어 가고 있긴 하지만.] 입자물리를 바라보고 진학할 생각이면 물리보다 프로그래밍을 먼저 배우는 편이 더 나을 것이다. 일하면서 프로그래밍을 배울 수 있겠지만 프로그래밍은 결국 들인 시간과 노력이 그대로 반영되므로 미리미리 배워두는 것이 훨씬 좋다.[* 예를 들어 남이 짠 코드를 읽고 해석하는 능력이라든가 코드 재사용을 염두에 둔 코딩 기법 및 디자인 등을 잘 숙지하고 있지 못한다면 여러분의 작업은 한없이 늘어질 것이고 한없이 진창으로 빠져들 것이다. 그리고 이런 건 결국 공부와 경험의 양으로 결정된다.] 프로그래밍 언어만 이야기했는데, 사실 언어 뿐만 아니라 다소 고급스러워 보이는 컴퓨터 능력 역시 필요하다. 일단 주로 작업하는 공간은 [[Linux|리눅스]], 특히 [[Scientific Linux]] 내지는 [[CentOS]]이다.[* 문서를 보면 알겠지만 둘다 [[레드햇 리눅스]] 기반이라 하나에 익숙해지면 나머지 하나에 익숙해지는 건 일도 아니다. 그런데 이건 시스템 관리자 입장이고 시스템에 손댈 일 없는 그냥 물리학자들에겐 레드햇 기반이나 [[데비안]] 기반이나 거기서 거기일 것이다.] 그러다 보니 대부분의 작업을 [[CLI]] 혹은 [[TUI]] 환경에서 (원격으로) 하게 된다. 물론 코딩 작업은 vim/Emacs로 한다. 끽해야 ROOT[* 입자물리에 특화된 통계분석 툴로, 히스토그램을 보는 것은 물론 자료를 분석하는 등의 어지간한 작업은 거의 다 ROOT 기반으로 진행한다.]의 TBrowser나 TTreeViewer 같은 걸로 잠깐 히스토그램을 볼 때 쓰는 것 정도 빼면 정말로 해커들이나 쓸 법한 환경에서 일할 것이다. 보통 윈도우즈에서 GUI 환경으로 프로그래밍을 배우게 될텐데, 이러한 환경은 상당히 낯설 수도 있다. 막대한 수의 데이터를 다루는만큼 수많은 파일들을 다루게 될 것이고 끝없는 날 것의 데이터들과 수많은 반복명령들에 시달릴텐데, 낯선 환경에서의 이러한 작업은 사람 미치게 만들기 딱 좋지만 리눅스 환경에 익숙한 사람에게 이런 작업은 그리 어렵지 않을 것이다.[* 그냥 ls, cd 정도만 할 줄 아는 걸로는 턱없이 부족하다. 예를 들어 sed, awk 같은 명령어 등을 자유자재로 다룰 수 있어야 한다. 쉘 스크립트에도 능숙하면 좋다. 다만 파이썬으로 어느 정도 대체 가능한 영역이긴 하다.][* 거꾸로 말하자면 리눅스 환경이 아무래도 거대 실험의 막대한 데이터를 다루는 데 있어서 더할 나위 없는 환경임을 짐작할 수 있을 것이다. 실제로 다른 입자물리 실험이라든가 천체물리, 혹은 막대한 계산이 요구되는 계산물리 분야에서 리눅스 환경은 사실 상 필수이다.]저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.이 동의는 철회할 수 없습니다.캡챠저장미리보기