문서의 임의 삭제는 제재 대상으로, 문서를 삭제하려면 삭제 토론을 진행해야 합니다. 문서 보기문서 삭제토론 CSV (문단 편집) === 다른 포맷과의 비교 === 보다시피 데이터 오염에 대단히 취약한 포맷이다 보니 본격적인 데이터 교환 포맷으로는 [[XML]]과 [[JSON]]을 쓴다. 둘 중 [[XML]]이 상대적으로 데이터 오염에 더 잘 견딘다. 하지만 CSV는 현재도 IT 및 산업계에서 널리 사용중인데 가장 결정적인 이유는 '''데이터의 크기가 작기 때문'''이다. [[JSON]]만 돼도 CSV대비 2배에서 3배 이상 데이터의 크기가 커지기 일쑤인데다 CSV 파서(parser)는 대단히 간단해서 인용 및 이스케이프 처리를 하지 않는 CSV 파서는 대부분의 프로그래밍 언어에서 코드 한 줄로 가능하다. 게다가 파일 일부에 문제가 생겨도 CSV의 오류는 보통 레코드 단위로 재동기화가 가능하다. JSON은 따옴표나 중괄호 같은 게 하나라도 누락되면 전체 JSON파일의 로드에 실패하는 치명적인 문제가 있다. XML의 경우에는 보통 문제가 생긴 엘리먼트의 부모 엘리먼트에까지만 오류가 전파되므로 CSV보다 더 강한 내결함성이 있지만 JSON보다도 더 데이터의 크기가 커져버린다. 만약 로드하려는 데이터가 기가바이트 단위를 바라본다면 몇 퍼센트의 데이터 오버헤드도 무시할 수 없는 문제가 되는데 이런 분야에서 CSV가 활약하는 것이다. 덤으로 CSV는 압축도 잘 되고 스트림 압축이 가능해서 데이터의 일부만 수신된 상태에서도 데이터 적재 작업을 시작할 수 있다.[* XML도 SAX 파서 사용시 스트림 전송이 가능하다] 한가지 팁으로 대용량의 CSV 파일은 [[리눅스]]에서는 split 유틸리티를 사용해서 원하는 크기로 분할가능하고, cat 명령어 또는 copy /b 명령어로 다시 합칠 수 있다. 실무에서는 용량이 큰 CSV처리는 DB에서 보다 안정적으로 처리할 수 있기 때문에 DB로 변환하기도 하며, [[SQL]] [[DBMS]]에서도 명령어 한줄로 CSV to Table 을 지원한다.저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.이 동의는 철회할 수 없습니다.캡챠저장미리보기