문서의 임의 삭제는 제재 대상으로, 문서를 삭제하려면 삭제 토론을 진행해야 합니다. 문서 보기문서 삭제토론 유니코드 (문단 편집) == 유니코드 정규화 == [[http://www.unicode.org/reports/tr15/|Unicode Normalize 공식 페이지]] 같은 모양의 글자를 서로 다른 코드로 표현이 가능할 때, 유일한 코드로 '정규화'하여 이용하는 것. 대표적으로, * 한글: '[[뷁]]'을 '뷁'(NFC[* NF는 Normalization form(정규화 형식)의 약자이며 C는 Composition의 약자이다.] 방식) 또는 '뷁'(NFD[* D는 Decomposition의 약자이다.] 방식[* 한글 [[첫가끝]] 코드이다.]) 중 하나로 바꿔 사용. 이것이 꼬이면 자소 [[문자 깨짐]]이 발생한다. 특히 [[macOS]]와 [[Windows]] 사이에서 파일 교환 시, 가령 USB 폴더를 열었더니 한글 자모가 분리되어 있더라는 사례는 널리 알려져 있다. * 현대 한글 NFC ↔ NFD 변환 테이블은 [[현대 한글 NFC ↔ NFD 변환 테이블]] 문서 참고. * 문제해결을 위한 [[https://ko.rakko.tools/tools/89/|NFC ↔ NFD 변환 웹사이트]] 등이 존재하며, 자세한 내용은 [[문자 깨짐]] 해결방안 항목 참고. * [[diacritic]] 역시 미리 합쳐진 문자(precomposed character)와 [[결합 문자|결합된 문자]](combined character)를 정규화하는 알고리즘이 있다. * CJK 호환용 한자를 CJK 통합 한자로 바꿔 사용. 대표적 사례로 樂이나, 樂 또는, 樂을 樂으로 바꿔 사용. 정규화 되지 않고 섞여서 쓰게 되면 정렬 순서가 꼬이고, 검색이 안 되는 상황이 발생한다.저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.이 동의는 철회할 수 없습니다.캡챠저장미리보기