디지털 암흑시대

덤프버전 :

분류

1. 개요
2. 역사
3. 원인
3.1. 단종된 하드웨어
3.2. 오래된 파일 형식
3.3. 구식화되어 사라진 웹사이트
3.4. 컴퓨터의 갑작스러운 고장
3.5. 저장매체의 불안정성
3.6. 지식재산권 문제
4. 사례
4.1. 디지털 밖의 비슷한 사례
5. 해결책
5.1. 국제표준을 정하여 통일한다
5.2. 장기보존이 가능한 매체를 사용한다
5.4. 에뮬레이터 등 호환 하드웨어/소프트웨어를 사용한다
6. 관련 글·문서


1. 개요[편집]


디지털 암흑시대(Digital Dark Age)란 소프트웨어 및 하드웨어 기술의 급격한 발전으로 인해 도태된 방식의 디지털 데이터에 접근할 수 없게 되면서, 역설적이게도 디지털 시대의 역사적 정보가 부족해지고 지식이 매몰, 소멸하는 현상을 가리키는 용어이다.


2. 역사[편집]


이 용어는 정보가 디지털 형식으로 전송되고 원본 복사본이 손실되기 때문에 디지털 시대에 기록이 부족할 수 있다는 의미에서, 암흑시대(Dark Age)라는 용어에서 유래되었다. 이 용어는 1997년 국제도서관협회 및 기관연맹(IFLA) 회의에서 처음으로 언급되었으며, 1998년 롱 나우 재단(Long Now Foundation)과 게티 보존 연구소(Getty Conservation Institute)가 공동 후원한 Time and Bits 컨퍼런스에서도 언급되었다.

우리는 DVD에 수록된 영화가 얼마나 오래갈지 아직 모른다. 다만 너무 많이 재생하면 가끔 먹통이 된다는 사실만 안다. 플로피 디스크도 얼마나 오래가는지 확인할 시간이 충분치 않았다. 왜냐하면 금방 CD와 반복해서 쓸 수 있는 CD-RW로 대체되었고, 이것들은 다시 현재 어디서나 사용되고 있는 USB에 자리를 내주었기 때문이다. 다양한 데이터 저장 매체들이 사라지면서 그것을 읽을 수 있는 컴퓨터도 사라졌고(여전히 플로피 디스크를 사용하는 구형 컴퓨터를 가진 사람은 아마 없을 것이다), 모든 자료를 그때그때 출시되는 최신 저장 매체로 제때 옮겨 놓지 않은 사람은(아마 2~3년마다 한 번씩 그래야 할 것이다) 구형 매체에 저장된 자료를 잃고 말 것이다. 사라진 데이터 저장매체를 사용할 수 있는 구형 컴퓨터를 아직 창고에 보관하고 있다면 몰라도.

따라서 모든 기계적, 전기적, 전자적 데이터 저장매체에 대해 우리는 이렇게 단언할 수 있다. 그 매체들은 새로운 것에 밀려 시장에서 재빨리 사라지고, 그래서 우리는 그것들의 수명을 확인할 시간이 없다. 아니, 어쩌면 영원히 그것을 확인할 기회가 없을지 모른다.

움베르토 에코, '저장매체의 불안정성에 관하여'


소설가 움베르토 에코는 이에 관한 다큐멘터리 촬영의 일환으로 2012년 7월 2일, 루브르박물관의 장서각 2층에서 난간 아래로 저서 '장미의 이름'과 함께 아마존의 전자책 기기 킨들을 떨어트리는 퍼포먼스를 선보였다. # 그의 종이책은 조금 구겨지기는 했지만 멀쩡했고, 반대로 전자 기기는 작동할 수 없을 정도로 부서졌다. 에코는 이에 대해 '종이책의 소멸을 말하는 시대지만, 전자책 역시 내부에 100권이 들어 있든 1000권이 들어 있든 이렇게 취약하다'고 해설했다.


3. 원인[편집]



3.1. 단종된 하드웨어[편집]


이 문제는 데이터의 형태로 저장되는 모든 정보에 해당된다. 따라서 순수 텍스트뿐만 아니라, 전자 문서, 사진, 비디오, 오디오 등도 같은 위험을 지닌다. 데이터를 읽는 데에 특별한 하드웨어가 필요한 물리적 미디어에 저장되며 문서가 작성된 시점으로부터 수십 년 이내에 이 하드웨어를 사용할 수 없다는 뜻이다. 대표적인 예시로, 5.25인치 플로피 디스크를 읽을 수 있는 컴퓨터를 구할 수 없는 경우가 있다. 설령 해당 물건을 다시 만들 수 있다 해도 시간과 비용이 엄청 많이 소모된다.

3.5인치 플로피 디스크, CompactFlash처럼 오래도록 사용된 규격이면 그나마 낫겠지만, 망한 규격이면 이 문제가 더 심각한데, 몇 년 전에 출시된 물건인데도 호환되는 기기가 전무한 상황도 있다.


3.2. 오래된 파일 형식[편집]


구식화된 파일 형식도 이 문제를 야기하는데, 저장된 문서에 접근할 때 필요한 소프트웨어가 없기 때문이다. 이것은 특히 사유 파일 형식을 사용할 때 문제가 되는데, 이 경우에는 파일을 읽을 수 있는 적절한 소프트웨어를 찾을 수 없기 때문이다.[1] DRM에도 이런 문제가 있다.


3.3. 구식화되어 사라진 웹사이트[편집]


어떤 웹사이트를 통해야만 프로그램 내용을 읽을 수 있기도 한데, 그 웹사이트가 사라져서 불가하게 되기도 한다. 그래서 어도비에서는 포토샵 CS2 정품 소유자에게 포토샵 CS2를 무료로 배포했다.


3.4. 컴퓨터의 갑작스러운 고장[편집]


일반 데스크톱 컴퓨터야 SSD 등 저장 장치나 파워 서플라이가 고장난 게 아닌 이상은 메인보드 등 다른 부품이 고장나도 SSD 등을 다른 컴퓨터에 옮겨서 저장된 자료를 찾을 수 있지만, 이를테면 스마트폰을 쓰면서 사진 앱 자료 등을 내장 메모리에 저장했는데 메인보드 등 다른 부품이 고장나도 그 자료를 찾기 어려워진다.


3.5. 저장매체의 불안정성[편집]


게다가 전자 저장 매체의 자력이 훼손되는 데는 합선이나 정원에 내리친 번개, 또는 그보다 훨씬 더 일상적인 불운만으로 충분하다. 만일 블랙아웃이라도 좀 길게 지속되면 나는 어떤 하드 디스크도 사용할 수 없을 것이다. 내 전자 기억 장치에 아무리 돈키호테 작품 전체가 들어 있더라도 그걸 촛불 아래서나 해먹, 보트, 욕조, 그네에서는 읽을 수 없다. 반면에 아무리 불편한 상황에서도 책은 내게 그것을 허용한다. 또한 노트북이나 전자책 리더기가 6층 창문에서 떨어지면 나는 수학적 확률상 모든 걸 잃을 각오를 해야 하지만, 종이책이 떨어졌다면 기껏해야 모서리에 조금 손상이 갈 뿐이다.

저장매체의 불안정성에 관하여


로제타 석이나 고대의 돌에 새겨진 문헌들은 정보의 분량에 비하면 부피가 엄청나지만 3~4천 년을 변함 없이 버텨왔고 앞으로도 보관하기에 따라 그 수명은 준영구적이다. 기록의 기술이 발달하여 종이보다 먼저 나타난 양피지는 기본 수백 년의 기대수명을 보인다. 혁명적인 저장매체인 종이, 특히 전통 방식으로 제조된 중성지는 온습도만 맞춰준다면 저장된 지식과 정보가 최소 100년에 많게는 5백~1천 년 가고, 사진술로 개발된 마이크로필름은 비교적 보존성이 낮은 컬러판 수명이 100년, 더욱 오래가는 흑백판이 최대 700년까지 기대수명을 자랑한다. 디지털 시대 초기 매체이자 아날로그 방식인 마그네트 밴드가 수십 년간 보관될 수 있다.

도서관 하나가 소장하고 있는 장서를 CD 몇 장으로 압축해서 저장할 수 있을 정도로 저장매체의 기술이 발달했지만, 저장매체의 정밀도가 너무 높아졌기 때문에 작은 손상에도 쉽게 많은 양의 데이터가 손실될 수 있다는 단점이 생겼다. 또한 저장매체의 수명도 줄어들었는데, 싸구려 저장매체는 5~10년이면 망가져버려 저장된 정보가 사라져버리는 경우도 있다.

디지털 정보는 얇디얇은 막에 기록되어 있어 지구자석은 물론 가까운 오디오 기기 자석에도 손상되기 쉬우므로 엄청난 자산과 노력의 투입으로 얻어진 귀중한 정보, 지식이 허무하게 사라져버리는 것인데, 전자 데이터란 너무 예민하여 몇 백 메가 용량의 정보 중 일부만 유실되어도 모두 무용지물이 되어버릴 가능성이 있는 데에 문제의 심각성이 있다.[2]

아무 컴퓨터 파일을 메모장으로 연 뒤 한 글자만 바꿔도 파일이 안 열리는 것을 경험할 수 있는데, 이건 파일 무결성 검사가 통과되지 않았거나 해석 중 오류가 발생한 것으로 파일 전체가 망가졌다는 뜻이 아니라 컴퓨터 자체에서 이 파일은 손상되었으니 사용할 수 없다고 친절하게 알려주는 것이다.

백업용 스토리지로 SSD보다 HDD가 선호되는 것도 비슷한 이유이다. HDD는 자성 기록 장치 특성 덕에 고장나면 돈은 들어도 적어도 일부라도 복구할 가능성이 다소 있으나, SSD는 메모리 셀의 화학적 특성을 이용하기 때문에 물리적인 충격에는 강하지만 전기적 충격이나 온도 등으로 인하는 화학적 특성 변화에 약하며, SSD의 셀 수명을 위하는 분산 기록 기술인 마모 평준화(Wear Leveling) 작업이나 쓰레기 수집, 인터리빙 등의 기술 때문에 컨트롤러 단에서 매우 복잡하게 데이터를 분산하므로, 이하 계층에는 분석이 까다로워 복구 작업이 매우 까다롭다. 이런 문제들 때문에 데이터 손실이 생기면 복구하기 매우 어렵다.


3.6. 지식재산권 문제[편집]


이쪽은 주로 OTT나 ESD에서 발생하는 문제점이다. 이러한 플랫폼은 역사적 가치를 지닌 작품을 보관하고 이용자들이 언제든 이용할 수 있게 하는 ‘아카이빙’에 별로 관심이 없을 수밖에 없는데, 디지털 아카이빙에도 돈이 들기 때문이다. 다시 말해 저작권 수수료를 지불하는 데도, 데이터를 보관하는 데도 돈이 드는 것이다. 그러니 저작권 수수료는 많이 드는데 보는 사람은 별로 없는 영화들은 지워나갈 수밖에 없다.[3]

4. 사례[편집]


유명한 사례 중 하나로 NASA자기 테이프가 있다. 이 테이프는 1976년 바이킹 화성 탐사선의 착륙 시기에 사용한 테이프인데, 당시 연구원들은 해당 테이프의 내용물을 다른 매체에 옮기지 않고 그대로 테이프만 보존했다.
약 10년 뒤, 나사에서 해당 자료를 열람하려 시도했으나, 해당 테이프와 기록 장치는 이미 구식이 된 지 오래되어 버렸다. 관련 장비를 다룰 수 있는 기술자와 프로그래머는 전부 사망하거나 나사 밖으로 떠나서 열람이 불가능했다. 그래서 몇 달 동안이나 관련 자료를 싸그리 뒤지며 해당 테이프와 기록 장치의 작동법을 알아내기 전까지 그 누구도 그 어떤 기계도 이 테이프를 읽지 못했다.

또 다른 사례로 1986년 BBC 둠스데이 프로젝트(BBC Domesday Project)가 있다. 둠즈데이 북 900주년을 맞아 BBC는 여러 컴퓨터 회사들과 합작하여 영국의 각종 '설문 자료(surveys)'들과 방대한 시각적 자료를 취합하는 프로젝트를 실시했다.[4]
이 야심찬 프로젝트의 최종 완성본은 당시는 현역이던 레이저디스크에 저장되었는데, 2002년 경은 디스크와 소프트웨어, 기록 장치가 서서히 도태되어 가며 훗날에 디스크의 보존 상태를 떠나 자료 자체를 읽지 못할 수 있다는 의견이 제기되었다.[5] 이에 BBC 측은 CAMiLEON 프로젝트를 통해 해당 자료들을 SCSI를 거쳐 리눅스 PC로 옮기는 데 성공했다.
후에 여기서 파생된 프로젝트 Domesday 1986는 지금도 이어지며, 레이저디스크 원본의 디지털화 및 관련 컴퓨터 시스템용 에뮬레이션 소프트웨어 개발 등을 다룬다. 예를 들어, 2021년 경에는 해외의 유명 아카이브 사이트인 https://archive.org를 통해 레이저디스크 원본들을 공개하였다. #

최초의 한글판 윈도우인 한글 윈도우 2.1은 출시 당시는 많은 관심을 받지 못해 구입한 사람이 극소수였고, 현재는 단 한 카피만이 실물로 남아있다고 알려졌다. 5.25인치 플로피 디스크에 담겨 있는 만큼 시간이 더 지나다 보면 파일을 복원하지 못하게 될 수도 있다.

어도비 플래시는 어도비가 플래시 사용을 막아버리면서 많은 플래시 게임들이 비슷한 처지가 될 가능성이 있었으나, 오픈소스 기술을 사용해 살려냈다.

유네스코 국제기록유산센터 컨퍼런스에서 여러 사례가 언급되었다.

4.1. 디지털 밖의 비슷한 사례[편집]


과거에는 영화나 텔레비전 방송 프로그램들이 손실되는 경우가 잦았다. 특히 TV 프로그램은 비디오 테이프가 너무 비싸서 아예 생방송으로만 방송한 경우도 많았다. 녹화방송이 필요하면 비디오 테이프 대신은 영화필름을 사용해 촬영했다. 하지만 방송사에서 필름 관리를 철저히 안 했기 때문에 대부분 소실된 경우가 많다. 최근에는 방송사 차원에서 시민들을 상대로 당시 방송을 녹화한 테이프를 찾는 동시에 향후 VCR 장비가 소실될 것을 대비하여 기존 비디오 영상을 디지털화하는 작업을 하고 있다.

백남준다다익선도 이와 비슷하다. CRT가 단종된 이래로 관련 부품이 줄어 제대로 고칠 수 없게 되면 LCD 등으로 바꿀 수밖에 없게 된다. 다만 백남준이 그래도 상관없다고 했단 증언이 있다.

5. 해결책[편집]



5.1. 국제표준을 정하여 통일한다[편집]


그 유명한 PDF가 해당하는데, 수정할 수는 없어도 거의 대부분의 장치에서 읽을 수 있기 때문이다.
그 밖에 USB등 하드웨어 표준을 통일하는 것도 여기에 들어갈 수 있다. 국제표준을 제정해서 통일한다면 어느 기업이 제조한대도, 표준 하드웨어만 갖고 있대도 그걸로 문제없이 읽어낼 수 있기 때문이다.


5.2. 장기보존이 가능한 매체를 사용한다[편집]


기록보존기술은 편리성보다 경제성과 저장성이 우선되지만, 디지털 저장매체는 최신 기술일수록 저장수명이 짧다. 수명은 대체로 자기테이프>HDD>SDD로 보고 있으며, 특히 SDD는 기대수명이 너무 짧다는 이유로 아직도 디지털 아카이빙에서 선호되지 않는다.

다만 디지털 시스템에서 조그만 손상만으로도 정보 전체를 못 쓰게 되어버린다는 것은 오해이다. 물론 위 글이 쓰인 당시에는 하드 디스크나 플로피 디스크를 제외하면 저장매체가 CD 정도였고, 이른바 ''이 나면 그 CD는 쓸 수 없었기에 대체로 사실이었지만, 현재의 기술력으론 몇 비트 날아간 정도는 적절한 처리를 해 주면 되살릴 수 있다. 일부 파일이 손상되어도 민감한 소프트웨어의 소스 코드라면 몰라 음성이나 영상 데이터라면 못 알아볼 정도로 손상을 입지는 않는다. 경찰에서도 날아간 CCTV나 블랙박스를 복원하는 작업을 주로 한다. 세월호 사고를 조사하면서 바다에 침수돼 있던 블랙박스와 CCTV를 복원해 낸 사례도 있다. 파일의 종류에 따라서도 복구 난이도가 다른데, 압축률이 높을수록 기록밀도가 높아져서 같은 양의 유실이라도 손상을 크게 입고 복구가 어려워진다. 무압축 파일의 경우라면 난이도가 낮은 편으로 유실된 딱 그 부분만 손실되고, 나머지 부분은 문제 없이 읽을 수 있다.


5.3. 오픈 소스[편집]


소스 코드가 누구나 열람할 수 있게 되어 있다면, 그 소스 코드를 만든 사람 외에도 누군가가 이를 이용해 호환 프로그램을 만들 수 있고, 이로 인해 프로그램 자체가 잊어질 일이 없어진다. 물론, 악용의 가능성이 언제든지 있기 때문에 GNU 일반 공중 사용 허가서 같은 안전장치를 마련해두는 것이 일반적이다.

5.4. 에뮬레이터 등 호환 하드웨어/소프트웨어를 사용한다[편집]


최신 기술을 사용하는 하드웨어/소프트웨어를 사용해서 과거 기록을 열람하고 이용할 수 있게 하는 방법이다. 모토로라 68000을 에뮬레이션하는 모듈이 하드웨어 쪽의 예이다.


6. 관련 글·문서[편집]



파일:크리에이티브 커먼즈 라이선스__CC.png 이 문서의 내용 중 전체 또는 일부는 2023-11-24 20:31:56에 나무위키 디지털 암흑시대 문서에서 가져왔습니다.

[1] 그 소프트웨어가 엄연히 돈 받고 파는 상품이기 때문인데, 해당 소프트웨어를 단종시켰다고 해도 이해관계가 얽혀 있어 쉽게 사용권을 풀 수 없다.[2] 이원복, 《현대문명진단》(양지사), '많이는 기억해도 오래는 못 한다!'. 36쪽[3] https://www.chosun.com/opinion/specialist_column/2023/10/27/MGS3KZLNEVE5FIMA2SZJTGGJVI/[4] '설문 자료'란 당시 영국의 지리, 역사, 사회적 문제, 또는 일상에 대하여 작성한 글로 구성되어 있다. 이 글들은 대부분 당시의 학교를 다니던 아동들의 작품이다. 시각적 자료로 각종 컬러 사진, 도표, 영상 등의 방대한 자료들도 첨부되어 있다.[5] 1986년이 얼마나 옛날인가 하면, 현재 애니메이션에 쓰이는 GIF 포맷이 발표된 것이 1987년이고, 현역으로 쓰이는 JPEG 포맷이 발표된 것이 1992년이다.