장기 보존용 디지털 유산의 선택에 관한 유네스코/퍼시스트 지침(제2판)①
  • 작성부서 국제교류홍보팀
  • 등록일 2021-10-22
  • 조회 880
글자크기

기술의 발달로 방대한 양의 디지털 자원이 생성되면서 주요 기록관, 도서관 등의 공공 문화기관들은 매일 쏟아져 나오는 디지털 자료를 보존하는 데 큰 어려움을 겪고 있다. 양도 많을뿐더러 디지털 자료의 수명은 여러 이유로 물리적 객체보다 짧기 때문이다. 전 세계 문화유산의 효율적ㆍ안정적 보존을 위해 유네스코/퍼시스는 장기 보존용 디지털 유산의 선택에 관한 지침을 지속적으로 발표하고 있다. 이 자료는 두 번째 지침으로 월드라이브러리에서 두 차례에 걸쳐 번역문을 소개하고자 한다.

유네스코/PERSIST 콘텐츠사업단, 2021년 5월

들어가는 말

도서관이나 아카이브, 박물관과 같은 유산보존기관들은 전통적으로 사회에서 생산된 지적 및 문화적 자원들을 보존할 책임을 안고 있다. 그러나 오늘날 디지털 형태로 제작·공유되는 정보의 양과 속도 및 다양성으로 인해 전 세계적으로 이 중요한 사명이 위기에 처해 있다. 매해 전 세계에서 생산 및 소비되는 데이터의 양을 측정하는 ‘IDC 글로벌 데이터스피어(International Data Corporation Global DataSphere)’는 2020년과 2023년 사이에 생산되는 데이터의 양이 지난 30년간 생산된 데이터의 양보다 많을 것으로 예측했다(IDC, 2020). 이와 같은 기하급수적인 성장은 디지털화된 유산과 ‘본 디지털(born-digital, 처음부터 디지털로 제작된)’ 유산을 장기 보존할 사명을 지닌 기관들에 어려움을 가중시키고 있다.

본 지침의 대상

이 지침은 전 세계의 모든 지역과 상황에 적용될 수 있다. 문화유산 정책은 국가와 지역 및 기관마다 다르기 때문에 지침이 지나치게 제한적일 수 없다. 도서관과 아카이브, 박물관, 기타 유산보존기관들은 보존용 자료의 선정에 관한 정책을 개발할 때 이 지침을 출발점으로 활용할 수 있을 것이다.

이 지침은 날마다 어떤 자료를 장기 보존용으로 선택할 지를 결정해야 하는 문화기관을 우선 염두에 두고 작성되었다. 현장 전문가들은 이 지침을 이용하여 기존의 정책을 검토하고, 중요한 고려사항들을 확인하고, 관련 정책을 수립할 수 있을 것이다. 문화기관의 고위 정책결정자들도 자원 관리 전략과 예산을 기획하고 우선과제를 수립할 때 이 지침을 이용할 수 있을 것이다.

주요한 도전과제

방대한 양의 디지털 정보를 보존하는 일이 어려운 이유는 그 양 때문만이 아니라 디지털 자료의 수명이 대체로 짧다는 점에도 기인한다. 디지털 미디어는 수세기 동안 생존할 수 있는 물리적인 객체나 문서, 도서만큼 수명이 길지 않다. 디지털 파일 포맷과 저장 매체 및 시스템은 계속 변화·발전하는데, 이로 인해 디지털 유산은 종이나 다른 물리적인 객체보다 수명이 훨씬 짧고 또한 장기적인 가독성과 무결성이 위협받는다. 디지털 자료는 캡쳐할 수 있는 기간이 매우 짧다. 이와 더불어, 콘텐츠 제작의 도구이자 동시에 그 자체로 창작물인 디지털 시스템도 보존해야 할 디지털 콘텐츠로 인식되기 시작하고 있다.

우리 장서에 보관되어 있는 전통적인 형태의 유산에 비해 디지털 유산은 그 생존을 보장하기가 훨씬 어렵다. 장기보존을 위해서는 중요한 디지털 정보와 품목, 컬렉션을 찾아내어 조기에 개입하는 일이 중요하다. 보존 비용이라는 경제적인 부담에 대응하는 일도 마찬가지로 중요한데, 이 문제는 특히 국가 및 기관의 예산과 관련된 문제일 뿐 아니라 국가 및 지역 간의 불평등 문제이기도 하다.

디지털 유산을 보존하는 일이 문화기관만의 책임이 아니며 콘텐츠 제작자만이 아니라 민관 부문 모두의 참여와 협력을 필요로 한다는 점은 자명하다. 민간 부문 역시 자체의 디지털 정보를 보존하고 제공하는 문제와 관련하여 어려움에 직면할 것이다. 따라서 이 일은 민관이 협력하고 공동으로 프로젝트를 진행할 수 있는 기회라고 볼 수 있다.

다양성과 포용

이 지침에서 말하는 수집 대상 자료는 세계 전 지역에 존재하는 모든 인종과 종교, 젠더, 사회, 정치 집단이 창작한 디지털 콘텐츠 또는 그러한 집단에 관해 창작된 디지털 콘텐츠를 포함한다. 우리는 아카이브와 도서관 및 박물관이 소수집단에 의해 그리고 소수집단에 관해 창작된 기록유산을 장기 보존용으로 선정하고자 할 때 해당 집단의 자문을 구하고 그들과 협력할 것을 권고한다.

우리의 검토단(Review Group)은 이 지침에서 모든 소수집단의 필요와 관점을 언급하기는 어렵다는 점을 인식하였다. 따라서 우리는 「장기보존용 선주민 디지털 유산의 선정에 관한 지침(Guidelines for the selection of Indigenous digital heritage for long-term preservation)」과 같이 그러한 소수집단들이 직접 관련 사업을 주도하는 것을 환영하며 또한 적극 권장한다.1

본 지침의 구조

제2판으로 발간된 이 지침은 크게 두 부분으로 구성되어 있다. 「제1부: 디지털 보존이 자료 선정 결정에 끼치는 영향」은 전 세계 문화유산에서 이처럼 새롭고 중요한 부분을 보존하기 위해 현장 전문가들이 내려야 하는 자료 선정에 관한 결정을 대략적으로 보여준다. 제2부는 디지털 환경에서의 수집 문제를 보다 깊이 있게 살펴볼 것이다.

마지막으로, 부록에서는 몇몇 디지털 문제와 그 맥락에 관해 보다 심층적인 정보를 제공할 것이다.

제1부: 디지털 보존이 자료 선정 결정에 끼치는 영향

디지털 보존의 정의

디지털 보존의 정의와 관련하여 우리는 디지털보존연합(Digital Preservation Coalition, DPC)이 내린 다음의 정의를 따를 것이다.

디지털 보존이라 함은 필요한 기간 동안 해당 디지털 자료에 대한 지속적인 접근성을 보장하는데 필요한 일련의 관리 활동을 말한다. 디지털 보존은…… 매체의 오작동이나 기술적 및 조직적 변화로부터의 보호라는 측면을 넘어서 디지털 자료에 대한 접근성을 유지하는데 필요한 모든 행동을 지칭한다. 한 기관의 일상 활동 중에 생성된 기록이나 특수 목적으로 처음부터 디지털로 제작된 자료(예. 교습 자료), 디지털화 프로젝트의 산물 등이 그러한 자료가 될 수 있다. (Digital Preservation Handbook, 2015).

디지털 보존은 시간과 기술, 의미 변화(semantic shift)에 상관없이 디지털 정보에 대한 장기적인 접근성을 보장하며, 장기적으로는 사회적(정부의 증거), 문화적(국가적 정체성), 경제적(사용 및 재사용, 혁신) 이득을 가져올 수 있다.

디지털은 문화유산이 제작되고, 보관되고, 보존되고, 배포되고, 소비되고, 현금화되는 방식을 크게 바꾸어 놓았다. 사람들의 역할도 수동적인 관찰자에서, 참여와 창의적인 사용 및 접근성이라는 새롭고 흥미로운 기회를 이용하는 적극적인 참여자이자 콘텐츠 제작자로 크게 바뀌었다(Tammaro, 2016).

디지털 환경은 웹페이지와 쌍방향적인 소셜 미디어 사이트에서부터 개인의 연구 데이터베이스, 디지털 예술작품, 온라인 게임 환경에 이르는 새로운 형태의 표현을 만들어냈다. 이러한 자료들은 책임의 경계와 선을 모호하게 하며, 과거와 같은 수집 방식에 도전을 제기한다.

기존의 사명과 수집 정책은 이러한 새로운 형태의 디지털 유산을 포함하지 않는 경우가 많다. 그러나 우리가 이러한 새로운 형태의 디지털 유산을 도외시한다면 미래세대를 위한 우리의 문화유산에 큰 공백이 생길 위험성이 있다.

한 가지 예로써, 블로그나 소셜미디어(SNS)에서 한 개인이 올리는 글의 가치는 크지 않을 수 있지만 수십억 명의 의견과 생각, 성취를 모으면 당대의 사회를 보여주는 고유한 기록이 된다. 그것이 보존된다면 미래 세대를 위한 비할 데 없이 중요한 지식 자원이 될 것이다. 기관의 사명에 의존하여 ‘최고의’ 창작물에만 초점을 맞춘다면 편향성이 반영될 수 있고 전체의 일부분으로써 당대의 디지털 제작물을 분석하기가 어려워질 수 있다.

그러나 디지털 형태로 된 이러한 사회적인 생산물을 일괄적으로 수집하여 보존할 수 있는 자원을 가진 기관은 거의 없고, 어떤 경우에는 그렇게 할 권리도 갖고 있지 않다. 이것은 디지털 시대에 우리가 직면하는 선택의 역설이다. 현존하는 모든 디지털 유산을 수집한다는 것은 경제적, 기술적으로 불가능하고 또 법적으로도 금지된 경우가 많기 때문에 선택이 불가피하다.

따라서 장기보존을 위한 선택은 디지털 시대에 유산보존기관들이 해야 할 필수적인 활동으로써, 대표적인 역사적 기록물을 캡쳐하기 위한 현실적이고 실용적이며 협력적인 방식을 이용해야 할 것이다.

디지털 자료의 수집은 전통 자료의 수집과 어떻게 다른가?

디지털 자료는 디지털 형태로만 온전히 보존되는 경우가 많기 때문에 그에 따른 어려움이 있다. 디지털 자료가 제공하는 모든 필수 정보와 기능성을 갖춘 (디지털이 아닌) 아날로그 자료는 없으며, 디지털 보존은 차후에 해당 자료를 이용할 수 있을 때만 유용하다(Digital Preservation Coalition, 2015).

디지털 자료와 전통적인 자료의 수집은 다음과 같은 차이가 있다.

  • • 디지털 환경에서 변화의 속도와 복잡성
  • • 디지털 객체를 이해하고 조작하기 위해 중개 도구와 서비스가 필요함
  • • 선택을 위해 검토해야 하는 정보의 양
  • • 시간이 지날수록 하드웨어와 소프트웨어가 계속 구식이 되는 문제
  • • 디지털 콘텐츠가 부식되는 속도와 그러한 부식이 거의 눈에 보이지 않는다는 점
  • • 시간이 지날수록 디지털 수집·저장·보존이 페타바이트(petabyte)에서 엑사바이트(exabyte)로의 이동과 함께 수행되어야 하는 규모의 문제

전통적인 수집과 디지털 수집 간의 유사점과 차이점에 대해서는 「부록 1: 디지털 수집과 전통적인 수집의 비교」를 참조한다.

디지털 자료의 유형

지금은 전통적인 유형의 디지털 유산 중 다수가 디지털본으로도 제작되어 있고, 그러한 디지털본은 기존의 관행과 사명에도 부합하는 경우가 많다. 그러한 유산 자료로는 책, 정기간행물, 정부 기록, 개인 서신, 일기, 지도, 사진, 동영상 및 음향녹음 자료, 공예품, 미술품 등이 있다.

이와 함께 디지털 유산은 또한 소셜 미디어나 가상현실(VR), 증강현실(AR), 디지털 아트, 웹 아카이빙 등의 형태를 띠기도 한다.

우리의 검토단은 비록 고려대상에 포함시켜야 할 모든 디지털 자료 유형을 망라하기란 불가능하지만 전통적인 콘텐츠의 선정 전략에 포함되지 않는 몇 가지 자료 유형을 조사하는 것이 중요하다고 보았다.

장기보존 대상 소프트웨어 소스 코드, 연구 데이터, 소셜 미디어, 인공지능의 선정 문제는 부록을 참조한다.

선정 기준의 개발

대부분의 경우, 디지털 유산을 평가하여 선정할 때 기관이 기존에 가지고 있는 사명과 장서 개발 정책이 출발점이자 중요한 지침이 될 것이다. 이제 그것을 디지털 표현이라는 새로운 형태에 맞게 적용시켜야 한다.

디지털 유산을 평가할 때는 맥락과 출처 등 전통적인 자료의 선택시 적용하는 원칙 중 다수가 그대로 적용되지만 일부는 디지털 환경에 그대로 적용하기가 어렵다는 점을 인식해야 한다. 디지털 유산은 또한 선택 결정을 내릴 때 장기적인 접근성과 사용 및 보존이라는 새로운 문제를 고려해야 한다.

선정 기준

기관에서는 기관의 사명과 서비스 대상집단을 고려할 때 특정한 디지털 유산이 갖는 상대적인 중요성을 평가하고, 그것의 지속가능성, 즉 장기적인 접근성과 사용을 목적으로 기관이 그것을 보존할 수 있는 능력2 을 평가하고, 다른 유산보존기관에서의 제공 여부, 즉 다른 곳에서 보존될 가능성과 그것을 보존하기에 가장 적합한 기관이나 공동체가 어디인지를 고려해야 한다.

여기서 중요성과 지속가능성이라는 개념은 기관의 사명과 자원이라는 측면에서 평가되어야 한다. 타 기관에서의 제공 여부는 유산보존 공동체 내의 다른 기관들을 조사하여 해당 디지털 유산의 장기적인 생존과 관련한 위험 수준을 평가하는 것이다. 중단기적으로 소실될 위험이 있는 유산과, 유네스코 세계기록유산에 등재된 장서와 같이 인류에 포괄적인 중요성을 갖는 유산에 특히 주의를 기울여야 한다.

우리는 유산보존기관마다 사명과 장서 정책 및 보유 자원이 다르다는 점을 유념하여 아래와 같이 디지털 자료 선정의 결정구조를 수립하는데 적용할 수 있는 일련의 단계와 질문을 제시하였다. 이 내용은 기관의 목적과 규모에 따라 각 기관이 자체 필요에 맞게 수정할 수 있다. 설령 이 방식을 채택하지 않더라도 아래의 단계를 이용하여 장기 보존용 디지털 유산의 선정과 관련한 논의의 출발점으로 이용할 수 있을 것이다.

디지털 유산의 수집 전략

유산보존기관은 디지털 환경에 대응하기 위해 기존의 접근 방식을 발전시켜야 한다. 이를 위해서는 다음의 전략 또는 접근법 중 하나 이상을 수정해야 할 것이다.

선정

기록물 전문가, 사서, 큐레이터 등 유산보존 전문가들은 구체적인 기준에 따라 장서에 포함시킬 자료를 선정한다. 그러한 기준은 기관의 유형과 사명, 보유 자원, 수서 가능한 자료의 유형과 양에 따라 크게 달라질 수 있다. 선정 기준은 보통 수서 정책에 규정되어 있는데, 다음과 같은 범주를 포함할 수 있다(몇 개의 범주가 혼합될 수도 있다).

  • • 기능. 아카이브와 같은 기록유산기관들은 기관이나 정부가 수행한 사업을 바탕으로 장기적인 가치가 있는 기록물을 선택할 것이다. 예: 외교 통신문은 외무부에서 중요한 보고 기능이다.
  • • 주제. 하나 이상의 주제 영역에 집중하여 기록하고자 할 것이다(예. 특정 화가나 장소에 관한 모든 웹사이트 또는 선거나 예술제 같은 행사를 기록하기 위한 웹 크롤).
  • • 창작자/출처. 특정한 유산이나 출처의 창작자에 초점을 맞출 것이다. 예를 들어, 아카이브는 특정 지역의 작가들에 대한 디지털 기록을 수집할 수 있고, 박물관은 특정한 미술 사조에 속한 미술가들의 작품을 수집할 수 있다.
  • • 유형/포맷. 콘텐츠 유형이나 포맷 별로 수집할 수 있다(예. 디지털 사진, 음반, 영화, 비디오 게임).

또는 자료 선정을 뒤로 미루고 우선 모든 디지털 유산 자료를 캡쳐한 후 나중에 선정 기준을 적용하기로 할 수도 있다. 아래에서는 포괄적인 수집과 대표 표집이라는 두 가지 수집 방법을 설명한다.

포괄적인 수집

특정한 주제 영역, 시대, 지역에 관해 제작된 모든 자료를 수집할 때는 포괄적인 수집 방법이 이용된다. 이 방법을 사용하려면 범위가 좁거나 기관이 상당한 자원을 갖고 있어야 한다. 아마도 출판물의 납본이 우리에게 가장 익숙한 포괄적인 수집 방법일 것이다. 출판사들이 출판물을 낼 때마다 그 사본을 국립도서관에 납본하도록 법적으로 의무화하여 국립도서관이 자국 내에서 발행된 모든 출판물을 수집하는 것이다. 박물관도 특정한 시기에 창작된 모든 작품을 수집할 수 있다.

아카이브는 특정한 경우에 포괄적인 수집법을 사용한다. 예를 들어, 유력 인사나 국가적으로 중요한 사건과 관련한 모든 것을 수집할 수 있다.

대표적 표집

장기 보존용 자료를 결정하는 또 다른 방법은 표집(sampling)이다. 표집은 기관이 포괄적인 수집을 할만한 자원이나 역량이 없고 특정한 선택 기준에 따라 자료를 구분하는 것이 문제가 될 때 흔히 사용된다. 그러한 경우에 표집은 대표적인 모습을 기록할 수 있는 수단을 제공함으로써, 많은 자원을 들이지 않고도 선택과 보존을 가능하게 한다.

일례로, 국립도서관은 각기 다른 시기에 온라인 상에서 보여지는 국가의 모습을 보존하기 위해 간헐적으로 국가의 전체 웹 도메인을 크롤링할 수 있다. 아카이브는 표집법을 이용해서 가장 많이 기록된 사건, 특정 연도의 자료, 특정 알파벳으로 시작되는 자료, 통계 분석에 의해 결정된 자료 등과 같이 정부의 사건 파일을 선택할 수 있다. 3

맥락의 고려

디지털 유산을 선정하는 프로젝트에 착수하기 전에 전반적인 맥락적 환경을 고려하는 것이 도움이 된다. 디지털 세계에서 유산보존 전문가들이 다루어야 하는 정보의 양이 날로 증가하는 상황에서 자료를 조사하고 선정할 때 맥락을 고려하면 시간과 자원을 절약하고, 복잡한 디지털 환경에서 혼란에 빠지지 않고 명료하게 결정을 내릴 수 있다.

디지털 유산 제작의 맥락과, 창작자와 활동 및 시스템 간의 상관성을 조사하면 보다 전략적인 차원에서 결정을 내릴 수 있다. 아래의 결정 구조(decision tree)를 살펴보면서 맥락을 고려하는 것은 우왕좌왕할 가능성을 줄이는 유용한 원칙이 될 수 있고, 보존과 접근성 제공에 반드시 필요한 메타데이터/출처가 있는 디지털 유산을 수집할 수 있을 것이다.

따라서 이 분석에 도움이 되도록 결정 구조 전반에서 맥락적 고려사항(‘맥락 확인’)이 포함되었다.

개별 기관에서의 자료 선정을 위한 결정 구조

네 단계로 구성된 이 방법은 일관되고 증거에 기반한 평가를 돕기 위해 일련의 질문들을 포함한다.

1단계: 식별

가능하다면 프로젝트의 한도를 정한다. 예/아니오 결정으로 충분한지 또는 자료들을 비교하기 위해 비교 평가(높음, 중간, 낮음)가 필요한지를 결정한다.

수집하거나 평가할 자료를 식별한다.

  • • 그것의 제목, 창작자, 출처, 양, 조건은 무엇인가?
  • • 기관은 모든 데이터/기록물/정보를 포착하고, 보존하고, 제공할 역량과 권리를 갖고 있는가?
  • • 제공되는 메타데이터의 유형은 무엇이며 양은 얼마나 되는가? 메타데이터가 변질되는 경우 어떻게 해결할 것인가?4

이 단계에서의 의사결정 과정을 기록하여 보관한다. 이 기록은 항상 최신 상태로 유지하며 쉽게 확인할 수 있어야 한다.

맥락 확인: 디지털 객체보다 더 높은 수준에서 식별 단계가 이루어질 수 있는가? 선택 결정을 뒷받침하는 기능이나 활동이 있는가?

일례로, 행정 활동에 따라 생성된 기록물은 전반적인 의사결정을 지원하는 고위 정책기구와 기록들을 통해 충분히 문서화되어 있기 때문에 정부 아카이브에서는 그러한 기록물은 수집하지 않기로 결정할 수 있다.

2단계: 법적 구조

자료의 장기 보존과 관련한 법적인 문제들을 확인하기 위해 다음과 같은 질문으로부터 시작한다.

  • • 기관은 해당 자료를 보존할 법적 의무가 있는가? 디지털 보존 및 장서 개발에 관한 기관의 사명이나 정책으로 볼 때 이 자료는 보존되어야 하는가?
  • • 지식재산권이나 개인정보 제한 등 보존과 관련한 잠재적인 장애물을 고려해보았는가?

이러한 질문들에 대한 답이 ‘그렇다’이면 보존한다. 여기서 보존해야 한다는 결정이 내려지고 더 이상의 선택이 불필요하다면, 이하의 단계는 필요하지 않다.

이 단계에서의 의사결정 과정을 기록하여 보관한다. 이 기록은 항상 최신 상태로 유지하며 쉽게 확인할 수 있어야 한다.

3단계: 선정 기준의 적용

다음의 선택 단계가 필요한 경우, 기관은 중요성, 지속가능성, 제공 여부라는 세 가지 범주를 이용하여 자료를 평가할 수 있다. 이때 기관은 효율적이거나 효과적인 순서에 따라 이들 범주를 평가하는데, 대개는 가장 쉬운 범주부터 시작하여 순차적으로 진행한다.

3(a): 중요성

어떤 객체의 중요성을 결정하려면 해당 객체의 진본성, 출처, 창작 이유, 창작자에게 갖는 가치 등에 대해 일련의 질문을 할 필요가 있다. 먼저, 다음과 같은 질문으로 시작하자.

  • • 이러한 가치는 기관의 사명에 얼마나 부합하며 또한 얼마나 긴밀하게 기관의 사명을 뒷받침하는가?
  • • 해당 디지털 객체가 처음부터 디지털로 제작되었는가, 아니면 물리적인 품목의 대체물인가? 그 물리적 품목이 아직 존재하는가?
  • • 기관의 서비스 대상이나 해당 객체를 창작한 공동체 또는 인류 전체에 중요한 사회적, 문화적, 역사적, 또는 예술적 가치가 있는가?
  • • 중요한 정보, 콘텐츠, 용도, 또는 연구적 가치가 있는가?
  • • 이 디지털 품목이 보존되지 않을 경우 기관의 이해관계자들(고객, 후원자, 사회)은 어떤 영향을 받을 것인가?
  • • 해당 기록유산이 선주민 또는 소수집단에 의해 창작되었거나 그들에 관해 창작된 것인가? 그렇다면, 선정 과정의 일환으로 해당 집단과 상의하는 문제를 고려해야 한다.

이러한 범주를 고려했을 때 해당 디지털 품목이 중요하다고 판단되는 경우, 보존을 고려한다. 이 단계에서의 의사결정 과정을 기록하여 보관한다. 이 기록은 항상 최신 상태로 유지하며 쉽게 확인할 수 있어야 한다.

맥락 확인: 선정과정에 도움이 되는 활동/기능/창작자를 식별할 수 있는 정보는 어떤 것이 있는가?

예를 들어, 해당 디지털 유산 자료가 왜 그리고 어떻게 창작되었는지를 보여주는 비즈니스 분석이나 행정적 내력이 있는가? 이것이 기록에 중요한 창작 장소/창작 지점을 식별하는데 도움이 될 수 있는가? 가치 있는 중요한 영역들을 드러낼 수 있는 활동/기능/창작자 간의 관계는 무엇인가?

3(b): 지속가능성

장기보존용 디지털 유산을 선정하기 전에 먼저 해당 자료에 대한 지속가능한 접근성을 제공할 수 있는 역량이 있는지 검토해야 한다.

여기에 제시된 질문들은 생각해볼 지점들이다. 기관이 해당 자료를 보존하고 접근성을 제공할 수 있는 자원과 역량, 기술적 역량, 예산이 없다고 해서 해당 자료를 수집해서는 안된다는 뜻은 아니다. 보존과 접근성을 위해 단기적인 임시 대책을 마련해야 할 수도 있다. 이러한 결정은 기관과 관련 이해관계자들의 재량에 따라 개별 건별로 이루어져야 할 것이다.

디지털 보존은 단순히 기술적인 해결책을 요하는 기술적인 문제만이 아니라는 점을 기억하는 것이 중요하다. 큐레이터와 장서 관리자, 정보 관리자, 보존 전문가, 기타 물리적 장서의 보존을 담당하는 사람들은 디지털 자료의 보존 필요성을 이해해야 한다. 관련된 모든 기관이 문화기관의 수집 목적과 디지털 장서의 관리를 규정하는 윤리 강령을 이해할 때 이러한 장서의 구축 및 유지와 관련하여 날로 가중되는 어려움에 대응하기가 쉬워질 것이다.

‘지속가능성’을 평가할 때는 언제나 ‘중요성’과 ‘맥락’을 충분히 고려해야 한다. 다음과 같은 질문으로부터 시작할 수 있다.

  • • 기관은 디지털 유산 자료를 보존할 수 있는 인프라를 충분히 갖고 있는가? 그렇지 않다면, 자료의 지속가능성을 보장할 수 있는 비상 대책이 있는가?
  • • 기관은 해당 디지털 유산을 이해하고, 마이그레이션 시키고, 보존할 수 있는 기술적 역량을 갖고 있는가?
  • • 해당 자료를 다른 파일 포맷이나 물리적인 운반체(carrier)로 전송 또는 마이그레이션 하는데 어떤 권리가 필요한가?
  • • 해당 디지털 유산을 이용하고 보존하는데 필요한 충분한 메타데이터가 있는가?
  • • 해당 디지털 품목의 포맷이 보존에 적합한가, 아니면 마이그레이션 되어야 하는가?5
  • • 기관은 연구, 전시, 또는 대중의 기대에 부응하는 다른 목적으로 해당 자료를 제공할 수 있는가?

이 단계에서의 의사결정 과정을 기록하여 보관한다. 이 기록은 항상 최신 상태로 유지하며 쉽게 확인할 수 있어야 한다.

맥락 확인: 해당 디지털 유산은 어떻게 창작되었으며 시간이 흐르면서 어떻게 이용되었는가? 시스템이나 데이터세트 간에 해당 디지털 유산의 가치를 바꾸거나 보존 관련 문제를 유발할 수 있는 링크가 있는가?

해당 자료의 존속 기간 동안 그 자료의 지적통제(intellectual control)를 이해하면 그것이 수집에 적합한지 여부를 결정하는데 중요한 단서를 얻을 수 있다. 예를 들어, 그 디지털 유산이 왜 지금의 그 모습인지를 이해하기 위해서는 한 기관이 이용한 시스템과 분류 구조를 이해하는 것이 매우 중요할 수 있다.

시스템이 원래 기획된 방식과 다른 식으로 이용되었을 수 있다. 창작의 맥락을 고려하면 디지털 유산 자료의 생애 주기에서 가능한 이른 시기에 – 이상적으로는 창작 이전에- 해당 자료를 보존용으로 선택할 수 있다.

그러면 기억기관(memory institution)이 창작자와 협력하여 처음부터 장기 보존에 적합하도록 인프라와 포맷을 구축하는 방법을 제안할 수 있는 기회가 생길 수 있다.

중복성

부속 메타데이터가 있는 마스터 파일 등 중요한 디지털 유산은 복수의 사본을 적어도 두 곳의 다른 장소에 보관하는 방식으로 보관되어야 한다. 유산보존기관은 내부, 외부, 분산형 클라우드 스토리지를 혼합적으로 이용할 수 있으나, 디지털 원본은 최소한 다른 한 장소에 백업해 보관해야 한다. 저장 장소는 자연재해나 인재, 경제 위기나 정치적 위기로 인한 소실의 위험이 적은 곳이어야 한다.

적극적인 관리

유산보존기관은 장기적인 접근성과 무결성을 유지하기 위해 보존하고 있는 디지털 유산을 적극적으로 관리해야 한다. 디지털 유산은 암호화 없이 잘 기록된 개방형 파일 포맷으로, 적어도 무손실 압축으로 보존되어야 한다. 디지털 객체들을 적극 관리하는 유산보존기관의 경우 이 방법이 적극 권장된다. 저장 시에는 기관 서버, 이동식 매체(예. 자기 디스크, 광학 미디어, 자기 테이프 등) 등 두 개 이상의 서로 다른 저장 매체 유형을 이용해야 한다.

장기적으로 시스템 오류는 저장된 디지털 유산에서 중요한 정보 손실을 야기할 수 있다. 많은 기관에서는 정기적으로 디지털 데이터를 읽고, 오류 수정 기법을 이용해 오류를 확인하고, 새로운 매체에 다시 쓰기를 하여 미디어를 갱신한다. 디지털 데이터의 소유자들은 소프트웨어 오류를 피하기 위해서 저장 장소마다 스토리지 소프트웨어를 다른 방식으로 실행하는 데이터 스토리지 액세스 표준 프로토콜을 이용하는 경우가 많다. 그래서 데이터의 무결성과 신뢰성이 단 하나의 실행에 의존하지 않는 것이다.

3(c): 제공 여부

유산 공동체나 네트워크 내의 다른 기관에서 해당 디지털 유산이 제공되는지를 고려한다. 다음 질문으로 시작해보자.

  • • 이 기관이 이 자료를 보존하는 유일한 기관인가, 아니면 다른 기관에 똑같은 사본이 존재하는가? 전체 기록물(fonds)6 또는 기관의 전체 장서에 기여하는가? 희귀하거나 독창적인가, 또는 널리 복제되어 있는가?
  • • 이 자료는 어디에서 가장 잘 사용되거나 공익에 기여할 것인가?
  • • 다른 기관에서 위험에 처해 있는가?
  • • 이 기관이 이 디지털 유산을 보존하고 제공하기에 가장 적절한가?
  • • 디지털 유산의 적절한 보존을 위해 어느 정도의 중복이 필요하다는 점을 기억하자. 중복성에 관한 보다 자세한 내용은 부록 6을 참조한다.

지속가능성과 마찬가지로 제공 여부에서도 중요성과 맥락을 고려해야 하는데, 특히 해당 기록물이 소수집단에 관한 것이거나 그러한 집단에 의해 창작된 경우 그러하다.

이 단계에서의 의사결정 과정을 기록하여 보관한다. 이 기록은 항상 최신 상태로 유지하며 쉽게 확인할 수 있어야 한다.

맥락 확인: 선택을 뒷받침할 수 있는 활동/기능/창작자 간의 중요한 관계가 있는가?

4단계: 결정

이 과정에서 생성된 모든 기록을 모아 검토하고 1-3단계에서 얻은 결과를 바탕으로 결정을 내린다.

이 방법은 융통적이다. 모든 질문이 모든 기관에 해당하지는 않을 것이다. 선택 범주의 평가 순서도 절대 변경 불가한 것이 아니다. 예를 들어, 어떤 경우에는 3(a)과 3(b) 단계 전에 3(c) 단계를 평가하는 것이 더 나을 수 있는데, 특히 다른 기관이 보존기관으로서 더 적절한 경우에 그렇다.

평가나 결정의 근거를 기록하여 보관한다. 이것은 거버넌스 측면에서도 그렇고, 향후 재평가 가능성에 대비해 중요한 정보를 보존한다는 측면에서도 그렇다. 1-3단계의 질문에 대한 답변들을 포함하여 해당 디지털 유산의 중요성, 창작의 맥락, 보존과 관련한 기술적인 문제 등을 기록한 문건을 작성해둔다. 평가 자체보다 그러한 결정을 내리기까지의 논의가 더 중요한 경우가 많다. 그러한 논의과정을 담은 기록을 보관할 수 있는 표준 평가 양식을 만들 필요가 있다.

실제 적용에서 차이가 있을 수 있으나, 이 방법은 장기 보존용 디지털 자료의 선정과정에서 보다 나은 결정을 내리는데 도움이 될 것이다.

다음 호에 계속...


(원문출처)

https://repository.ifla.org/handle/123456789/1389

(관련기사)

https://librarian.nl.go.kr/LI/contents/L30101000000.do?schM=view&id=4868



장기 보존용 디지털 유산의 선택에 관한 유네스코/퍼시스트 지침(제2판)②


1선주민 데이터 거버넌스에 관한 개요는 「선주민 데이터 거버넌스에 관한 CARE 원칙」(CARE Principles for Indigenous Data Governance, https://www.gida-global.org/care)을 참조한다.

2차후에 보존이나 가독성을 가능케 하는 인프라나 기술이 개발될 것으로 생각하여 지속가능성은 없지만 중요한 기록물을 보존하기로 선택할 수도 있다.

3몇몇 정부 아카이브에서 이 방법의 한계가 확인되었다. Cook, 1991 참조.

4마이그레이션(migration)으로 인해 메타데이터가 불완전하거나 변질된 상태일 수 있지만, 그렇다고 해서 선택에서 제외시켜서는 안된다. 기관에서는 해당 기록물을 보유하고, 메타데이터의 불완전함에 대한 설명을 제공하면서 메타데이터를 보완하거나 그것을 제공할 수 있는 다른 방법을 찾아볼 수 있을 것이다.

5모든 포맷을 보존해야 한다고 주장할 수 있으나, 이 결정은 해당 전문가가 갖고 있는 자원과 인프라에 달려 있을 것이다.

6아카이브 용어. 해당 창작자로부터 집합(aggregate)된 기록물을 말한다.

담당부서 : 국제교류홍보팀 (02-590-0797 )
위로