장기 보존용 디지털 유산의 선택에 관한 유네스코/퍼시스트 지침
  • 작성부서 국제교류홍보팀
  • 등록일 2016-04-25
  • 조회 3525
글자크기

장기 보존용 디지털 유산의 선택에 관한
유네스코/퍼시스트 지침
The UNESCO/PERSIST Guidelines for the selection of digital heritage for long-term preservation

유네스코/퍼시스트 콘텐츠사업단 작성
사라 CC 초이(홍콩입법회 아카이브)
니콜라스 크로프츠(ICOM CIDOC)
로버트 피셔(캐나다 도서관 및 아카이브)
니안 렉 초(싱가포르국립도서관이사회)
수잔느 니켈(에스킬스투나 시립박물관)
클레망 우리(ISSN)
카타르지나 슬라스카(폴란드국립도서관)

콘텐츠사업단 단장: 잉그리드 페어런트(브리티시콜롬비아대학교)
콘텐츠사업단 총무: 줄리아 브렁스(IFLA)


목차
서론
국가기관과 네트워크의 역할
법적 환경이 선택에 미치는 영향
생각은 지구적으로: 유산기관과 관련한 디지털 선택의 문제들
행동은 지역적으로 1: 디지털 유산의 수집 전략
행동은 지역적으로 2: 단일기관에서의 선택 기준 개발
결론
부록 1: 장기적 디지털 보존과 메타데이터의 관리
부록 2: 용어 정의
부록 3: 참고자료

서론


도서관, 아카이브, 박물관 등의 유산기관들은 전통적으로 사회의 모든 부문에서 생산된 지적, 문화적 자원들을 보존할 책임을 맡아왔다. 매일 디지털 형태로 생성, 공유되는 정보의 절대량으로 인해 이 중요한 사명이 전 세계적으로 위험에 처해 있다. 콘텐츠의 생성과 유통을 극도로 용이하게 만드는 디지털 기술은 디지털 정보의 생산량을 기하급수적으로 증가시켰다. 디지털 세계는 2년마다 그 규모가 두 배로 증가하고 있으며 2013년부터 2020년까지 10배 가량 증가할 것으로 예상된다.1 이처럼 방대한 양을 보존하기란 매우 어려운데, 그 양 때문이 아니라 그 중 상당수가 일시적인 속성을 지니기 때문이다. 디지털 정보는 때로 수세기에 걸쳐 전해 내려오는 문서, 책과 같은 물리적 객체만큼 수명이 길지 않다. 디지털 파일 포맷과 저장 매체, 시스템은 계속 진화하면서 종이와 물리적 객체가 훼손되는 것보다 훨씬 더 짧은 기간에 디지털 유산의 미래 가독성과 무결성을 위협하고 있으며, 수집 가능성이 순간적이다. 디지털 유산은 전통 유산들보다 그 생존 보장성이 훨씬 낮다. 중요한 디지털 유산을 식별하여 조기에 개입하는 것이 그것의 장기적 보존을 확보하는 필수적인 방법이다.

이처럼 중요한 과제를 수행하는 유산기관들을 지원하기 위해서, 유네스코/퍼시스트(UNESCO/PERSIST, Platform to Enhance the Sustainability of the Information Society Transglobally) 프로젝트는 ‘장기보존용 디지털유산의 선택에 관한 지침(Guidelines on the selection of digital heritage for long-term preservation)’을 마련하였다. 퍼시스트는 2012년 9월 캐나다 밴쿠버에서 열린 세계기록유산총회에서 등장했다. 이 총회는 너무 늦기 전에 세계의 디지털 유산을 보존하기 위한 행동을 촉구하는 “UBC/유네스코 밴쿠버 선언문(Vancouver Declaration), 디지털 시대의 세계기록유산: 디지털화와 보존(Memory of the World in the Digital Age: Digitization and Preservation)”을 발표하였다. 이에 대한 대응으로 네덜란드 헤이그에서 열린 국제회의(2013년 12월 5-6일)에서는 유네스코와 IFLA, 국제기록관리협의회(International Council on Archives, ICA) 등의 협력 사업으로서 ‘퍼시스트’가 출범했다. 퍼시스트는 정책, 테크놀로지, 콘텐츠의 세 사업단으로 조직되었는데, 이들 각각은 디지털의 장기적 보존과 관련한 과제들을 다룬다. 본 지침은 유네스코와 유산공동체의 논의를 위해 콘텐츠사업단이 마련한 것이다.

본 지침의 목적은 장기적으로 지속가능한 디지털 보존을 위해 디지털 유산 선택에 관한 정책을 마련하고자 하는 도서관, 아카이브, 박물관, 기타 유산기관들에 보편적인 출발점을 제공하는 것이다. 기관이 이미 그러한 정책을 가지고 있다면 이 지침을 바탕으로 그것을 다시 평가하여 필요에 따라 수정할 수 있을 것이다. 이 지침은 다양한 사람들을 대상으로 한다. 지역사회와 지역, 국가들 간에 디지털 유산이 크게 다를 수 있기 때문에 그 보존 활동은 콘텐츠 생성자뿐 아니라 민관 모두의 참여와 협력을 필요로 한다. 유산 수집의 관리는 공공기관들에 일차적인 법적 책임이 있을 수 있으나, 민간 부문 역시 민간의 디지털 정보를 보존하고 접근성을 제공하는 문제에 직면할 것이다. 그것은 당국의 규제나 주주에 대한 책임성 때문일 수 있으나, 소중한 디지털 유산을 보존하고 미래세대에게 그것을 제공함으로써 지역사회와 지역, 세계의 발전과 지속적인 성장을 뒷받침해야 할 기업의 사회적 책임도 있다. 본 지침은 도서관과 아카이브, 박물관, 기타 유관 기관들이 자료의 수집과 관리에 있어서 서로 다른 강령과 운영 및 방법을 가지고 있다는 사실을 반영하였다. 그러나 정보기술이 발전하고, 도서관과 아카이브, 박물관 장서 전반에서 사용자들의 수요와 통합적이고 신속한 접근성에 대한 기대가 날로 증가하면서 모든 유산기관과 정보제공자들은 디지털 자료의 선택 및 보존과 관련하여 비슷한 난관에 직면하고 있다. 본 지침은 선택을 위해 기존 자료를 검토하고, 중요 사안들을 점검하고, 기관 정책의 작성 시 지침을 제공하기 위한 것으로, 전 세계 모든 지역 및 모든 수준의 기관과 전문가, 관리자들을 위해 만들어졌다. 우리는 또 보존용 유산의 선택 문제와 관련하여 윤리적 측면이 있음을 인지하고 있으나, 현 단계에서는 이를 상세히 다루지 않을 것이다.

국가기관과 네트워크의 역할


국가기관들은 디지털 선택 및 보존 문제와 관련하여 유산공동체에 리더십을 제공하는 중요한 역할을 해야 한다. 여러 국가에서 지명된 국가기관들이 출판 자료와 같은 문화유산의 납본 및/또는 정부의 공식 기록물 납본과 관련한 법규를 가지고 있다. 물리적 자료만을 포괄하는 기존 법률은 디지털 자료까지 포함하도록 수정되어야 한다.

다양한 통로와 플랫폼을 통해 디지털 유산을 획득, 수집하는 일은 상당한 노력과 자원을 필요로 한다. 예를 들어, 국가의 웹 도메인에 포함된 웹사이트가 수천에서 수백만 개에 이를 수 있고, 그러한 웹사이트에 매일 수백만에서 수십억 개의 파일이 게시, 갱신, 또는 삭제된다. 오프라인에서도 미래세대를 위해 보존될 가치가 있는 디지털 유산이 상당량 있다(예. 연구 원시 자료, 정부 기록물, 조직이나 개인의 사적인 디지털 파일). 이 사업의 규모를 고려할 때, 대형 국가기관들이 디지털 유산의 수집/관리를 위한 정책과 체계를 확립하거나 공통의 선택/보존 모델을 채택하는 과정에서 협력적인 네트워크를 이끌어 감으로써 주도적인 역할을 하는 것이 자연스러워 보인다. 우리는 국가기관과 네트워크들이 유산공동체와 상의 하에 국가적 선택 전략들을 개발할 것을 권고한다. 정부, 학술기관, 연구센터, 비영리 및 민간 기관 등 다른 파트너들이 디지털 보존기관으로서의 역할과 책임을 맡는 것이 매우 중요하다. 일례로, 국가기관들이 디지털 정보의 수집, 조직, 보존 기준과 절차를 공동으로 규정하고, 다른 협력기관들이 이러한 기준과 절차를 보완할 수 있을 것이다. 디지털 유산의 보존이 지구적인 과제라는 점에서 국제기구들(ICA2 , IFLA3 , ICOM4 등)도 이 활동에 참여해야 한다.

법적 환경이 선택에 미치는 영향


법적 환경은 디지털 유산의 선택과 보존에 중요한 함의를 갖는다. 국제법과 국내법은 매우 다양하며 디지털 유산의 유포, 복제, 접근, 사용을 규제하지만, 인터넷은 국경을 초월하기 때문에 저작권자를 찾기가 어렵거나 어떤 법률을 적용해야 할지 모호할 때가 많다. 지적재산권, 개인의 프라이버시, “국가 기밀”의 기밀성, 정보에 대한 공적 접근성과 관련한 정부 법률과 규제는 모두 어떠한 디지털 유산을 어떻게 보존할 수 있는가, 일반에 공개할 수 있는가, 공개 가능하다면 언제 공개할 수 있는가에 영향을 끼친다. 저작권법은 특례와 제한의 경우를 제외하고는 사본 제작을 금지할 수 있는데, 장기 보존을 위해 복제가 필요할 수도 있는 디지털 환경에서는 새로운 문제를 야기한다. 더 나아가, 디지털 자료는 검색을 위해 소프트웨어를 요하는 경우가 많은데, 이 소프트웨어 역시 저작권 보호를 받을 수 있다. 몇몇 국가들은 복제와 재배포를 막는데 사용되는 기술적 보호 장치들을 우회하는 행위를 금하는 법을 제정하였는데, 이는 디지털 유산의 보존을 막고 디지털 유산에 대한 미래 세대의 접근을 저해할 수 있다. 디지털 유산의 보존 또는 접근성에 대한 법적 장애 요인들은 선택 결정에 지대한 영향을 끼칠 것이다.

제한적인 법적 환경이 중요한 디지털 유산의 장기적 생존에 부정적인 영향을 끼칠 위험성이 크다. 특정 유형의 유산을 보호하고 보존하기 위해서는 저작권자들과의 협력 또는 합의만이 유일한 방법이 될 수도 있다(예. 의회도서관/트위터 간의 협약). 공적 접근성을 위해, 우리는 디지털 유산의 선택/보존 활동에 장애가 되는 문제들을 극복할 수 있는 국제법과 국내법을 채택할 것을 권고한다.

생각은 지구적으로: 유산기관과 관련한 디지털 선택의 문제들


디지털 시대에 장기 보존이라는 문제는 유산기관들로 하여금 중요성을 식별하고 가치를 평가하는 방법을 재고할 것을 요구한다. 디지털 유산과 정보의 급증 및 풍부함, 그리고 그것의 단명적인 성격은 유산기관들이 그러한 정보가 소실되기 전에 장기적으로 보존할 디지털 유산과 정보를 적극적으로 찾아내야 한다는 말이다. 인류에 장기적으로 도움을 제공하기 위해서는 무엇을 보존해야 하는가? 책, 연속간행물, 정부 기록물, 개인적 서신, 일기, 지도, 사진, 영화, 음향 기록, 인공물, 예술작품 등과 같은 전통적인 형태의 문화유산들에 더해 이제 디지털에도 그러한 유산들이 있는데, 그러한 디지털 유산들은 우리의 기존 관행과 강령에 부합하는 경우가 많다. 그러나 디지털 환경은, 책임의 경계와 선을 흐리고 과거의 수집법에 도전을 제기하는, 웹페이지에서부터 쌍방향 소셜미디어 사이트, 개인적 연구자료, 온라인 게임 환경에 이르는 새로운 표현 양식들을 만들어냈다.

기존의 강령과 수집 정책은 이러한 새로운 형태의 디지털 유산을 포함하지 않는 경우가 많다. 이러한 새로운 형태에 대한 우리의 집단적인 무관심은 미래세대를 위한 우리의 문화유산에 큰 공백을 만들 위험성을 높이고 있다. 일례로, 블로그나 소셜미디어 상의 사적인 게시물들은 그 가치가 적을지라도 집합적으로는 수십억 개인들의 성취와 사고, 논의, 당대 사회의 고유한 기록물을 구성한다. 그러한 게시물들이 보존된다면 미래세대에게는 무엇보다 훌륭한 지식원이 될 것이다. 이러한 산물의 “가장 좋은” 부분에만 초점을 맞추는 것은 편의를 유발하고 전체의 한 부분으로써 당대의 디지털 산물을 분석하는 일을 어렵게 할 것이다. 그러나 그러한 자원을 가지고 있는 유산기관들은 거의 없으며 어떤 경우에는 디지털 형태로 된 이러한 사회적 산물을 일괄적으로 수확하여 보존할 권리가 아예 없다. 이것은 디지털 시대에서 선택의 역설이다. 현재의 모든 디지털 유산을 수집하는 일이 경제적, 기술적으로 불가능하고 때로는 법적으로 금지되어 있기 때문에 우리는 선택할 수 밖에 없다. 따라서 장기 보존을 위한 선택은 디지털 시대에 유산기관의 핵심적인 기능이 될 것이다.

디지털 시대에 들어 도서관과 아카이브, 박물관들 간의 전통적인 경계들이 어느 정도 흐려지고 있기는 하지만, 이 공동체들은 여전히 유산 보존이라는 측면에서 중요한 공통의 관심사를 가지고 있다. 따라서 각 공동체와의 관련성이 더 높거나 낮은 사안들이 있을 것이다.

도서관은 전자출판, 웹사이트 하비스팅, 페이스북이나 유튜브와 같은 소셜미디어 사이트에서의 저작권 보호를 받는 콘텐츠와 관련한 선택의 문제에 직면할 것이다. 망라적 장서를 구축하고자 애쓰는, 납본의 전통이 강한 국립도서관들은 디지털 형태로 된, 단명적인 출판물들에 대해 선택 방침을 채택해야 할 것이다. 과거에는 무엇을 출판할 것인가를 편집적으로 선택하여 결정함으로써 창의적인 산물들을 “큐레이트”한 출판사들에 의해 실질적으로 선택이 이루어졌다. 자가출판과 전자책이라는 민주화된 세상에서는 국립도서관들이 기존의 포괄적인 접근법을 수정하여 장기보존을 위한 선택 기준을 채택해야 할 것이다. 그러나 모든 도서관이 “기록유산” 기관은 아니며, 상당수는 도서관 공동체의 현 사용자 또는 연구적 필요를 지원할 의무만을 가지고 있다. 그러한 기관들의 경우 장기 보존용 디지털 유산을 선정하는 일은 수집 목적으로 신규 간행물을 평가하는 것보다는 애초에 단기 사용 목적으로 수집된, 이미 장서에 포함되어 있는 출판물들을 평가하는데 초점을 맞출 것이다.

탄탄하고 잘 개발된 물리적 물질문화의 장서들을 가지고 있는 박물관들은 일반적으로 영구 보존을 위해 수집하며 이를 기준으로 장서 개발에 관한 결정을 내린다. 이제는 이 물질문화가 점점 더 디지털로 가고 있다(처음부터 디지털로 제작된 예술 작품들과 고고학적 유적지들에 대한 디지털 문서화 등 컴퓨터 소프트웨어를 기반으로 한 기계들). 박물관의 물리적 소장품들과 관련한 연구 정보 역시 점차 디지털로 바뀌고 있다. 따라서 박물관에서의 디지털 유산은 처음부터 디지털로 제작된 아이템, 장서에 관한 디지털 정보 또는 디지털화된 정보, 물리적 인공물의 디지털본(디지털 이미지 또는 3D 스캔 등)이라는 범주로 나뉠 수 있다. 이러한 범주화로 인해 박물관들은 일반적으로 첫 번째와 두 번째 범주에 장기보존을 위한 우선순위를 두어야 한다. 두 번째와 세 번째 범주는 또 기관이 작성한 행정 기록들을 포함한다.

박물관에 있어서 메타데이터(물리적 및 디지털 유산에 관한 정보)의 중요성은 아무리 강조해도 지나치지 않다. 이 메타데이터는 물리적 및 디지털 유산이 박물관에 들어오기 전에 생성된 맥락 정보와 박물관 소장 시에 생성된 맥락 정보를 포함한다. 출처 주의(principle of provenance)5도 박물관에 있어서 중요하다.

아카이브들 역시 전통적으로 영구 보존을 목적으로 원본 또는 희귀한 기록물들을 수집하며, 기록물의 생성과 아카이브에 의한 취득 간의 시간 경과에 의존하여 선택 결정에 역사적 관점을 반영했다. 그러나 디지털 포맷, 저장 매체, 시스템 하드웨어, 소프트웨어 시스템들의 급속한 진부화로 인해 선택을 위한 기회의 창이 닫히고 있으며, 그로 인해 기록물이 소실되거나 조기에 수집된 기록물들이 시간의 흐름에 따라 자연스럽게 그 중요성이 “검증”되는 과정을 아직 거치지 못했을 가능성이 있다. 도서관이 수집한 출판 자료는 다수의 사본으로 유통되거나 온라인에서 널리 제공되는 반면, 디지털 아카이브 기록물들은 일반적으로 오프라인에서 일반인이 접근할 수 없는 사적인 시스템이나 서버, 네트워크에 보관된다. 접근과 선택은 그 소유주, 때로는 기록물 이전에 관한 법적 규정을 갖고 있는 정부 기관들과 협상해야 한다. 아카이브는 수집용 기록물을 평가함에 있어서 진본성과 출처, 맥락을 중요시하나, 디지털 기록물은 조작과 복제의 용이함으로 인해 이러한 선택 요소들을 평가하기가 더 어렵다. 아카이브가 수집하여 공적 접근과 연구를 위해 제공될 수 있는 디지털 정보를 법률로 정해놓은 경우도 많다.

선택 환경에 영향을 끼치는 이러한 요소들이 반드시 도서관과 박물관, 아카이브 공동체 서로에게 배타적인 것은 아니다. 사실 일부 중첩되는 측면이 분명히 있을 것이다. 그러나 우리 공동체들의 다양성을 검토함으로써 장기 보존용 유산을 식별하고 선택하는 문제에 있어서 기관들이 직면하는 다양한 문제들을 조명하는데 도움이 될 것이다.

행동은 지역적으로 1: 디지털 유산의 수집 전략


유산기관들은 자신들이 갖고 있는 기존의 접근법들을 디지털 환경에 맞게 바꾸어야 한다. 대부분의 기관들은 수집 활동을 이행하기 위해 다음 전략/접근법 중 하나 또는 그 이상을 채택할 것이다.

망라적 수집

망라적 수집은 주어진 주제 영역, 시기, 또는 지역에서 생산된 모든 자료를 수집하는 것이다. 이 접근법을 사용하려면 상당한 자원이 있거나 집중 영역이 좁아야 한다. 출판사들이 생산한 모든 출판물을 국립도서관에 제출하도록 법을 규정함으로써 해당 국가에서 생산된 모든 출판물의 수집을 목표로 하는 납본이 가장 익숙한 망라적 수집법일 것이다. 그러나 박물관도 특정 시대에 생산된 모든 작품을 수집하고자 할 수 있고, 아카이브도 영향력 있는 공인과 관련된 모든 것을 수집하고자 할 수 있다.

대표적 표본 수집

표본 수집은 장기보존용 자료를 식별하는데 사용되는 또 한 가지 방법이다. 이 방법은 기관이 망라적으로 수집할 자원이나 역량이 없고 특정한 선택 기준에 따른 구분이 문제가 되는 경우에 흔히 사용된다. 이러한 경우, 표본 수집은 대표적인 그림을 그리는 수단이 되어 적은 자원으로 보다 관리 가능한 선정/보존 활동을 가능케 한다. 예를 들어, 국립도서관은 (.dk나 .fr과 같은) 국가 웹도메인 전체를 정기적으로 크롤링하고 여러 다른 시점에서 해당 국가의 대표적인 온라인 상의 모습을 수집하여 보존할 수 있다. 아카이브는 가장 문서화가 많이 된 사례나 특정 연도의 사례들, 또는 특정 알파벳으로 시작하는 사례들만을 보관하는 것과 같이 표본법을 이용하여 정부의 사례 파일들을 선택할 수 있다.

선택

선택법은 보존문서관리자, 사서, 큐레이터와 같은 유산 전문가들이 특정 기준에 따라 자신들의 장서에 추가할 자료를 선정할 때 사용된다. 이 범주는 기관의 유형, 장서 수집 권한, 보유 자원, 수집 가능한 자료의 유형과 양에 따라 크게 다를 수 있다. 선택 기준은 일반적으로 수집 정책에 규정되어 있는데, 다음과 같은 기준을 포함할 수 있다(이 기준들을 통합할 수도 있다).

  • 주제(Subject/Topic). 하나 이상의 주제 영역을 문서화하는데 초점을 맞춘다. 예를 들어, 특정 화가나 지역에 관한 모든 웹사이트, 또는 선거나 예술제와 같은 특정 행사를 문서화하기 위한 웹 크롤링
  • 창작자/기원(Creator/Provenance). 유산의 특정한 창작자 또는 기원에 초점을 맞춘다. 예를 들어, 아카이브는 특정 지역 출신의 저자들에 대한 디지털 기록들을 수집하고, 박물관은 특정 사조와 관련된 예술가들의 작품을 수집할 수 있다.
  • 유형/포맷(Type/Format). 콘텐츠의 유형 또는 포맷(예. 디지털 사진, 음악 레코딩, 영화, 비디오 게임 등) 별로 수집한다.
  • 지역사회 지원과 응집력
  • 디지털 통합

또 지금은 모든 디지털 유산 자료를 수집하고 향후에는 선택 기준을 적용하는, 선택 지연의 형태를 취할 수도 있을 것이다.

행동은 지역적으로 2: 단일 기관에서의 선택 기준 개발


개별 도서관과 아카이브, 박물관들은 디지털 유산이 소실되기 전에 어떻게 그것을 선택하고 식별하고 우선순위를 매겨야 하는가? 기관의 사명과 강령, 그리고 대부분의 경우 물리적 장서에 대한 장서개발정책이 디지털 유산의 평가와 선정을 위한 출발점과 지침을 제공할 것이다. 이들을 이제 새로운 형태의 디지털 표현물에 맞게 바꾸어야 한다.

디지털 유산의 평가는 전통적인 선택정책에서의 원칙과 상당히 동일할 것이나, 이제는 또 새로운 장기적 접근성, 사용 및 보존의 문제들을 고려해야 한다. 기관은 기관의 강령과 서비스 대상에 비추어볼 때 디지털 유산이 갖는 상대적인 중요성을 평가함으로써, 그것의 지속가능성 즉 장기적 접근과 사용을 위해 그것을 보존할 수 있는 역량을 평가함으로써, 그리고 다른 유산기관에서의 제공 여부, 즉 해당 유산이 다른 기관에서 보존될 가능성이 있는지 그리고 그것을 보존하기에 가장 적합한 기관이 어디인지를 고려함으로써 이러한 질문들에 답해야 한다. 이 환경에서 중요성과 지속가능성이라는 개념은 기관의 강령과 자원에 비추어 평가되어야 한다. 타 기관에서의 제공 여부는 유산공동체 내의 다른 기관들을 살펴봄으로써 해당 디지털 유산의 장기적 생존에 대한 위험 수준을 평가하는 것이다. 중단기적으로 소실될 위험이 있는 유산에 특히 주의를 기울여야 한다. 원주민들에 대한 디지털적 표현물과 같이 인류에 포괄적인 중요성을 갖는 디지털 유산을 찾아내어 그것이 위험에 처하기 전에 보존해야 한다.

모든 유산기관이 그 강령과 수집정책, 자원 측면에서 고유하다는 점을 인식하면서 우리는 아래와 같이 디지털 선택 결정에 관한 틀을 만들 수 있는 일련의 단계와 질문들을 마련하였다. 이 방법은 그 목적과 규모가 다양한 각 개별 기관의 필요에 맞게 조정할 수 있다. 이 단계들을 따르지 않는다 하더라도 장기 보존용 디지털 유산의 선택과 관련한 기관의 논의에 출발점이 될 수 있을 것이다.

개별 기관의 선택을 돕는 의사 결정 분지도(分枝圖, Decision Tree)


이 방법은 일련의 질문들을 담은 네 개의 단계로 구성되어, 증거에 기반한 일관된 평가를 가능케 한다.

1단계: 식별

수집 또는 평가할 자료를 식별한다. 그 제목과 창작자, 기원은 무엇이며, 양과 상태는 어떠한가? 어떤 유형의 그리고 어느 정도의 메타데이터가 존재하는가? 필요 시 이 프로젝트의 매개변수들을 정의한다. 단순히 예/아니오 결정으로 충분한가 아니면 다른 자료와 비교하기 위해 상대 평가(고, 중, 저 또는 수치적 평가)가 필요한가?

이 단계에서 내린 결정(그리고 결정 과정)을 문서화/기록하여 보관한다. 이 기록은 언제나 최신 정보를 유지하며 접근 가능해야 한다.

2단계: 법적 틀

기관이 해당 자료를 보존할 법적 의무가 있는가? 디지털 보존 및 장서 개발에 관한 기관의 의무 또는 정책에서 이 자료의 보존을 요구하는가?

  • 이에 대한 답이 ‘예’라면 보존한다. 여기서 긍정적인 답변이 내려지면 이후 단계는 필요하지 않다.

이 단계에서 내린 결정(그리고 결정과정)을 문서화/기록하여 보관한다. 이 기록은 언제나 최신 정보를 유지하며 접근 가능해야 한다.

3단계: 선택 기준의 적용

기관이 해당 디지털 유산을 수집해야 할 법적 의무가 없다면, 그 보존 여부를 결정하기 위해 중요성, 지속가능성, 제공 여부의 세 가지 기준을 사용하여 해당 자료를 평가할 수 있다. 이 기준을 적용할 때는 기관이 볼 때 가장 효율적이거나 효과적인 순서를 따르면 되는데, 일반적으로 평가와 진행이 가장 쉬운 기준부터 시작한다.

3(a) 중요성

해당 디지털 유산의 장기적 가치가 그 보존을 정당화하는가? 그것이 지역사회에 중요한 사회적, 문화적, 역사적, 또는 예술적 가치를 갖는가? 중요한 정보, 콘텐츠, 사용, 전시, 또는 연구적 가치를 갖는가? 이러한 가치들은 기관의 사명 및 강령에 얼마나 부합하며 또 그것을 뒷받침하는가? 자료의 기원, 희귀성, 고유성, 또는 대표성이 이러한 가치들에 영향을 끼치는가? 이 디지털 유산이 보존되지 않는다면 기관의 이해관계자들(이용자, 후원자, 사회)은 어떠한 영향을 받을 것인가?

  • 기관의 강령에 비추어볼 때 이 디지털 유산이 중요하다면, 보존을 고려한다.
  • 이 단계에서 내린 결정(그리고 결정과정)을 문서화/기록하여 보관한다. 이 기록은 언제나 최신 정보를 유지하며 접근 가능해야 한다.

3(b) 지속가능성

이 디지털 유산을 장기적으로 보존하는데 필요한 예산과 자원이 충분한가? 이 유산을 읽고, 이동시키고, 보존할 수 있는 기술적 역량을 가지고 있는가? 이 자료를 다른 파일 포맷과 물리적 운반장치로 이동시키는데 특별한 권한이 요구되는가? 이 유산을 수집하여 보존하는데 필요한 충분한 메타데이터가 있는가? 기관이 이 유산을 연구, 전시, 또는 기타 대중적 기대를 충족시키는 용도를 위해 제공할 수 있는가?

  • 이 질문들에 대한 답변이 대체로 ‘아니오’라면, 보존하지 않을 것을 고려한다.
  • 이 단계에서 내린 결정(그리고 결정과정)을 문서화/기록하여 보관한다. 이 기록은 언제나 최신 정보를 유지하며 접근 가능해야 한다.

3(c): 제공 여부

유산공동체 또는 네트워크 내의 다른 기관들에서 해당 유산이 제공되는지 여부를 고려한다. 이 기관이 그 자료를 보존하는 유일한 기관인가 아니면 동일 사본들이 다른 기관들에서도 보존되고 있는가? 그것이 희귀하거나 고유한가 또는 사본이 다수 존재하는가? 공적으로 가장 잘 사용되거나 또는 혜택이 가장 클 것인가? 다른 기관들에서 위험에 처해 있는가? 이 기관이 해당 유산을 보존하고 제공하는데 가장 적절한 기관이거나 가장 좋은 위치에 있는가? 디지털 유산을 바르게 보존하기 위해서는 어느 정도는 중첩이 필요하다는 점을 유념하자6.

  • 이에 대한 답변이 ‘아니오’라면, 아마도 이 디지털 유산은 다른 기관에서 보존되는 것이 맞을 것이다. 그러나 이 답변은 다른 기준에 비추어 고려되어야 한다.
  • 이 단계에서 내린 결정(그리고 결정과정)을 문서화/기록하여 보관한다. 이 기록은 언제나 최신 정보를 유지하며 접근 가능해야 한다.

4단계: 결정

이 과정에서 생성한 모든 기록들을 모아 검토하고 1-3단계에서 내린 결정을 바탕으로 최종 결정을 내린다. 이 평가/결정에 대한 논리적 근거를 문서화하고 기록한다. 이것은 거버넌스뿐 아니라 향후 재심의에 필요한 주요 정보를 수집한다는 점에서도 매우 중요하다. 1-3단계의 질문들에 대한 답변을 포함하여 이 디지털 유산의 중요성과 그것의 기술적 보존 문제들을 서면으로 기록한다. 이 결정을 내리기까지의 논쟁이 평가 자체보다 더 중요한 경우가 종종 있다. 이러한 논쟁들을 기록하고 또 결정에 대한 기록을 남길 수 있도록 기관의 표준 평가 양식 또는 평가 서류를 마련해야 한다. 이 과정에서 생산된 모든 데이터를 문서화하고 기록하여 접근 가능하도록 제공한다. 평가 또는 결정의 논리적 근거를 문서화하는 일은 거버넌스뿐 아니라 향후 잠재적인 재심의에 필요한 주요 정보를 수집한다는 점에서도 매우 중요하다.

위 방법은 융통적이며, 모든 질문이 모든 기관에 적용되는 것은 아닐 것이다. 선택 기준의 순서도 고정되어 있는 것이 아니다. 예를 들어, 어떤 경우에는 3(a)와 3(b) 단계 전에 3(c) 단계를 평가하는 것이 더 나을 수 있는데, 특히 다른 기관이 더 적절하다는 사실이 자명할 때 그러하다. 그러나 이 방법은 유산기관들이 장기 보존용 디지털 유산의 선택과 관련하여 보다 나은 결정을 내리는데 도움이 될 것이다.

결론

디지털 유산의 장기적 보존은 오늘날 유산기관들이 직면하고 있는 가장 어려운 도전과제일 것이다. 선택 기준과 수집 정책을 개발하여 구현하는 일은 현재와 미래 세대에 도움이 되도록 중요한 유산 자료를 보존하는 첫 걸음이다.

부록 1: 장기적 디지털 보존과 메타데이터의 관리


디지털 유산의 선택은 장기적 보존 및 접근성의 문제와 밀접하게 연관되어 있다. 중요한 디지털 유산 중 일부는 필연적으로 소실되겠지만, 중첩, 적극적 관리, 메타데이터 관리 등 디지털 보존의 우수 관행들을 따름으로써 그 위험을 줄일 수 있을 것이다.

중첩

관련 메타데이터가 포함된 마스터 파일과 같은 중요한 디지털 유산은 여러 개의 사본을 적어도 두 개 이상의 서로 다른 물리적 장소에 보관해야 한다. 유산기관들은 기관 안, 기관 밖, 그리고 분산 클라우드 기반의 저장장치를 혼합하여 사용할 수 있으나, 디지털 원본은 적어도 하나 이상의 장소에 백업해 두어야 한다. 보관 장소는 자연재해나 인재, 경제적 또는 정치적 소요로 인해 소실될 위험이 최소화될 수 있는 곳이어야 한다.

적극적인 관리

유산기관들은 유산의 장기적인 접근성과 무결성을 보장하기 위해 적극적으로 자신들의 디지털 유산을 관리해야 한다. 디지털 유산은 암호 없이, 최소한 무손실 압축으로, 개방적이고 잘 문서화된 파일 양식으로 보존되어야 한다. 이 방법은 디지털 객체의 적극적 관리와 관련하여 유산기관들에 적극 권장된다. 저장은 기관 서버에서부터 이동식 매체(예. 자기 디스크, 광자기 매체, 자기 테이프 등)에 이르기까지, 두 가지 이상의 저장매체 유형을 사용해야 한다.

시간 경과에 따른 시스템 오류는 저장된 디지털 유산에서 중요한 정보의 소실을 야기할 수 있다. 다수의 기관들은 디지털 데이터를 읽고, 오류 수정 기술을 이용하여 오류를 점검하고, 새 매체에 다시 쓰기를 하는 미디어 리프레시(media refresh)를 주기적으로 실시하여 이를 예방하고자 노력한다. 디지털 데이터의 소유자들은 소프트웨어 오류를 피하기 위해 흔히 데이터 스토리지 액세스를 위한 표준 기반 프로토콜을 이용하는데, 이 프로토콜에서는 서로 다른 저장 장소들이 해당 소프트웨어의 각기 다른 구현방식을 구동한다. 따라서 데이터의 무결성과 신뢰성이 단일한 구현의 무결성과 신뢰성에 의존하지 않는다.

메타데이터 관리

메타데이터는 흔히 “데이터에 관한 데이터”로 정의되는데, 이것이 맞는 말이긴 하지만 아주 정확하지는 않다. 유산기관의 경우, 메타데이터는 보존되고 있는 해당 디지털 자료를 장기간에 걸쳐 접근, 판독, 사용하고 보존하는데 필수적인 (디지털 또는 물리적 형태로 된) 모든 정보여야 한다. 메타데이터는 미래에 디지털 유산을 보존하고 접근하는데 필요한 정보를 기관에 제공한다.

유산기관들은 일반적으로 디지털 유산의 장기적 보존에 중요한 세 가지 유형의 메타데이터를 보존한다.

  • 구조적(기술 담당자가 디지털 콘텐츠를 읽는데 필요함)
  • 서술적(서지적, 아카이브적, 또는 박물관 맥락적 정보를 포함한 것으로, 시스템에 의해 생성되거나 유산 전문가, 콘텐츠 제작자 및/또는 사용자들이 생성할 수 있음)
  • 행정적(장서에 포함된 디지털 객체의 관리를 문서화함)

디지털 유산이 “콘텐츠”라면 메타데이터는 “맥락”을 제공한다.

디지털 메타데이터에는 다섯 가지의 기본적인 기능 요건이 있다.

  • 식별(Identification): 메타데이터는 각 디지털 객체가 고유하고 명확하게 식별되도록 해야 한다. 이를 위해서는 일반적으로 각 아이템에 국제적으로 고유한 식별자(globally unique identifier)를 할당해야 한다.

  • 장소(Location): 메타데이터는 각 디지털 객체의 위치를 찾아 불러올 수 있도록 해야 한다. 이 장소 데이터의 장기적 유효성을 보장하여 시스템을 이동하거나 갱신할 때 아이템들이 소실되지 않도록 해야 한다.

  • 서술(Description): 디지털 객체의 재호출(recall)과 해석(interpretation)을 돕기 위해서는 서술(description)이 필요하다. 서술적 메타데이터는 콘텐츠에 관한 데이터와 맥락에 대한 데이터라는 두 개의 범주로 나뉜다. 아이템의 콘텐츠에 관한 데이터는 검사와 자문에 의해 흔히 재생성될 수 있다. 그럼에도 불구하고 리소스 검색을 위한 검색 도구로써 유용하다. 언제, 어디서, 누구에 의해 아이템이 생성되었는지, 그것의 용도는 무엇이었는지, 전체 자료에서의 위치 등 맥락에 관한 데이터는 한 번 소실되면 재생성하기가 훨씬 더 어렵다.

  • 가독성(Readability): 디지털 객체의 구조, 포맷, 암호화에 관한 메타데이터는 장기간에 걸쳐 가독성이 유지되도록 하는데 필요하다. 이 기능 요건은 특히 중개기술이 없이는 읽을 수 없는 디지털 객체에 중요하다. 이 메타데이터는 관련 표준을 식별하고 디지털 리소스의 완전한 렌더링에 필요한 기술 문서, 전거 파일, 기타 관련 자료에 대한 참조를 제공한다. 파일 포맷 캡슐화에서부터 데이터의 표현 및 암호화에 이르기까지 디지털 객체의 모든 레이어가 해석될 수 있도록 주의를 기울여야 한다.

  • 권리 관리(Rights management): 각 디지털 아이템에 적용될 수 있는 권리와 사용 및 제약 조건이 메타데이터에 기록되어야 한다. 이 메타데이터는 적용 가능한 법률과 협약을 명시하고, 저작권자와 관련 법률 문서 및 계약서 등에 대한 참조를 제공해야 한다.

메타데이터의 저장

많은 디지털 파일 포맷들은 파일 자체에 메타데이터가 삽입되도록 허용한다. 이것은 데이터와 메타데이터가 연결되어 있도록 하는 장점이 있다. 그러나 메타데이터는 또 그것이 서술하는 디지털 리소스와 별개로 저장될 필요가 있는데, 이는 위에서 설명한 기능 요건들을 충족시키는데 필수적이다. 예를 들어, 암호화된 디지털 아이템의 경우 암호가 해당 아이템 자체에만 삽입되어 있다면 그 아이템은 읽혀질 수 없다.

메타메타데이터(Metametadata)

메타데이터의 신뢰성과 진본성을 명확히 하기 위해서는 그것의 출처와 컴파일된 방식에 관한 데이터가 필요하다. 이 메타데이터는 언제 누구에 의해 컴파일되었는가? 이 메타데이터는 자동으로 또는 수동으로 하비스팅되었는가? 어떤 도구와 테크닉이 이용되었는가? 미래에 해당 디지털 정보를 검색하고 이해하기 위해서는 맥락화가 반드시 필요하다.

부록 2: 용어 정의


이 정의들은 부록 3에 나열된 참고자료들에서 발췌한 것이다.

디지털 유산의 진본성은 기록 또는 아이템의 신뢰성, 즉 원본 객체의 품질 또는 온전히 문서화된 절차에 따라 원본으로부터 제작된 신뢰 가능한 사본의 품질을 말하는 것이다.

콘텐츠 선택은 그 중요성과 지속적인 문화적, 과학적, 증거적 가치 등을 평가하고, 규정된 원칙과 정책, 절차, 기준에 따른 보존 및 접근 가능성을 평가함으로써 어느 아이템 또는 자료가 보존 가치가 있는지를 결정하는 과정을 말한다.

디지털 유산은, 처음부터 디지털로 제작되었거나 또는 다른 포맷으로부터 디지털화되었건 간에, 컴퓨터에 기반한 자료로 구성되며, 서로 다른 공동체와 산업, 부문, 지역들에서 유래하고, 장기간에 걸쳐 그것의 진본성, 접근성, 활용성을 확보하기 위해 적극적인 보존법을 필요로 하는 유산을 의미한다.

유산은 과거로부터 물려받은 것, 오늘날 우리가 함께 살고 있는 것, 그 중요성과 가치로 인해 세대를 넘어 전달되어야 하는 것을 말한다.

메타데이터는 아이템 또는 정보 자원을 서술하고, 설명하고, 위치를 지정하고, 또는 장기간에 걸쳐 그것을 이해하고, 검색하고, 사용하고, 관리하고, 통제하고, 보존하기 쉽도록 하는 정보를 말한다.

부록 3: 참고자료(원문 참고)


다음 목록은 우리가 일부 선택한 자료들로, 이외에도 많은 자료들이 있다.

2015 National Agenda for Digital Stewardship, 2014

CENL/FEP Statement on the Implementation of (Statutory and Voluntary) Deposit Schemes for Non-Print Publications, FEP and CENL, 2012

Digital Legal Deposit, an IPA [International Publishers Association] Special Report, 2014

Bonnel, Sylvie and Oury, Clément, “Selecting websites in an encyclopaedic national library: a shared collection policy for internet legal deposit at the BnF”, 2014

Caroline Brazier, British Library, “http://library.ifla.org/222/1/198-brazier-en.pdf”, 2013

British Library, British Library digital preservation strategy 2013 – 2016, 2013

Bailey, Catherine A. “Past Imperfect? Reflections on the Evolution of Canadian Federal Government Records Appraisal”, Archivaria 75, 2013.

Canada, Canadian Heritage Information Network,Digital Preservation Toolkit, 2013.

Kenneth Crews, “Study on Copyright Limitations and Exceptions for Libraries and Archives”, Standing Committee on Copyright and Related Rights, World Intellectual Property Organization, Twenty-ninth Session, Geneva, December 8 to 12, 2014

Cunningham, Adrian, “Recent Developments in Standards for Archival Description and Metadata” IASA Journal no 16, 2000.

Digital Preservation Coalition, Digital Preservation Handbook Definitions and Concepts, 2008

Duff, Wendy and van Ballegooie, Marlene, Archival Metadata, DCC Digital Curation Manual, 2006.

Harvey, R. "Appraisal and selection" DCC Digital Curation Manual (2006) (which aims to offer a generic selection framework)

IFLA, IFLA Statement on Legal Deposit, 2011

InterPARES 2 Project, “Preserver Guidelines - Preserving Digital Records: Guidelines for Organizations”, 2007

InterPARES 2 Project, InterPARES 2 Project Dictionary, 2015.

ISAD(G), “General International Standard Archival Description 2nd Edition”, Ottawa: ICA, 2000.

ISO 15489-1 Information and documentation – Records management – Part 1: General, ISO 2001.

ISO,ISO 16175-1:2010(E) Information and documentation – Principles and functional requirements for records in digital office environments – Part 1: Overview and statements of principles, 2010.

ISO,Information and documentation — Statistics and Quality Indicators for Web Archiving, 2013 (draft available)

Koerbin, Paul, Colin Webb, and David Pearson, “Oh, you wanted us to preserve that?!' Statements of Preservation Intent for the National Library of Australia's Digital Collections”, D-Lib Magazine, 2013, Volume 19, Number 1/2

Lariviere, Jules, “Guideline for Legal Deposit Legislation”, UNESCO, 2000

Library of Congress Digital Preservation Webpage

NYARC Reframing Collections for a Digital Age Report from Consultant No. 2, 2012, USA

Netherlands, Cultural Heritage Agency, “Assessing Museum Collections: Collection Valuation in Six Steps”, 2014.

Niu, Jinfang "Appraisal and Selection for Digital Curation", International Journal of Digital Curation, 2014 Vol. 9 Issue 2, 65-82.

Niu, Jinfang, “An Overview of Web Archiving”, D-Lib Magazine, 2012, Volume 18, Number 3/4.

Noonan, D.W. “Digital preservation policy framework: A case study", Educause Review 2014

Paradigm Project,Workbook on Digital Private Papers, United Kingdom, 2005-2007

Sheridan, John, Amanda Spencer, and David Thomas, “UK Government Web Continuity: Persisting Access through Aligning Infrastructures”, The International Journal of Digital Curation Issue 1, Volume 4, 2009.

Society of American Archivists, A Glossary of Archival and Records Terminology, 2005

The State of Digital Preservation: An International Perspective, Conference proceedings, Washington D.C., April 24-25, 2002. Washington, DC, 2002

UBC/UNESCO Vancouver Declaration The Memory of the World in the Digital Age: Digitization and Preservation, Canada, 2012

UNESCO, Charter on the Preservation of Digital Heritage, 2003

Van der Werf, T. and B., ‘The paradox of selection in the digital age’, 2014

Helmus, W., “Survey on selection and collecting strategies of born digital heritage - best practices and guidelines”, 2015

Verheul, I. “Networking for Digital Preservation: Current Practice in 15 National Libraries”, München, 2006

원문 보기

The UNESCO/PERSIST Guidelines for the selection of digital heritage for long-term preservation (ifla.org)



담당부서 : 국제교류홍보팀 (02-590-0797 )
위로