探討數字檔案館建設面臨的難題
摘要:數字檔案館是數字信息時代檔案傳遞和利用的新途徑。數字檔案館與傳統檔案館相比有著極大的優越性,然而它也存在著不少缺陷。在數字檔案館的建設中面臨著諸多不容樂觀難以解決的問題,對此我們要有清醒的認識。本文提出了數字檔案館建設所面臨的10個方面的問題。

關鍵詞:數字檔案館/問題
【 正 文】
隨著現代信息技術的迅速發展和大量電子文件的產生,數字檔案館的研究和建設成為我國檔案界關注的熱點。數字檔案館與傳統檔案館相比,有著豐富的數字化資源、海量的存儲、便捷的檢索、快速的傳輸、高度的開放、信息的共享等優點,使傳統的檔案館望塵莫及。然而,它也不可避免地存在一些缺陷和不足,有的甚至可能是致命的缺陷。因此,我們應該清醒地認識到數字檔案館存在的缺陷,數字檔案館的建設還存在著諸多的難點和問題亟待深入研究解決。如果對存在的問題視而不見,或掉以輕心,必將給未來的檔案事業留下巨大而無法彌補的遺憾。
1 數字檔案的憑證價值問題
檔案的基本價值有兩方面,憑證價值和參考價值,而尤以憑證價值最為重要,雖然,“目前人們對數字化檔案具有參考價值這一點已無疑義,然而,由于一系列技術和立法問題還未解決,數字化檔案目前還不具備法律憑證效力”[1]這無疑使數字檔案的作用大打折扣。因此,確認數字檔案的憑證價值就成為數字檔案館建設中無法回避的難題。目前,主要存在以下幾方面的問題:
1.1 認識上的問題。數字檔案不具備“白紙黑字”的直觀性,必須依賴特定的計算機設備加以解讀。數字檔案完全脫離了以往人人對檔案“原件”的認識,從而引起人們對其原始性、可靠性的懷疑。而且,有些數字檔案即使載體保存完好,內容亦可能在無形中丟失,它不像紙質檔案那樣載體與內容“一損俱損,一榮俱榮”。數字檔案與以往其他載體的檔案都不一樣,從甲骨檔案到簡牘檔案再到紙質檔案,只是載體的耐久性有差別,并沒有改變其直觀性,而數字檔案的非人工識讀性與其他載體的檔案有著質的區別。要確認數字檔案的憑證價值,恐怕不僅僅是改變觀念的問題,要真正認識數字檔案,確認其憑證價值,可能還需要走很長的路。
1.2 技術上的問題。數字檔案是高新技術的產物,它給人們帶來極大便利的同時,也給人們留下了困惑與難題。其一,數字檔案具有易復制、修改、刪除的特點,使得檔案“原件”的概念變得難以確認。其二,計算機硬、軟件技術不斷更新換代,迫使數字檔案必須不斷適應新的“生存環境”,不斷地變換載體、格式,因而無法通過載體、格式的鑒定來判定其原始性。其三,數字檔案不再具有特定的字跡,人們可以根據需要以不同的字體、字號將其輸出,傳統的字跡鑒定技術無法分辨數字檔案的原始性。其四,數字檔案對背景信息和元數據具有很強的依賴性。“電子文件的背景信息常常與文件內容信息相分離保存,一旦失去背景信息,文件的內容即便仍有意義,但也不再具有憑證價值。元數據是電子文件、電子檔案所特有的,“元數據由于其隱含性而易被忽視,而元數據一旦丟失或破壞,電子文件的原始性就會改變。”[2]
1.3 管理制度上的問題。“傳統檔案之所以具有憑證價值,在一定程度上取決于嚴格的管理制度”,而目前“從電子文件的生成到歸檔都缺乏十分規范的程序化管理,缺乏嚴格而科學的標準體系和業務管理制度,一些標準、制度雖已制定,但全面推行尚需時日”[3]而且也有一定的難度。
2 數字檔案信息的長期存取問題
數字檔案信息的長期存取問題是數字檔案館建設的一個具體而又棘手的難題。“據報道,美國航空航天局在20年前發射的‘海盜’火星探測器上的計算機中,已經有20%的數據完全丟失,還有大約4000卷的統計數據因存儲的格式模糊無法讀出,程序員也無法保證將其恢復”。[4]數字檔案信息長期存取所面臨的主要問題有:
2.1 存儲的介質材料。“現代介質的存儲設備還不可能解決計算機數據存儲問題”。[5]一般說來,磁盤的壽命是3~5年,光盤也不過30年左右,與能保存千年以上的紙質載體相比,其壽命相差甚遠,而且它還要受到溫度、磁場、記錄存儲格式、硬件配置等多方面的影響,10年前還經常使用的5.25英寸的軟盤,現在已經沒有一臺普通電腦可以讀出來。
2.2 機讀語言格式。“計算機語言平均每三個月就會問世一種,而語言之間的互換大部分存在問題。很難想象,若干年以后,我們用現行的機器語言描述的數據,還能百分之百的還原”。[6]
2.3 對設備的依賴。數字檔案必須依賴于計算機設備才能讀出,這個特征對其長期存取帶來很多問題:“如設備發生故障、系統癱瘓,電子文件就讀不出來;電子文件對其它設備環境的不兼容性,使其只能在某種設備上處理,而不能在其它設備上處理;不同軟件環境形成的電子文件存貯在載體上,有時難以互換;電子文件加密后,不解密就無法識別;技術設備更新時,不及時解決格式轉換問題,也無法讀取等等”。[7]
3 數字檔案的失真問題
“檔案數字化工作的生命線在于其能夠保持檔案原貌”。[8]然而,“就目前的研究水平而言,還難以保質保量地完成館藏檔案數字化的任務。如已研制出的OCR掃描輸入技術,其平均識別率是95%。這對于追求最大程度真實性的檔案來說無疑是致命弱點”。[9]數字化的主要方式是掃描加工,在這一過程中造成數字檔案失真的原因還有以下幾個方面:其一,技術參數選擇不當。針對不同色調、紙質和字跡,有時需調整不同的技術參數,如分辨率、明暗度、對比度等,選擇不當會直接影響掃描的質量,造成信息丟失、圖像模糊或產生額外信息,客觀上造成檔案原貌的改變。其二,工作失誤。檔案掃描是大量的重復勞動,難免有時失誤。如掃錯檔案或打錯順序,或存錯,或在建索引時鏈接錯誤等,如不及時發現,將直接導致數字化檔案失真。其三,轉換過程中的失真。在進行數字檔案的遷移或在提供利用時,往往需要將掃描后形成的圖像文件轉換成另一種格式的文件,如果格式選擇不當,同樣會導致數據發生變化。
4 數字檔案信息的安全問題
安全問題是計算機網絡世界最為頭痛的難題,也是數字檔案館中的重大難題之一。數字檔案館雖然被稱之為“館”,但它的存在更仿佛是一個巨大的沒有警察的自由市場,給不法分子帶來可乘之機,主要表現為:其一,計算機病毒。網絡信息安全的最主要的敵人就是計算機病毒。“國外有人估計,現在計算機病毒的傳染每兩個月增加1倍。網絡病毒的泛濫已對計算機網絡系統構成嚴重的威脅”。[10]其二,計算機黑客。由于網絡的加密性和匿名性,使入侵者難以被發現。黑客對信息資源的攻擊,不僅僅是好奇和自我挑戰,程序設計高手可以篡改系統控制參數。其三,有竊取行為的間諜活動,窺視其機密信息進行復制或擴散。其四,有意破壞,摧毀系統的信息處理功能或破壞電子通訊裝置。其五,人為或偶然事故造成的威脅。如工作人員操作失誤而產生的不可預知的事件、網絡系統軟件硬件的故障、電子系統故障引發的系統問題等,所有這些,都使數字檔案信息的安全變得十分“脆弱”。
5 數字檔案館建設的諸多技術問題
【探討數字檔案館建設面臨的難題】相關文章:
數字檔案館建設面臨的難題03-18
綜合性檔案館館藏檔案數字化鑒定探討03-20
對數字化檔案館的初步研究02-28
數學教學面臨問題與對策探討論文03-05
城市品牌建設思路探討03-23
數字資源長期保存的關鍵問題探討03-20
關于建設初年折現系數的探討03-21
移動在線計費建設方案探討03-15
地方文獻數字化及在我館實踐的探討03-18
基于對學校校園網建設的探討03-03