大量數位化資料的儲存管理、備份,以及長久保存的問題與需求益形重要且刻不容緩,必須有一致的協調機制共同研擬與實施最佳的長久保存方案並永續經營,以確保各單位所累積珍貴數位化資產與價值的長久保存與發揚。
數位典藏異地備份儲存資源網路建置計畫 目的為建立穩定、安全、存續性高的儲存管理系統 (persistent repository system) ,提供資料安全、自動的複製、分散存放與快速存取,並逐年擴展為以邏輯保存 (logical preservation) 與實體保存 (physical preservation) 並重、具備自動轉製 (transformation) 與轉錄 (migration) 能力,以建立存續性高、可達長久保存目的之儲存系統基礎架構。
數位典藏異地備份儲存資源網路建置計畫 欲建置配合整體數位典藏計畫長久保存需求之分散式儲存與備份機制,同時提供儲存設備管理與數位資訊管理整合之儲存資源管理。中研院數位典藏計畫儲存及備份系統目標如下:
l 儲存設備管理須與資料管理密切整合、一併考量,成為儲存資源管理。
l 應安全完整的保存資料,更應留存完整的內涵後設資料以及各種索引等加值資訊
l 具備異地備援的復原機制,以及可配合資料管理單位動態調整的安全控管功能。
l 提供一致化的使用界面 ( 不論是本地儲存設備或遠端系統內的資料,抑或系統架構變動或技術的複雜性,使用者均無須調整使用模式 )
l 快速的資源搜尋以及資料儲存與擷取。
l 促進數位化資料的永久保存,可不隨時間、技術、軟硬體設備、儲存媒體等演進而變動。
異地備份規劃之考量
l 依各 單位 計畫之基礎建設情形,各 單位須 先有一個能滿足其數位典藏需求的 主要儲存 設備,或找尋可提供更佳服務品質的就近環境, 作為典藏成果長久 保存之基礎 。
l 異地備份 架構之主要瓶頸在於各 單位至異地備 份 點之網路頻寬。因此在遠端 異地備援點之外, 應先有一主要備份點, 同時亦應逐年改善基礎架構。
l 各典藏單位對於異地備份點之存 取速度,將與主要備份點有差距,視 單位至 異地備 份 點間之基礎架構而定,此差距為異地備 份 點選擇之主要依據。
l 主要 備份點與異地備份點間 ,應可視主要備份點狀況,自動選擇可最快捷取 資料之來源,省去人為操作維護之困擾與負擔。
l 長久保存有賴於系統化與標準化的作業程序,善用適當的儲存基礎架構與技 術,則可大幅降低長期維運成本與可能之誤失。並確保 不隨時間、技術、儲 存環境等演進而失效
l 妥適的設備存放環境、穩定的儲存系統節點、即時的整體效能管控與故障排 除,則為各單位長久保存的必要維運成本
數位典藏作業流程
規劃方案 l 建置儲存資源網路
l 每個節點為以 10TB 的磁碟陣列為基本單元 (Storage Brick) 構成的 儲存系統,儲存最近一年所產生的資料,及必須提供線上即時存 取服務的數位化資料為主。
l 所有資料都在該網路上儲存 至少 二份 ( 一份在所屬的本地端儲存資 源節點,另一份則在該網路上的另一節點中,達成異地備 份 機制 ) , 中研院 並另製作一份備份存於磁帶中長久保存。
l 最終目標為於此儲存資源網路中異地儲存三份
l 維持資料安全性與傳輸效能。
l 典藏資料管理權與儲存系統分開,資料擁有單位保有完整管理權
系統架構
異地備份之整合
l 儲存資源虛擬化,透過各典藏單位共同合作,建立分散式儲存資源網路
l 儲存節點單位配合事項
n 各儲存節點須協助提供相關設備之置放空間與環境,所有設備均 置於一座標準 19 ” 機櫃中 ( 寬 x 深 x 高約為 60x100x206 cm ,機櫃 正面及背面與其他設備或壁面間至少應保留 100cm ,以便散熱通 風及工作維護 )
n 機櫃中包含下列設備,並保留了未來擴充之空間 。
u Unix/Linux server 一部
u Gigabit Ethernet Network
u 容量 10TB Disk Array
u 不斷電系統 UPS 容量 3000 VA
l 各單位是否應使用相同架構與相同技術 / 系統?
n 使用相同系統可直接相互 federation, 資源共享與相互備援最為容 易,但並非絕對必要。
各單位硬體設備
Middleware- Storage Resource Broker (SRB)
美國聖地牙哥超級計算中心的儲存資源仲介軟體( SRB )是為用途較廣的資料網格軟體之一。 SRB 為使用者提供了一個存取系統、檔案系統、資料庫系統等多種異質存儲系統的統一介面,涵蓋了異質儲存系統的特性。它支援廣域網路環境下多種資料源的存取,提供了資料複製、複本資料的存取、檔案的彙集、分散式檔案的邏輯集合等功能。目前 SRB 系統已經被幾十個單位使用,包括英國的國家網格、美國的聯邦資料庫以及台灣的數位典藏計畫、大氣科學計畫等。
資料儲存技術開發及整合範圍
l 標準的數位化作業流程
l 建立分散式數位資料儲存及備份資源架構
l 建立資源管理系統
l 建立整合索引架構
l 建立整合性數位媒體資料庫
l 建立用者管理及個人化服務介面
l 建立相關應用程式整合介面
永續經營
l 確保珍貴資產與知識的永續可用性與價值發揚
l 逐年擴充儲存設備
l 與後續應用之整合典藏管理
n 學術研究應用
n 教學與展示
n 加值應用
l 有助於整體目標之
n 新技術與解決方案之研析導入
n 降低維運成本與風險服務品質
l 稽核與管理
|