數位典藏國家型科技計畫電子報 第六卷第十一期
專題報導
尋回散佚在海外的台灣魚類模式標本(一)
「穿越歷史長河—文明科技四千年」特展專題報導:回到從前—古意互動區介紹
數位典藏大專院校推廣研習講座-澎湖場次會後報導
數位典藏大專院校推廣研習講座-台中場次會後報導
分享園地
M型社會的助理焦慮
「數位典藏國家型科技計畫電子報」稿約
最新消息-國內
歡迎報名11月21日「數位典藏品質管理研討會」
「數位典藏與數位學習國家型科技計畫:97年度公開徵選計畫說明會」台南場將於96年11月16日舉行
歡迎參加「2008參加紐約授權展計畫」心得交流媒合會
歡迎參加「數位」近用,「典藏」授權:數位典藏公眾近用與授權使用研討會
數位精品
談清代科場舞弊——以史語所藏內閣大庫檔案為例
計畫簡介
數位典藏海外推展暨國際合作網路推動計畫-數位臺灣文化入口網子計畫
 
計畫簡介 >
上一篇 | 返回電子報
 
數位典藏海外推展暨國際合作網路推動計畫-數位臺灣文化入口網子計畫
 
數位臺灣文化入口網子計畫/賴昆祺

1. 背景
台灣數位典藏計畫國家型科技邁入第二期,成立「國際合作」分項計畫,專理數位典藏國際合作事宜,主要目標為推動典藏成果國際化、建立國際合作網路,其中一重要目標為典藏成果國際化,展現臺灣文化與生物多樣性。主要理念為藉由第一期計畫中具主題性及獨特性之菁華成果(含出版品與網站)英文化,透過數位台灣文化入口建置與推廣,提供國際專業社群瞭解台灣數位化成就(包含內容與技術),創造文化流通與國際接軌,同時提昇台灣在各學術主題之國際研究能見度。

 1.1 漢學優勢
 台灣在全球華文市場及漢學研究上,皆佔有一席之地,「漢籍典藏」電子化及數位化更是台灣優於各國的強項之一,累積豐碩的成果,如「漢籍電子文獻」、「珍藏善本古籍」、「檔案」、「古文書」、「拓片」、「考古遺物」…等等,美、日、英、法、德、韓、越等學術界亦強烈表達與我國合作意願,而且東亞國家處理歷史文獻,也皆向我學習或尋求合作。
 1.2 生物多樣性國際合作模式
 2001年開始中研院生物多樣性中心配合行政院「生物多樣性推動方案」,並與全球多樣性資訊機構GBIF(Global Biodiversity Information Facility)接軌,建置「台灣之生物多樣性資訊機構」TaiBIF(Taiwan Biodiversity Information Facility, http://taibif.org.tw)亦為GBIF 的台灣國家節點網站,負責整合台灣地區生物多樣性之相關資訊,包含物種名錄、專家名錄、物種基本解說、圖片、特有種、外來入侵種、台灣陸域與海域生物分佈、生物多樣性文獻資料、地理資訊與環境資訊及相關機構、團體、計劃、景點、生物資料庫及出版物…等等各類資料,提供研究學者及社會大眾豐富的案例庫與交流機會。並採用GBIF 資料分享工具DiGIR (Distributed Generic Information Retrieval)及其共同溝通之標準Darwin Core,達成資料相互交換之目標,已成功分享國內22萬餘筆資料,且多次參與GBIF理事會與節點委員會議,建立良好互動與溝通管道。

因此本計畫將善用漢學優勢與現有生物多樣性國際合作模式,將台灣成果與經驗宣傳至國際,推動台灣深入重要國際數位典藏相關組織,主導國際合作計畫,取得數位典藏國際合作決策地位。

2. 目的
本子計畫之總目標在於建立數位典藏專業英文文化入口網(Expert-level English cultural portal)。經由入口網與國際同步、傳播文化與科技的優質創新構想及具體作法,營造商業網站之外的自由交流與理念對話空間。專業入口網將著重於典藏數位內容的工作流程與成果,並將知識工作與數位科技相結合,創造流通與交換的文化經濟。
入口網站建置方面,將規劃以館藏層級(圖館資訊學專業用語為「資源合集層次」,collection level)為單元彙整多元的目錄與分類架構,已展示數位典藏計畫第一期中具主題性及獨特性之菁華成果(包括典藏成品、網站與出版品),向國際社會推廣數位典藏與數位學習成果,同時提昇台灣在各學術主題之國際研究能見度。本計畫所有成果將配合主軸一拓展台灣典藏分項計畫之規劃,將典藏成果以主題式、多樣性方式呈現,並與網路核心平台計畫項下負責之聯合目錄、公共展示系統統整後,再由本分項之子計畫一協助必要資訊英文化,最後整體於「數位典藏專業英文入口網」呈現與推廣,並做為整合數位典藏資料之入口網(圖1)。
數位典藏資料與國際接軌策略可分兩種模式進行(參考圖2),本年度僅以生物多樣性相關網站或已有確定合作關係網站進行國際接軌,其他主題留待98年後再執行。與國際交流途徑如下:
 (1) 透過文建會「文化台灣入口網」與國際世界文化入口網(Culture.mondo)接軌;或藉由主題性網站「台灣生物多樣性資訊網」與全球生物多樣性資訊機構(GBIF)接軌,落實與國際接軌。
 (2) 單一學門網站利用現有或由子計畫支援建立之典藏網站與同性質國際網站接軌。

圖1. 二期計畫中各分項計畫與相關計畫下之各子計畫分工及整合關係圖


圖2. 數位典藏計畫與國際交流示意圖

本計畫總目的包括:
 1. 建立單一之入口網(英文為主要外語),以整合數位典藏資源。
 2. 國際交流:與世界文化入口網(culturemondo)及全球生物多樣性機構(GBIF)建立資料交換之節點(Node),亦協助各子計畫所建置之主題網站與國際相對應之主題網站交換資料
 3. 蒐集及整合國內各部會、機構非典藏計畫所建置之數位資料庫
 4. 新技術與規範的引入與研擬國際資料交換格式
 5. 建立國際合作的模式樣版與規劃營運模式

以下僅針對文化入口網規劃介紹:

3. 文化入口網規劃
數位典藏計畫一期成果已公開網站多達 100 個以上,以資料內容而言,可分成生物多樣性、博物館群、生活藝術、科普教育…等不同類群的資料,整合這些網站使其相互連結、形成一個完整的網絡,這樣的構想透過聯合目錄與公共展示系統已經逐步形成,接續擴大典藏品曝光度與國際接軌,必須有單一入口網站成立,透過搜尋方式,或不同層次的目錄瀏覽,可以輕鬆找到想要的內容,達成過整合台灣數位化資源與國際接軌之目的。
數位典藏專業文化入口網的技術規劃初期以館藏層級(圖館資訊學專業用語為「資源合集層次」,collection level)為單元彙整多元的目錄與分類架構,加強搜尋方式(如Google like),初期規劃以提供關鍵字(包括:生物學名或典藏品名稱…等)與分佈地理位址作為檢索的索引,透過這兩個索引初步整合各資料庫與網站,後期再加逐步上本體論(Ontology)與語意網(Semantic Web)的概念與技術,以達最終知識的分享與再利用的目的。
入口網內容策劃將提供精緻典藏品與相關文化網站的優質創新範例,及整理國內未參與數位典藏計畫之各部會其他數位文化資源,加以介紹傳播。就資料內容而言,因數位典藏計畫的參與機構眾多,各子計畫所推動執行的典藏內容異質性甚大,涵蓋各類自然與人文的領域。以下就重要網站內容、資料轉換與資訊技術分別說明:

 3.1網站內容
 本計畫內容將以整合國內數位典藏資料,透過網路核心平台計畫與國合分項子計畫一共同合作蒐集數位典藏中精緻典藏品,每一個別物件(如書畫、地圖、標本…等物件)為單位(item-level),並建立以館藏層級(collection level)為單元的方式介紹精緻典藏品與相關連網站,如此更能凸顯個別物件在入口網站中的關係及其相互之間的意義。利用collection level方式進行跨機構跨部會之資料整合,如:生物多樣性之資料為主,統整中央研究院、國立自然科學博物館及台灣大學…等機構之生物多樣性資料;如:歷史檔案資料庫為主,統整中央研究院、國史館、國立故宮博物院、國立台灣文獻館、國立台灣大學等機構之各類明清及近現代檔案。未來將配合參與機構之成果逐步加入其他主題小組,希冀能提供有效的跨領域知識內涵間之關聯與整合,以服務國內相關之典藏單位、學界、政府機關及民間等等。其重點工作包括:
 (1) 調查與規劃入口網站架構,並與參與子計畫二的成員共同規劃網站架構,可正確的呈現各計畫成果。
 (2) 整理國際英文內容:聘用臨時工整理國際上文化相關議題英文內容,並輸出至文建會自有預算建置文化台灣入口網。
 (3) 清點曾參與數位典藏文化相關學者著作清單。
 (4) 輸入網路核心平台成果,製作英文觀點內容:與分項五網路核心平台共同訂定典藏品的collection level的架構圖,並收集非數位典藏網站或典藏品的項目,對應至入口網的架構。
(5) 精品看世界:數位典藏計畫中蒐集銅器、玉器、陶瓷、漆器、珍玩、書法、繪畫、善本古籍、生物標本、古地圖…等等精品,此蒐藏更是中華文化蒐藏特色之一,擬請各領域專家學者針對典藏精品專文介紹,將極具有典藏價值文物表現,促進優質文化的交流賞析。
 (6) 語言(多語資訊指引):本入口網站以英文內容為主,但能提供網站介紹的多語言功能,預計完成日文、法文及拉丁等語系文字說明。

 3.2資料轉換
 國合分項子二數位典藏專業文化入口網將以專業社群為服務對象,初期將建立生物多樣性國際合作模式,再將此模式推廣至其他主題。現行聯合目錄以 Dublin Core(DC) 為格式,要求各參與計畫將成果匯出,雖然15個欄位中包含關聯(Relation)、來源(Source)、權限(Rights)等資訊,但對於生物主題中大量的標本典藏,如分類階層(Taxonomical Hierarchy)、地理分布(Geographical Distribution)、模式地位(Type Status)等有利於進行整合研究的資訊被迫加上文字標籤放在DC的主題、描述單元內(如圖3),如此,目前數典第一期的動植物主題資訊僅有線上展覽用途,無法以生物多樣性的慣例安排呈現及配合GBIF後設資料進行國際接軌,遑論在資料大量累積後,能具有支援學術研究的潛力。

圖3. 轉換成Dublin Core之XML生物標本資料

 本文化入口網將現有聯合目錄中約20萬筆資料(包含生物多樣性的標本及觀測資訊),以國際慣用格式 Darwin Core(DwC)為交換標準,將一期已經匯入聯合目錄的資料,設計分析轉換機制(圖4),將DC規格的資訊匯出後以DwC規格匯入本計畫建置文化入口網(TaiBIF單元),對於二期資料將配合生物主題小組新規劃資訊平台(以Darwin Core為核心欄位),再匯入文化入口網。對於在二期計畫中提供資料的單位而言,因為大部分的欄位均為生物多樣性領域人士所熟悉,使用 Darwin Core 將可免去許多思考欄位如何對應的困擾。

圖4 以MXL進行資料格式轉換與匯出

 以九十五年度中山大學「大鱗翅群模式標本與文獻數位典藏」計畫所匯出的資料為例,學名對應DC的標題欄位,鑑定著對應到著作者,採集者對應於貢獻者,分類資訊則不分階層都對應到主題欄位以多值呈現,這些轉換成DwC規格後,都將有特定的XML標籤指定(圖5),也不需要再標籤內的內容中再輸出文字說明(例如學名中的「現有組合」),其他各資料庫所發展的特色資訊(如本例中的同物異名資訊),則可視計畫需要對應至Remarks欄位。

圖5 轉換成Darwin Core之XML生物標本資料

 3.3資訊技術
 系統發展技術面而言,整合典藏資訊處理技術與典藏資訊之共享環境為首要目的,並引進先進空間資訊與網路搜尋技術,如Google like的資料查詢方式與簡易的後台管理,提供更完善的文化入口網資訊服務,期望建立完整的時空資訊整合與應用支援體系,以擴大其利用範圍、發揮更廣泛之資料價值。
其重點工作包括:
 (1) 入口網建置:隨著網站的設計愈趨複雜,維護與更新網站內容成為了一件繁重的工作,內容管理系統(Content Management System, CMS)便應運而生。透過內容管理系統,可以大幅減少過去不瞭解HTML或相關語言的一般使用者,能勝任網站管理與更新資訊的工作。
眾多的入口網站軟體中,「Joomla!」擁有管理系統、多國語言介面、階層式的用戶存取群組、內容評等系統、支援多種所見即所得 (WYSIWYG) 內容編輯程式、支援 RSS、內容顯示排程、簡單的文件審核、資源管理功能、訪客統計與投票功能、具高度開發彈性等。並在2006年於Packt所舉辦的開放源碼CMS比賽,以第一名的優秀成績勝出。本年度計畫中,將採用「Joomla!」為入口網核心系統,配合前期計畫架構及陸續與數位典藏相關人員討論,冀望本計畫所建置數位台灣文化入口網,可提供豐富的資料與資訊交流的機會。
 (2) 本計畫將開發如Google like 的搜尋引擎介面,方便使用者快速且容易的獲得相關資訊,並與子計畫一與網路核心平台計畫,共同規劃與建置collection level 為主的層次後設資料瀏覽模式。
 (3) 標籤(Tagging):數位典藏經過五年的努力已累積超過上百萬件文物,聯合目錄中利用關鍵字與主題瀏覽方式來查看各種文物物件,這樣的作法讓專家之外使用者很難挖掘出深處資料,因此本計畫擬利用標籤(Tagging)方式,讓網路上的使用者協助訂定典藏品標籤,參考國外Steve.Museum與PowerHouseMuseum的標籤(tagging)架構,分析其分類架構,並作為入口網站標籤基礎。而標籤(Tag)為Web2.0服務中最具特色之服務,其目的為用任意關鍵字的協同分類工作,降低了資訊分類的門檻,因此未來入口網的分類方式可採用標籤、無階層式、階層式或多層次式的分類詞彙(原CMS中分類方式)等方式進行。
 (4) 模組化:使用模組化(modular)方式設計「數位典藏專業英文文化入口網」,縮短應用程式的開發時間,且開發出來模組亦提供Web Serive的服務,讓其他單位所開發的應用程式更容易共用其資料。
 (5) 輔助國內機構從事國際交流資訊諮詢。
 (6) 協助世界文化入口網組織共同建置CultureMondo.org 網站。

上一篇 | 返回電子報