何謂「數位人文」呢?簡單來說,將龐大的史料透過數位科技分析,用以進行人文研究即是。相信從事歷史研究相關工作的讀者們對於「上窮碧落下黃泉,動手動腳找東西」這句話一定不陌生,正所謂「Content is King」,史料內容經過不同的脈絡重整將能開發新的研究領域。在數位時代,數位典藏所彙集的無數史料內容可作為研究的「新材料」,如何從數百萬筆的龐大資料中找出相關脈絡,便成為研究人員的極大挑戰。數位人文研究應用資訊探勘技術,作為人文研究的「新工具」,能夠快速地從數百萬筆史料中處理、分析,找出關連或連結;除了可以迅速地從大量文本中找出研究所需的「關鍵詞」,甚能從中發現大量資料內部隱含的關係,發掘出傳統史學研究單靠人工無法處理的「新問題」。靠著資訊科技的進步,幾秒鐘的時間就能夠分析上萬筆的史料,也因此,項教授笑著說道:「我們可以大膽的說『If Content is King, Context is Emperor』!」數位人文研究正是利用最新的資訊技術,讓史料有系統地呈現不同文本間的關聯和脈絡。
從資料庫內容分析發現的「新問題」
「臺灣歷史數位圖書館」(Taiwan History Digital Library, THDL)為針對臺灣史研究而建的資料庫,從數位人文研究的核心概念出發,項教授率領團隊開發相關技術,讓此資料庫除了能透過全文檢索與Metadata檢索,更發展出許多分析資料、輔助觀察、進行探索的工具,透過這些工具所呈現的脈絡,研究者將能觸及以往無法討論的「新問題」。以古契書的例子而言,過去人文研究者往往囿限於能蒐集到的資料,僅能就數百筆古地契逐筆檢視,進行小範圍的研究。THDL收錄了數萬筆的古契書全文資料,研究者可以運用新的數位人文工具,透過關鍵字檢索和詞頻分析,更快速地找到過去無法發現的「新問題」,甚至探究這些古契書的時間分布、地理分布是否與臺灣發展史息息相關等,這些都是以往以人力逐筆校閱所難以辦到的。
Publisher:Fan-Sen Wang, Vice President of Academia Sinica Editor-in-Chief:Zong-Kun Li Publishing Department:Taiwan e-Learning and Digital Archives Program, TELDAP Executive Editor:Sub-project: Digital Information - the New and Creative Way of Communicating Mailing Address:The Institute of History and Philology, Academia Sinica No.130, Sec. 2, Academia Rd., Nangang District, Taipei City 115, Taiwan TEL: (02) 27829555 ext:310 or 183 FAX: (02) 2786-8834 E-mail:newsletter@teldap.tw
Issue:數位典藏與學習電子報 第十一卷第九期 Publish Date:09/15 /2012 First Issue:02/15 /2007(Published on 15th every 2 months)
The copyright of all contents in this e-Newsletter belongs to TELDAP,Taiwan. The e-Newsletter publishing system is supported by the Core Platforms for Digital Contents Project for TELDAP.