2012年2月23日 星期四

Metadata在電子圖書館所扮演的角色/陳雪華


壹、電子圖書館與Metadata
一、電子圖書館的目的
1.    文化保存
2.    學術研究
3.    教育學習
二、電子圖書館特質
1.    應該是實體圖書館或是資訊檢索系統的延伸。
2.    能夠整合資源、服務與人等各因素,以支援資料、資訊、知識的創造、傳遞、使用、保存等完整的資訊循環週期,其工作方向在於協助知識的產生、分享與利用,並加速循環過程。
3.    良好的組織與整理的工作,方能以使用這為導向,提供好用的電子圖書館。
三、何謂Metadata
1.    常用翻譯:資源描述格式、詮釋資料、元資料。
2.    Metadata有以下幾種解釋:
l Data about data
l Data describes other data
l Additional information that is necessary for data to be useful(為使額外的資料更好利用,Metadata是必要的)
l Metadata是對藏品資料屬性的一組描述,目的在促進資料系統中隊資料之檢索、管理與分析。
l Metadata在傳統圖書館中即以目錄卡片或OPAC中的機讀編目格式的形式,扮演了資料找尋工具的重要角色。
l Metadata具有傳統目錄之「著錄」功能,目的在使資料的管理維護者及使用者可透過Metadata了解並辨識資料,進而去利用和管理資料。
四、Metadata的必要性
1.    在資料找尋的過程中更容易處理
2.    目前的技術仍難以做到以非文字物件做為搜尋或自動選取的基礎
3.    Metadata可提供不存在於藏品本身之資訊
4.    Metadata是經由人工判讀將藏品中的重要資訊抽離或標示出來,是目前自動化技術尚無法真正達到的。可與沒有做Authority Control而可能檢索不到或檢索非所需資訊的全文檢索相輔相成。
五、Metadata的功能
1.    從使用者的角度來看
l 定位
l 探索
l 文件紀錄
l 評估
l 選擇
2.    從系統角度來看
l 描述藏品特徵
l 提供瀏覽及檢索功能
l 管理功能
l 組合各個物件以及藏品的再呈現
六、Metadata的格式
1.    科技文獻:BibTexEELSEEVLRFC 1807
2.    人文及社會科學等學科資源:ICPSR SGML Codebook InitiativeTEI Headers
3.    政府資源:GILS
4.    地理空間性資源:FGDC(又稱CSDGM)
5.    博物館藏品及檔案特藏:CDWACIMIEAD
6.    大量網路資源:URCsDublin Core(DC)
七、Metadata的來源
1.    Metadata的創作者與來源可分為作者、資源儲存的管理者、其他單位的創作者。
2.    針對電子圖書館而言,其Metadata創作者大多屬於資源儲存管理者。
八、Metadata的著錄層次
1.    無結構化的索引
2.    相當結構化,但較精簡,提供足夠資源描述資訊
3.    相當結構化,並且非常複雜,有其特殊領域,提供詳細的資源描述資訊


壹、Dublin Core
一、何謂Dublin Core
是一組描述網路資源之簡單欄位,提出時只有13個基本欄位。描述對象為文獻式資源Document-Like-Objects
二、 Dublin Core 的基本原則
(一)簡單:在格式及欄位名稱上力求簡單,使用簡便,不需專業訓練。
優點如下:
1.  作者可自行建立Metadata
2.  軟體廠商可自行發展編輯器,並可延展
3.  可作為進一步書目描述的基礎
4.  不同群體間語意的共通性
(二)彈性:
DC有四大特性:延展性、選擇性、可重複性、可變性,具有相當彈性以符合不同群體的需求,且可利用Qualifiers對外連結到更完整的紀錄。

三、 Dublin Core 的發展

初期
起源於用來描述網路上數量最龐大的「文獻式資源」HTML文件,但未標準化
第一次研討會
未解決:
1.      彈性與一致性的衝突
2.      每有清楚的結構及用法
3.      沒有標準的應用方法
第二次研討會
提出”Warwick Framework”觀點:
1.      是一個可將不同型態的Metadata物件分別包裝起來,以進行資訊交換的架構
2.      必須具有能將不同的Metadata物件視為單獨的模組
3.      須考慮到未來出現新的Metadata格式
4.      內部的Metadata物件可以連結到外部
5.      利用Framework可使眾多的Metadata語意共通
第三次研討會
將影像資料視為”Document-Like-Objects”;將原來的13個欄位擴張成15個,即可用來描述影像資料
第四次研討會
1.      欄位組及Qualifiers的正式確定
2.      延展性的爭議
3.      某些欄位必須更清楚的定義以及Camberra Qualifiers的產生
l  Camberra Qualifiers
(1)   為使DC可以延展,也可以一致而產生
(2)   有三類:Language描述時所用的文字、SchemeType
第五次研討會
1.      加快標準化的腳步
2.      區分簡單、複雜兩種DC格式:即有無使用Qualifier
3.      語法上以HTMLRDF格式為主
4.      針對未有定論的議題成立工作小組
5.      次欄位(項目)Qualifiers使用的制定原則

四、Dublin Core的價值
1.  激勵作者與出版者提供這些詮釋資料的項目。
2.  激勵網路出版工具中加上產生詮釋資料的樣板(template)在內。
3.  激勵軟體產商發展Authoring Tool,使資料容易鍵入。
4.  可作為詳細編目之基礎。
5.  記錄容易被了解。