壹、電子圖書館與Metadata
一、電子圖書館的目的
1. 文化保存
2. 學術研究
3. 教育學習
二、電子圖書館特質
1. 應該是實體圖書館或是資訊檢索系統的延伸。
2. 能夠整合資源、服務與人等各因素,以支援資料、資訊、知識的創造、傳遞、使用、保存等完整的資訊循環週期,其工作方向在於協助知識的產生、分享與利用,並加速循環過程。
三、何謂Metadata
1. 常用翻譯:資源描述格式、詮釋資料、元資料。
2. Metadata有以下幾種解釋:
l Data about data
l Data describes other data
l Additional information that is necessary for data to be useful(為使額外的資料更好利用,Metadata是必要的)
l Metadata是對藏品資料屬性的一組描述,目的在促進資料系統中隊資料之檢索、管理與分析。
l Metadata在傳統圖書館中即以目錄卡片或OPAC中的機讀編目格式的形式,扮演了資料找尋工具的重要角色。
l Metadata具有傳統目錄之「著錄」功能,目的在使資料的管理維護者及使用者可透過Metadata了解並辨識資料,進而去利用和管理資料。
四、Metadata的必要性
1. 在資料找尋的過程中更容易處理
2. 目前的技術仍難以做到以非文字物件做為搜尋或自動選取的基礎
3. Metadata可提供不存在於藏品本身之資訊
4. Metadata是經由人工判讀將藏品中的重要資訊抽離或標示出來,是目前自動化技術尚無法真正達到的。可與沒有做Authority Control而可能檢索不到或檢索非所需資訊的全文檢索相輔相成。
五、Metadata的功能
1. 從使用者的角度來看
l 定位
l 探索
l 文件紀錄
l 評估
l 選擇
2. 從系統角度來看
l 描述藏品特徵
l 提供瀏覽及檢索功能
l 管理功能
l 組合各個物件以及藏品的再呈現
六、Metadata的格式
1. 科技文獻:BibTex、EELS、EEVL、RFC 1807
2. 人文及社會科學等學科資源:ICPSR SGML
Codebook Initiative、TEI Headers
3. 政府資源:GILS
4. 地理空間性資源:FGDC(又稱CSDGM)
5. 博物館藏品及檔案特藏:CDWA、CIMI、EAD
6. 大量網路資源:URCs、Dublin Core(DC)
七、Metadata的來源
1. Metadata的創作者與來源可分為作者、資源儲存的管理者、其他單位的創作者。
2. 針對電子圖書館而言,其Metadata創作者大多屬於資源儲存管理者。
八、Metadata的著錄層次
1. 無結構化的索引
2. 相當結構化,但較精簡,提供足夠資源描述資訊
3. 相當結構化,並且非常複雜,有其特殊領域,提供詳細的資源描述資訊
壹、Dublin Core
一、何謂Dublin Core
是一組描述網路資源之簡單欄位,提出時只有13個基本欄位。描述對象為文獻式資源Document-Like-Objects。
二、
Dublin Core 的基本原則
(一)簡單:在格式及欄位名稱上力求簡單,使用簡便,不需專業訓練。
優點如下:
1. 作者可自行建立Metadata
2. 軟體廠商可自行發展編輯器,並可延展
3. 可作為進一步書目描述的基礎
4. 不同群體間語意的共通性
(二)彈性:
DC有四大特性:延展性、選擇性、可重複性、可變性,具有相當彈性以符合不同群體的需求,且可利用Qualifiers對外連結到更完整的紀錄。
三、
Dublin Core 的發展
初期
|
起源於用來描述網路上數量最龐大的「文獻式資源」HTML文件,但未標準化
|
第一次研討會
|
未解決:
1.
彈性與一致性的衝突
2.
每有清楚的結構及用法
3.
沒有標準的應用方法
|
第二次研討會
|
提出”Warwick
Framework”觀點:
1.
是一個可將不同型態的Metadata物件分別包裝起來,以進行資訊交換的架構
2.
必須具有能將不同的Metadata物件視為單獨的模組
3.
須考慮到未來出現新的Metadata格式
4.
內部的Metadata物件可以連結到外部
5.
利用Framework可使眾多的Metadata語意共通
|
第三次研討會
|
將影像資料視為”Document-Like-Objects”;將原來的13個欄位擴張成15個,即可用來描述影像資料
|
第四次研討會
|
1.
欄位組及Qualifiers的正式確定
2.
延展性的爭議
3.
某些欄位必須更清楚的定義以及Camberra
Qualifiers的產生
l Camberra Qualifiers:
(1)
為使DC可以延展,也可以一致而產生
(2)
有三類:Language描述時所用的文字、Scheme、Type
|
第五次研討會
|
1.
加快標準化的腳步
2.
區分簡單、複雜兩種DC格式:即有無使用Qualifier
3.
語法上以HTML和RDF格式為主
4.
針對未有定論的議題成立工作小組
5.
次欄位(項目)及Qualifiers使用的制定原則
|
四、Dublin Core的價值
1. 激勵作者與出版者提供這些詮釋資料的項目。
2. 激勵網路出版工具中加上產生詮釋資料的樣板(template)在內。
3. 激勵軟體產商發展Authoring
Tool,使資料容易鍵入。
4. 可作為詳細編目之基礎。
5. 記錄容易被了解。