2012年2月12日 星期日

知識組織工具分類

Tudhope, KochHeery (2006)則以Hodge的分類方式為基礎,進一步將知識組織工具就其結構分為四大詞彙類型:
()詞彙清單:權威檔,術語典,字辭典,地名辭典,同義詞環;
()分類;
()主題標目;
()以關係為本的知識組織系統:索引典,分類架構,語彙資料庫,知識本體。

(一) 詞彙清單(Term Lists):為語彙類型中最簡單的層級,只提供模糊控制,且屬結構較鬆散的清單,如權威檔(Authority Files)、術語典(Glossaries)、字辭典(Dictionaries)、地名辭典(Gazetteers)、同義詞環(Synonym Rings)等。
1.   權威檔(Authority Files):其主要功能在於控制名稱的各種形式(人名、組織名稱、地名),通常是以字母順序排序,且階層有限。
2.   術語典(Glossaries):此為特定領域之詞彙清單,其中包含詞彙的定義。
3.   字辭典(Dictionaries):主要包含一般領域的詞彙,且提供詞彙涵蓋的多種意義及詞彙來源。詞彙是以字母順序呈現。
4.   地名辭典(Gazetteers):此為地名的一個清單,提供地理位置相關資訊。
5.   同義詞環(Synonym Rings):主要為線上搜尋工具(例如:Google),提供同義詞的控制。除了協助索引之外,也提供同義詞語彙擴充查詢(Synonym Query Expansion)的可能。

(二) 分類(Taxonomies):此為最簡單的分類架構。主要提供類別的階層組織,其中之階層關係可以是鬆散或明確的。對於「Taxonomy」一詞之定義還未達成共識,可以是相對簡單的選項清單系統,也可以是複雜的公司知識架構。

(三) 主題標目(Subject Headings):此為主題詞彙的控制清單,其所涵蓋的範圍較廣,但階層架構則相對較淺。主題標目允許複合標題,而此複合組合則是依據既有的規範將單一主題詞彙進行連結。此外,主題詞彙還可以加上複分(Subdivisions)或修飾詞(Qualifiers)

(四) 以關係為本的知識組織系統(Relationship-based KOS)
1.   索引典(Thesauri):其目的在於檢索。索引典中的關係比上述的詞彙類型中的關係更為嚴謹。其關係主要可分為三種:等同關係(Equivalence)、階層關係(Hierarchical)及相關關係(Associative),除了這三種最常見的關係之外,還可以包含其他次類型關係,例如:屬種關係(Subclass/Superclass)、類例關係(Class/Instance)、整部關係(Whole-part)等。索引典就其階層而言,可以是單層(Mono)或多層(Poly)架構,就其涵蓋範圍而言,一般皆針對某特定主題領域。此外,自由文本搜尋引擎也可採用索引典進行語彙擴展查詢(Query Expansion)
2.   分類架構(Classification Schemes):其結構比Taxonomy較複雜,且提供明確清楚的分類階層關係。分類架構必須符合窮盡性及互斥性原則。此外,分類架構也提供了廣泛的輔助資訊及連結,例如:同義詞、參見、直接或鬆散的概念對照。就複合主題敘述詞產生的方式而言,分類架構又可分為兩種:列舉式架構(Enumerative Schemes)及組合式架構(Synthetic Schemes)。前者必須在分類架構上明確的列舉所有合法的組合方式,任何新的複合主題都必須被納入新的版本架構中。而後者只會在規則中說明所有有效的組合方式。
3.   語彙資料庫(Lexical Databases):此包含比索引典更廣泛的語意關係。語彙資料庫可區分不同的資料庫:名詞、動詞、形容詞、副詞等資料庫,各資料庫皆有其特殊階層關係。Princeton University所建構的WordNet則是相當知名的語彙資料庫。
4.   知識本體(Ontologies):此擁有最精確、最正式的關係定義。其中包含:類別(概念)、類別與其相對應的例子、類別屬性,以及類別之間的關係 (例如:屬種、類例、整部、特定領域等關係)。主要探討什麼是已存在的實體或事物,以及這些實體間是以什麼關係來交互作用,並嘗試說明與定義並規範其表示的方式。知識本體是用於描述及表達特定領域知識的一組概念或術語,它可以用來研究特定領域知識的類別、類別的屬性,以及類別與類別間的關係,進一步達成概念語意的資訊檢索。Protégé是目前發展Ontology的工具軟體。一個獨特知識領域的知識架構通常被使用在連接Data-Mining系統與知識管理系統之間,以二維圖示顯示檢索結果,諸如利用「斷詞暨未知詞偵測系統」,「中文自動斷詞技術」,計算出輸入之關鍵詞與其它相關詞間權值並能顯示標明其相關程度後,據以產生「動態視覺化查詢樹動態視覺化星狀圖」,點選各相關詞可再以各相關詞為主鍵重新計算與其相關詞間之權值。