2012年3月28日 星期三

隱形網頁(Invisible Web)

一、定義:一般搜尋引擎無法自動檢索的網頁,稱為隱形網頁(Invisible Web)或深層網頁(Deep Web)。
  • 藏在密碼之後
  • 以互動式查詢
有時是故意不被檢索,有時是資料屬性使然。
二、內容包括:

1.專屬使用權的網頁
需要密碼方能使用的網頁,例如 華爾街日報:論文剽竊在美大學引起軒然大波 ( 英文 --Wall Street Journal 須訂閱) 企業內部的主機網頁,利用防火牆、robots.txt 或 ”noindex”的meta tag 來阻止蒐尋引擎的 crawler 進入使用網頁
 2.特殊格式的檔案
例如影像檔、聲音檔、程式檔、壓縮檔及PDF檔、Postscript 等。(隨著科技的進步,此項限制已逐漸消失)
3.動態網頁(dynamically generated web pages)通常於網址中會有一 ,是為非固定式網址

4.關聯式資料庫(relational databases)

三、檢索方式:以關鍵語檢索Google、Yahoo或圖書館的資料庫只是開始,進而利用水平方式的檢索策略才是最有效的方法:
  1. 採取關鍵語之外的檢索方式。
  2. 應用相關的策略檢索合適的隱形網頁網站:可檢索的資料庫或主題目錄。
  3. 將隱形網頁視為搜尋的一部份。
  4. 水平方式檢索。
  5. 以研究型資料庫的文章標題搜尋相關的網頁。
  6. 搜尋網路上相關的書目資料,包含圖書、期刊或其他文獻。
  7. 從圖書或期刊中搜尋作者相關資訊。
  8. 搜尋相關的組織及政府報告書。
  9. 追蹤引文資料找到相關的網頁。
  10. 查證作者的電子郵件位址,與其聯絡取得更多的相關資訊。
參考資料:
http://www.lib.cgu.edu.tw/instruction/WWWsearchEng.html
http://www.lins.fju.edu.tw/mao/internet/invisibleweb.htm
http://www.lib.tku.edu.tw/project/highedu/edu0305.htm