數位化圖書館中個人資訊空間之構想
A Conception of Persional Information Space for Digital Libraries
曾 元 顯
輔仁大學圖書資訊學系副教授
Email: tseng@blue.lins.fju.edu.tw
中國圖書館學會會報,第 56 期,1996,頁 69-75
http://www.webtools.org/counter
前言
數位化圖書館的運作問題
個人資訊空間
技術的可行性
結語
參考資料
Abstract:
The favorable characteristics of digital data, namely information are
ready for manipulation, transmission, and archiving by computers, have
made libraries an opportunity for providing better services ever imagined.
This paper proposes the paradigm of Personal Information Space (PIS) as an
interface to the future digital libraries. In this model, the user
collects frequently used information and resources in a virtual space
where he can easily access. The user retrieves information from the WWW or
instead, he/she asks the digital librarian for help when he is not
familiar with the retrieving tools or when he/she can not form proper
search strategies. He or she in this space can concentrate on information
consuming and producing rather than manipulating computer files. The space
provides a NEWS-like channel so that the user can communicate with experts
from other fields. By analyzing the user's information need and search
patterns, the PIS can provide better services in an active fashion. The
feasibility of the PIS idea is also discussed. This paper shows that the
technological foundations for the PIS model to come true are already in
place.
摘要:
數位化資料便於儲存、整理、修改、傳輸、複製與運用的特性,使圖書館有機會以
過去無法想像的便利方式,提供使用者更好的服務。本文提出「個人資訊空間」的觀
念與運作模式,試圖作為未來數位化圖書館與使用者互動的介面。在這模式裡,讀者
可將常用的資訊匯集在一起,以便隨手取得,隨時運用,其功能類似目前大型圖書館
開闢的研究室,只不過使用者不佔有一實質的地方,而是擁有一虛擬的空間。此模式
重要的特性如下:一、讀者根據自己的需求在資訊網路中找資料,若不諳網路使用方
式或無法有效檢索資料,可以請求數位圖書館員的協助;二、數位圖書館裡的實質收
藏由專業的館員來做適當的分類編目,對於匯入個人資訊空間裡的資源,則依適合讀
者的方式各自處理;三、讀者透過瀏覽器簽入自己的資訊空間,直接接觸資訊,而不
必費心於低層次的檔案操作,以提高資訊的生產能力;四、讀者專業的參考問題,可
以透過公開的討論空間獲得解答或指引;五、資訊空間裡有讀者的資訊需求與檢索行
為的記錄,分析這些資料,可使數位圖書館主動提供讀者更好的服務。此外,本文也
針對個人資訊空間的可行性提出探討,說明目前全球資訊網路上的相關技術,已可用
來實現此一構想。
關鍵詞(Keywords):
數位化圖書館(digital libraries),
個人資訊空間(persional information space),
全球資訊網路(World Wide Web)
壹、前言
資訊科技在近數十年來發展得非常快速。過去電腦技術的發展,促使圖書館
作業自動化,達到書目資料可經由電腦檢索查詢的便利。近幾年電腦與網路技術
的結合,除了便利書目資料的查詢外,更進一步可以透過網路存取其內容。不僅
如此,聲音、圖像、視訊等其他資訊媒體也都可以數位化,儲存成電腦可以立即
處理的型態。這些進展,使得數位化圖書館不僅成為未來圖書館發展的方向,甚
至在某種程度上,已經存在於現有的國際網路(InterNet)
或全球資訊網路
(World Wide Web,以下簡寫成 WWW)上了。
近兩三年來,探討「數位化圖書館」的期刊、研討會及專案計畫紛紛湧現。
如一九九五年四月 Communications of The ACM 期刊推出了「數位化圖書館」
專輯,內容包括數位化圖書館的多項議題、ACM
爾後的出版政策、以及美國數所
大學在 NSF、ARPA、NASA等政府機構二千四百四十萬美元經費支助下,發展的數
位化圖書館計畫 [1]。另外,美國德州農工大學於九四年舉辦第一屆「數位化圖
書館」研討會[2],九五年德州奧斯丁舉辦第二屆 [3]。同年,日本 [4]、新加
坡 [5] 也紛紛加入探討的行列。九六年則有 ACM 及英國的研討會 [6,7]。顯見
國際間對數位化圖書館發展的重視。
國內的情形則發展較慢,目前教育部正在推動圖書館自動化和網路系統整合
工作 [8],未來幾年各級學校、各級圖書館將經由網路連結,形成「全國圖書資
訊網路」,以配合國家資訊基礎建設(NII)的發展。而圖書資料數位化將是
NII
能否發揮功能的重要關鍵。
圖書資料數位化後一個重要的效益是:數位化的資料便於儲存、整理、修改、
傳輸、複製、運用。這些特性使得資訊更能夠達到「為全體國民公開、公平使用」
的目的,對於民主社會的發展、人民權利的保障極具重大的意義 [9]
。
貳、數位化圖書館的運作問題
相對於傳統圖書館的採、編、典藏、流通服務的運作流程,數位化圖書館的
運作方式也需考慮這些問題,以提供圖書館的使用者最便利的資訊存取服務。但
是由於數位資料(尤其是網路資源)的特性與紙本資料不同,以及數位資料運用
方式的極具彈性,若以傳統的運作流程來推導未來圖書館的作業模式,將無法使
圖書館的服務達到最大的效用。與茲列舉重要的問題如下:
一、網路資源的採訪:最近幾年,政府機構、公司行號、研究單位、乃至於
個人均可透過免費的伺服器如 http、gopher、wais、news等系統在網路上提供資
訊。由於硬體價格的滑落、免費軟體安裝的簡易、全世界均可看到的宣傳效果以
及商業上潛在的利益,網路上的資訊站幾乎每半年即成長一倍。這種數量龐大、
分散各處、而且隨時隨地就會冒出資訊站的情況,對網路資源的採訪工作是極大
的挑戰。目前有三種主要方法[10]:第一是人工方式:由熟悉網路資源檢索技術
的人員來過濾、篩檢網路上的資源;第二為自動方式:透過像 Web
walkers, worms,
spiders, harvesters 等自動採訪器(robot)或檢索引擎(search engine)來
蒐集網路上各節點的資料;第三種方式則由大眾推薦:網路使用者透過傳送
Email 或填寫伺服器所提供的 WWW form
來推薦有用的資料。在此情況下,數位
圖書館的館員如何發展適當的方式採訪資料,並且摘要精確,使人一目了然,以
迅速滿足讀者的需求?
二、網路資源的分類、編目:傳統分類、編目方式雖可對館藏資料作精確的
掌握,但數位化資料存在的格式與紙本資料不同,不僅版本加多、不定期更新、
編目索引的項目不同,而且分散各地、文件與文件相互連結,內容短而數量大,
這些特性將使傳統想要掌握全部資訊而做分類、編目的努力,不符合成本效益,
也難以跟上網路資源擴張的速度。
三、網路資源的管理:網路上的資訊具有定期或不定期修訂、變動的特性
[11]。因此,我們應當典藏採訪得來的資料,以確保資料存在本地隨時可用,或
是僅儲存連結(hyperlink),分享別人的資料,以確保資料為最新的版本?
四、如何提供讀者服務:網路資訊的變動性、零碎性、相互連結特性,再加
上網路利用需要相關的電腦、網路技術,將對傳統圖書館的使用者造成資訊檢索
與利用的更大困擾。傳統的服務如何持續,以滿足讀者使用資訊的需求,而不會
使原本為便利而提供的特性,變成讀者使用上的障礙?
五、開發新的服務:數位化圖書館出現後,資訊的生產者─「作者」不必再
透過印刷、出版的手續,即可將作品置於網路上,供消費者─「讀者」直接利用。
資料經過數位化後,修改、複製、儲存、與傳輸的便利性,使資訊的整理仲介者
──「圖書館」得以利用電腦與網路技術提供新的服務。面對使用資訊網路的新
興讀者群,發展哪些新的服務,可以充分發揮資訊科技的效益?
本文的目的,在提出「個人資訊空間」(Personal Information Space, PIS)
這樣的觀念與運作模式,藉由一種整合的介面與使用者互動,來試圖解決上述數
位化圖書館所面臨的問題。
參、個人資訊空間
傳統圖書館,受限於空間、工具、技術、與資源的限制,是以「建構一個一
致的圖書館以服務讀者」為思考方向。在這個架構裡,每個人看到的圖書館都一
樣,必須遵守一致的規定,圖書館才能以合理的資源服務最多的人。「個人資訊
空間」的概念則藉助進步的資訊科技,以讀者的角度來思考圖書館的服務方式。
例如,從資訊需求密集的使用者角度思考,他可能需要屬於個人的數位化圖書
館,將其常常需要的資訊、資源匯集在一起,以便隨手可得,隨時運用。此功能
類似目前大型圖書館開闢的研究室,只不過使用者不佔有一實值的空間,而是擁
有一虛擬的「個人資訊空間」。同理,由一群資訊密集的使用者角度思考,他們
常需要與志同道合的人交流資訊、交換意見,他們可能就需要一個「資訊交流空
間」,排除無關的資訊干擾,集中某一議題的思考與討論,並且不會受到時間、
空間的限制。另外,以區域性考慮,數位化圖書館裡可輕易的建構「社區電子出
版社」,提供社區、學校、或區域性機構一個公共的空間,做為言論出版、政令
宣導、或傳播與大眾利益相關的事宜。
將上面的思考具體化後,一個可能的「個人資訊空間」的運作方式將如下所
述:讀者跟某個數位圖書館申請帳號後,可以藉 WWW
瀏覽器簽入這個數位圖書
館的個人資訊空間。在這個空間裡,他可以將常用的資訊集合起來,以他偏好的
方式分類擺設。他可以擺設自己在全球資訊網路上擷取的資料(也許是全文文
件、也許只是個連結),也可以將自己的檔案、文件拷貝進來。最重要的是,他
如果不熟悉網路資源的擷取,或嘗試很久後在網路上仍找不到滿意的資料,他可
以向數位圖書館裡的館員求助。館員獲得讀者留下的問題或提供的關鍵字後,分
析出較佳的檢索策略,幫讀者透過網路尋找資料。當資料找到時,透過軟體的協
助,資料會自動分派到有登記需求的讀者的資訊空間去。讀者在常用的資料隨手
可得的情況下,可以更專注於資訊的組織、整理,進而更快速的生產出新的資訊,
回饋到網路裡供自己或別人利用。如果他需要與別人討論,可以連上
News 或
BBS 之類的討論區,或是透過 Email 與人通訊。如果他只需要與局部(local)
地區的人討論,他可以進入數位圖書館所提供的研討室與別人交換意見,甚至互
相參閱對方的電子出版品。
數位圖書館藉由在這樣的運作模式與使用者互動,前面所說一些數位化圖書
館面臨的問題,某種程度上可以得到解決。
第一:數位圖書館裡的館藏方向是根據讀者的需求形成的。至於是收藏文件
的內容,或僅收藏文件的連結,則以「最佳的運作方式」原則決定。例如,由讀
者在自己的資訊空間中決定要收錄文件內容,或是文件的連結。收錄文件的內
容,可以保證文件的存在性,不受網路斷線或連結改變的影響;收錄文件的連結,
可以減少儲存空間,確保資料的一致性及以及最新版本,而不會過時。讀者對其
使用的資料最清楚,圖書館應當保留這項決定權予讀者。此外,讀者也可以選擇
將文件擺在公共的資訊空間,讓文件收藏的方式留給圖書館處裡。這樣做除了不
能掌握文件的存在性、一致性、與最新版本外,如果圖書館有收藏,他一樣可以
隨時取得文件不受網路的影響;而如果館裡面不收藏文件內容,僅留住連結位
址,則他可以與別人共享這份文件,節省自己以及圖書館的館藏空間。在這裡我
們假設文件內容的收藏不會侵害到著作財產權,惹出法律上的問題,而如果有此
問題,當然保留文件的連結是目前唯一的收藏方法了。
第二:讀者根據自己的需求在資訊網路中找資料,若不諳網路使用方式或無
法有效檢索資料時,可以請求數位圖書館館員協助。圖書館是提供「終身學習」
的絕佳場所,重要的任務之一是為廣大的民眾服務,使用者也許專精於某個領
域,但並非都能嫻熟電腦網路的使用方式或對搜尋資料有明確概念。雖然目前已
有討論智慧型網路代理員(agent)的研究出現[12],但要達到人性化、普及化
的服務還有一段距離。因此「個人資訊空間」裡,必須有人員,亦即圖書館員的
協助,以提供一般民眾人性化的服務。
第三:數位圖書館根據讀者需求的主題或提供的關鍵字,將館員或自動採訪
器搜索來的資料自動分派到讀者的資訊空間去,讀者可以不定期收到圖書館送來
與自己需求有關的資料,經過進一步分析後,可以決定收錄起來、或保留在公共
空間、或者回絕這項資料。因此,「個人資訊空間」裡的資料採訪是讀者自己為
主角,圖書館員、或自動採訪器為配角。讀者採訪自己所要的資訊,最能達到精
確的效果。圖書館員、自動採訪器、或檢索引擎最大的好處,是節省讀者的力氣、
拓展讀者搜尋的範圍。
第四:全球資訊網路上的資料是以分散儲存的方式存在,而且呈現動態的演
變發展。依此想像,要對網路裡的所有資訊做分類編目是不可能的。每個數位圖
書館僅能就自己實質的收藏做分類編目,便利外界查詢檢索,這部份的分類編目
工作可由專業的館員來做。對於外來的資源,就留給讀者在個人的資訊空間,依
自己的偏好處理。他可以不遵守傳統分類編目的規則,引進大量的連結互相參
照,以切合本身的要求。
第五:讀者只要能利用瀏覽器進入網路,就可在圖書館員的指導與協助下建
構自己的資訊空間。他不再像簽入主機型電腦一樣,面對的是一層層的子目錄與
一個個的電腦檔案,而是直接接觸到抽象層次比較高的「資訊」而不是「檔案」。
在此,「資訊」與「檔案」的差別在於,「檔案」需要知道其性質(如確定其為
文字檔、圖形檔、聲音檔、影像檔,或是確定其儲存的格式),並以手動的方式
選用適當的工具,才能打開檔案瀏覽其內容;而「資訊」雖然是以檔案的方式存
在電腦裡,但是透過瀏覽器的協助,我們就不再關心此檔案的性質與低階層次的
操作,只專注於其實質的內容。讓讀者掌控資訊,在資訊消費與生產的循環當中
扮演主要的角色,是設計圖書館時的最高目標,而不是圖書館本身存在的形式。
第六:利用參與共同空間的討論區,協助解答讀者的問題。圖書館的參考問
題可概略分為四種:指引型(direction)、快速參考問題(ready reference)、
特殊檢索(specific search)與研究型問題(research)[13]。前面描述的數
位圖書館館員所提供的服務約略涵蓋了指引型、特殊檢索型、與研究型參考問
題。至於快速參考型問題,我們認為目前 News 或 BBS
討論區的模式相當理想:
讀者在某個適當的討論區提出問題,網路裡對這些問題專精的人士可以提供快速
的解答,若不幸有人提供了謬誤的答案或觀念,由於這個討論空間是公開的,就
會有人再提出指正。圖書館員的專業有限,而網路上的使用者遍及各行各業的人
士,所觸及的問題包含個個層面,而一個問題在討論時可得到的回答,其廣度是
目前為止沒有任何媒體可以望其項背的。此種網路上的討論,可以類比成腦神經
思考網路,每個使用者的智慧,經由網路的組合,可以輸出更好的答案。因此在
「個人資訊空間」裡建立讀者與專業人士類似的接觸與溝通的管道,可以提供讀
者更完整的參考服務。
第七:數位化圖書館裡有讀者的基本資料與需求條件,甚至可以獲知讀者檢
索的行為。分析這些資料,可以隨時掌握圖書館經營的情形,據以提供讀者更好
的服務。
肆、技術的可行性
目前瀏覽器市場上網景(Netscape)公司推出的領航員(Navigator),由
於連線速度快、功能較多、教育人員可以免費使用,使得它在極短的時間,佔有
廣大的市場。領航員有多項功能可以支援「個人資訊空間」的構想。例如:
一、它提供網路檢索工具(InfoSeek Search),使用者可以根據關鍵字來
搜尋網路上的資源。
二、提供標籤(Bookmark)功能,可以將拜訪的資訊站位址或閱讀時遇到的
連結存起來,並透過標籤編輯功能依使用者的偏好做分類。
三、支援 FTP
(檔案傳輸協定)與存檔功能,使用者可以將網路上的文件
存在自己的磁碟機,或將自己的檔案上傳到某個檔案傳輸站。
四、支援 News 功能,可以連到某個 News
討論區,參與某個議題的討論。
五、透過預先設定的方式,可以自動分辨檔案類型,叫用適當的軟體開啟網
路上的文件,使用者不會感受到瀏覽文件的不便。
然而,目前全球資訊網路使用的 HTTP (HyperText Transfer Protocol)
協定是屬於「不記錄狀態的」(stateless)。這使得伺服器與瀏覽器之間的連
線迅速、製作也較為簡單。但是從另一個角度看也有缺點:每次瀏覽器向伺服器
要求一份文件,就要重新建立連結,傳送完文件後,就斷線。這情形就像跟某個
人講電話時,每講完一句就必須掛斷,要講下一句,需要再重新撥通電話。這種
協定方式對於需要交談、對話(session-based)的應用極不適合 [14]。無法記
錄使用者狀態、無法辨識使用者,就無法保留使用者的資訊空間,數位圖書館的
館員就無從將使用者的需求回應到這個空間去。
上述的情況並非無解,不過需要額外的程式設計技巧。HTTP
協定裡有幾種
特別的方法讓使用者端與伺服器端做較複雜的互動。當伺服器收到使用者的需求
時,如果此項需求是要求傳回一個檔案,伺服器就找出檔案傳回然後結束與使用
者的連線。如果此項要求是其他情況需要額外的處理,伺服器不會去執行這項處
理,而是傳給「通道程式」(Gateway Programs)來執行。「共同通道介面」(Common
Gateway Interface)就是在定義 HTTP 伺服器與「通道程式」的溝通方式[15]。
因此解決上述的情況,需要瞭解「共同通道介面」及熟悉任何一種程式語言來撰
寫我們所要的「通道程式」,必要時可能再加入一些機制來加強 HTTP
這項通訊
協定。
網景公司的作法,是在標準的 HTTP 協定之外,加入了「餅乾」(Cookie)
這樣的通訊機制,使得伺服器與瀏覽器透過這項協定得以記錄使用者狀態[16-
17]。網景的解決方式是屬於「瀏覽器端的餅乾」(client-side cookies),也
就是說需要瀏覽器的配合,伺服器端才能記錄使用者狀態。目前大多數的瀏覽器
並未支援此項功能,有少部分的單位甚至發展自己的「餅乾」作法[18]。相對的,
另一種相似的作法則是「伺服器端的餅乾」(server-side cookies)[19]。它
不需要瀏覽器額外的功能,只要伺服器支援「共同通道介面」即可。這項要求,
幾乎目前的伺服器都已具備。這使得「個人資訊空間」的構想,只剩下「通到程
式」的設計以及加強瀏覽器功能的整合,即可實現。
伍、結語
由於電腦與網路技術的發展,使完全以讀者為導向的圖書館服務變得可行。
本文提出的「個人資訊空間」,就是此一構想下的產物。這個構想,某種程度上,
可以解決未來數位化圖書館面臨網路資源的分類、編目、館藏發展與讀者服務的
問題。而這些問題應當是圖書館學或資訊科學急切探討的課題。
在全球資訊網路的環境下,發展克服其「不記錄狀態」(stateless)的技
術,對以「對話」為導向(sessio n based)的應用非常重要。這項技術將使更
多的資訊網路應用變得可行,網路上的使用者也將因此獲得更好的服務。
全球資訊網路上的瀏覽器、伺服器畢竟屬於應用程式的層次,是一種介於使
用者與作業系統之間的軟體,其中作業系統則是介於應用軟體(或使用者)與電
腦硬體之間的系統。Windows 95
作業系統出現時標榜其設計理念以「文件為中
心」,讓使用者透過作業系統來管理抽象層次較高的文件,而不是檔案。雖然此
種設計理念早在蘋果(Apple)公司推出麥金塔(Macintosh)個人電腦時就已存
在,但微軟(Microsoft)的努力,將會加速促使後續的作業系統具備更佳的親
和性。未來不管網路應用程式與作業系統如何結合、怎麼發展,我們需要的是像
「個人資訊空間」這樣的系統或者更好的構想,使我們專注於資訊的消費與生
產,而不必只為了擁有一個 Email 帳號,卻必須簽入(login)一部電腦,面對
學習一大堆指令的困擾。
參考資料
[1] Special Issues on Digital Libraries, Communications of The ACM.,
Vol. 38, No. 4, April 1995.
[2] Digital Libraries '94, Proceedings of the First Annual Conference
on the Theory and Practice of Digital Libraries. College Station,
Texas, USA. June 19-21, 1994, http://atg1.wustl.edu/DL94
[3] Digital Libraries '95, Proceedings of the Second International
Conference
on the Theory and Practice of Digital Libraries. Austin, Texas, USA.
June 11-13, 1995, http://bush.cs.tamu.edu/dl95/README.html
[4] ISDL'95: International Symposium on Digital Libraries 1995. University
of
Library and Information Science, Tsukuba Science City, Ibaraki, Japan,
August 22 - 25, 1995, http://www.DL.ulis.ac.jp/ISDL95
[5] Digital Libraries Conference. Singapore Information Technology
Institute.
March 27-28, 1995,http://www.iti.gov.sg/personal/kwanghan/dl/dl.html
[6] ACM Digital Libraries '96. First ACM International Conference on
Research
and Development in Digital Libraries (announcement),
http://fox.cs.vt.edu/DL96
[7] ELVIRA`96 3rd International Conference on Electronic Library &
Visual
Information Research, The UK Digital Libraries Conference. 30 April -
2 May 1996,http://ford.mk.dmu.ac.uk/elvira/elvira3.html
[8] 曾憲雄,"圖書館網路系統整合之計畫與目標",
圖書資訊學刊,第十四期,
1─6頁,1995
[9] "Library Applications of the National Information
Infrastructure",
http://nii.nist.gov/lbr.html
[10] Green, David G.,http://life.anu.edu.au/people/dgg/virtual.html,
"Proposed operation of a virtual library.", Environmental and Information
Science, Charles Sturt University, Albury NSW 2460 Australia.
[11] David M. Levy and Catherine C. Marshall, "Going Digital: A Look
at
Assumptions Underlying Digital Libraries", Commu. of The ACM, Vol.38, No.4,
April 1995, pp.77-84.
[12] Issue on intelligent Agents, Communications of the ACM, 37, 7, July,
1994.
[13]
陳雪華,網路資源與圖書館參考服務,資訊傳播與圖書館學,第一卷,第四期,
民84年,頁41─52。
[14] Stuart L. Webel, "The World Wide Web and Emerging Internet
Resource
Disco-very Standards for Scholarly Literature," Library Trends, Spring 1995,
pp.627-644.
[15] Ian S. Graham, HTML Source Book: A Complete Guide to HTML, John Wiley
&
Sons, 1995.
[16] "How can I keep 'state' information between calls to my CGI
program?"
http://sable.ox.au.uk/help/wwwfaq/hfields.htm
[17] "Persistent Client State HTTP Cookies"
http://www.netscape.com/newsref/std/cookie_spec.html
[18] "Form Test Results for Netscape Cookies"
http://www.research.digital.com/nsl/formtest/stats-by-test/NetscapeCoolie.html
[19] "SCAT: Sessioneer CGI Authorization Toolkit"
http://www.btg.com/scat/scat.htm