99re在线视频观看|日韩 欧美 国产 亚洲 制服|男人的天堂视频网站清风阁|亚洲经典激情春色另类|五月天精品视频

全球視野 | 國外文獻數據庫最新發展現狀述要

2019-06-30 21:50:00
南京大學信息管理學院 華薇娜 等
原創
摘要:調查、歸納和總結國外文獻型數據庫的最新發展現狀:包括資源發現服務勢頭迅猛、大力度開發回溯數據資源、提供數據分析功能、提供文獻處理功能、主題語言檢索體的應用面得到擴展、分類語言檢索體系更具專業性、提供特色檢索途徑、引入期刊評價新指標、準確定位作者信息和注重細節設計10個方面。這些梳理和總結有助于我們拓寬視野,深入了解國外文獻數據庫的特色,以開發更多、更新的數據庫資源

國外文獻型數據庫歷史悠久,許多數據庫源自擁有百年以上歷史的印刷本索引工具書,體現著厚重的歷史的沉淀。隨著因特網的發展,經過了從紙質版到電子版的飛躍,許多文獻數據庫都有了根本性的變化,越來越多的數據庫不斷地得到調整和改進。調查、歸納和總結這些數據庫的最新發展現狀,對于我們深入了解國外文獻型數據庫有著很大的意義,也有助于拓寬我們的視野,促進我們開發更多更新的數據庫資源。

1 資源發現服務勢頭迅猛

資源發現服務是指數據庫系統提供商通過與出版社等內容提供商的合作,對海量的、來自異構資源的元數據和部分對象數據,采用分析、抽取等手段進行預收集,并將這些數據按映射轉換規則轉換為標準的格式,納入到元數據標準體系中,形成一個預聚合的元數據聯合索引庫,在本地或者遠程中心平臺提供統一的搜索服務。自2007OCLC推出第一代資源發現與獲取平臺——WorldCat Local(簡稱 WCL)以來,資源發現系統在國內外圖書館界引起了廣泛關注。目前國際上主流的資源發現系統大約有十多種,其中應用最為廣泛的除了前文所提及的 WCL(現升級為World Cat Discovery Service)外,還有PreQuest公司旗下Serials SolutionSummon 系統,EBSCO公司的EBSCO Discovery Service(簡稱EDS),ExLibris公司的Primo系統,以及 Innovative Interfaces公司的 Encore系統。近來,多數資源發現系統進一步升級。2015年,ExLibris 公司加入ProQuest,兩家公司目前所擁有的資源發現系統PrimoSummon已在市場中擁有大量客戶,在資源與系統整合方面對圖書館資源發現系統產生了很大的影響。資源發現系統打破了圖書館各種資源的載體限制,實現了所有資源的深度整合,一站式檢索,其一問世便得到了圖書館的青睞和熱捧,展現出了強大的發展勁頭。

2大力度開發回溯數據資源

(1開發專門的過刊數據庫

過刊(back issue backfile)是一個相對概念,非當前刊期的期刊都可稱之為過刊,但一般指本年度之前的期刊;圖書館習慣上把已裝訂成冊的期刊稱為過刊。JSTOR(全名為 Journal Storage)就是一個典型的西文過刊數據庫。鑒于文科用戶對過刊極高的使用需求,曾任普林斯頓大學校長的 WilliamG. Bowen最初策劃創建了這一專門的對過刊進行數字化處理的信息資源。該庫最初的目標是要建立一個規模雖小,但包羅各種由創刊號起直到距當前3~5年前的重要過刊的數據庫,所覆蓋期刊中最早的回溯至1665年。該數據庫在創建后的最初幾年里只收錄有幾百種刊物,但近年來該數據庫飛速發展,收錄的數據資源大幅度地增長。目前該過刊數據庫包含有900多個出版商提供的數據;從期刊的收錄數量上來看,該庫現收錄以政治學、經濟學、哲學、歷史、語言文學、法律、教育、音樂和藝術等人文社科主題為中心,兼有一般科學性主題共50多個領域的代表性學術期刊逾1900種;而從資源的覆蓋面上來看,JSTOR 最新版還收錄有200多種現期期刊,以及15000多種電子圖書。目前該庫幾乎已成為西方國家文科領域無人不曉的網絡信息資源。類似 JSTOR 這樣的專題回溯數據庫還有很多,例如專門收集早年的文科圖書信息的數據庫《早年英語圖書數據庫》(Early English Books Online,簡稱EEBO);覆蓋150多個語種的、更側重于歐洲國家過刊的數據“Periodicals Archive Online”(簡稱PAO)等等。

(2現刊數據庫也拓展回溯數據

很多現期期刊數據庫,包括文科的和一些理科資源的數據庫,在不斷增加和更新當前數據的同時,也紛紛往創刊年之前的文獻資源回溯。其中比較典型的有:美國引文索引數據庫、美國科技情報社ISI(現已由湯森路透公司接管)出版的系列引文索引收錄世界上最有影響的、經過影響因子篩選的核心期刊上發表的研究成果,在一定程度上代表著世界科學研究的水平,尤其是基礎學科研究的高水準。該系列包括 《科學引文索引》(Science Citation Index,簡稱 SCI)、《社會科學引文索引》(Social Science Citation Index,簡稱 SSCI)、《藝術與人文學科引文索引》(Art & Humanities Citation Index,簡稱 A&HCI)。其中,SCI 創刊于1963年,SSCI創刊于1972年,A&HCI 創刊于1978年。但在2005年左右,湯森路透公司分別將 SCI SSCI 收錄文獻的起始年份回溯至1900年,A&HCI的數據也回溯到1975年,也就是重新組織了創刊年之前的文獻數據。這對人們回顧各學科的發展史,了解早年這些領域的核心期刊論文,提供了可能與方便。

美國威爾遜公司系列數據庫:成立于 1898年的美國威爾遜公司,是索引類工具書行業內的杰出品牌之一。該公司出版有一系列期刊索引和圖書書目,其中有些資源都有近百年的歷史,比如,《讀者期刊指南》(Readers Guide to Periodical Literature)創刊于 1905 年,其收錄的數據始于1900年。進入數字化時代后,威爾遜公司適時地將其印本索引工具書組織成了網絡數據庫 (目前這些網絡資源合并在 EBSCO 系統平臺上為用戶提供服務)。近來,Wilson 系統中的許多數據子庫在更新當前數據的同時又拓展回溯數據。如《讀者期刊指南》的回溯數據始于1890年;《圖書館學文獻索引》(Library Literature)的數據已回溯到1905年(其印本數據始于1934提供數據分析功能如今數據庫的各種個性化功能層出不窮,既增加了產品的競爭力,也有助于產品順應時代發展的趨勢,其中較為顯著的功能即為數據庫信息分析功能,如 Web of ScienceScopusSciFinder等,這些系統目前都提供一定程度的定量分析的功能,即利用排序的方法從多角度對檢索結果進行數據挖掘和全景分析,幫助分析某研究領域的發展趨勢,發現科學技術熱點,揭示論文間的潛在聯系,并可提供相應的引文報告。有的系統結合可視化技術,將檢索結果根據文獻來源、著者、出版年、被引次數等進行歸類和細化。有的數據庫以提供同義詞表的方式進行概念分組,并可將檢索結果細化到某個特定分類,便于迅速精煉和篩選檢索結果。 

3 提供文獻處理功能

越來越多的文獻型數據庫提供可直接導入文獻處理軟件的數據下載格式。目前用于文獻處理的軟件主要有 Reference Manager,End Note,Ref Works等。美國湯森路透公司WOK平臺上的多個系統,如 Web of ScienceMedline 等系統就提供了 End Note 的文獻下載選項,這些下載數據還可以應用 Reference Manager 軟件來進行進一步的處理。美國 ProQuest系統提供了能直接導入Easy BibEnd NoteRef Works的下載選項。

這些軟件都可以幫助用戶管理從數據庫檢索而得的文獻題錄數據或參考文獻,便于用戶對檢得結果數據的進一步處理和自動的序化管理。許多系統還對題錄結果數據提供一定數量范圍內的一攬子下載格式,用戶可通過普通的辦公軟件,如EXCELWORD 等,對下載結果進行進一步的處理。

4 主題語言檢索體系的應用面得到擴展

主題語言是指經過控制的,表達文獻信息內容的語詞,主題詞表是主題詞語言的體現,詞表中的詞可作為文獻內容的標識和查找文獻的依據。最多見的主題語言分為標題詞語言、單元詞語言、關鍵詞語言和敘詞語言等。國外使用主題語言處理文獻的先例很多,早在印刷本時代,1957 年創刊的《美國在版書目主題指南》(Subject Guide to Books in Print)就是對《美國在版書目》中的絕大部分圖書按美國國會圖書館主題詞表 LCSH (Library of Congress Subject Headings)進行標引和整序。許多印刷本中所使用的主題詞表被沿用到網絡數據庫中,其中就有久負盛名的美國國立醫學圖書館(NLM)出版發行的《美國醫學索引》(Index Medicus,簡稱IM),其標題詞表就是我們現在 PubMed 系統中能夠看到的 Medical Subject Headings,簡稱MeSH;美國工程索引(Engineering Index,簡稱Ei)所用的工程敘詞表Ei Thesaurus,也被現在的數據庫 Engineering Village 所沿用。而當前更多的主題語言檢索體系則完全在網絡上開發和應用,美國 ProQuest 系統提供的檢索詞庫即為這一類型。以“bibliometrics”一詞為例,通過ProQuest 詞庫檢索出來的與該詞相關的其他語詞,包括其上位詞、下位詞、相關詞等,這為用戶后續的擴檢、縮檢提供了很有價值的參考信息。

5 分類語言檢索體系更具專業性

國外早期的分類體系主要是針對圖書分類的,如美國的杜威十進分類法(Dewey Decimal Classification,簡稱 DDC),國際十進分類法(Universal Decimal Classification,簡稱 UDC)等等。在印本書時代,這些分類體系在文獻系統中幾乎是占據半壁江山的,當然這些分類至今仍然在被廣泛地應用著,美國國會圖書館的圖書分類中就有DDC分類。但隨著時代的進步,尤其是因特網的發展,更多專業的更細化的分類系統出現在文獻系統中,僅在美國的在版書目系統 (Books inPrint,簡稱 BIP)中,我們能看到的分類號就有杜威十進分類號(DDC),美國國會圖書館分類號(LC Class#);英國BIC主題分類(BIC Subjects Category);美國 BISAC 主題分類(BISAC Subjects Category)。

與國內文獻分類法的應用有所不同的是,國外圖書分類法的應用幾乎被限制在圖書范圍內,而對于期刊等其他文獻類型,則有更多的專業分類體系。有些是從早年的印本檢索工具書時產生,又被沿用到如今的網絡文獻型數據庫中,如工程索引分類(Ei Classification),其中包括“工程分類碼”(Ei Classification Code)、科學文摘分類,包括物理文摘分類(PA Classification)、電工與電子文摘分類(EEA Classification)、計算機與控制文摘分類(CCA Classification等;有些則直接用于網絡數據庫中,如美國計算機學會計算分類體系(ACM Computing Classification System)。這樣的專業分類還有很多,如冶金分類、生物分類等。此外還有專類文獻分類,如專利分類、標準分類等等。

6 提供特色檢索途徑

檢索途徑是數據庫提供給用戶的檢索入口,也稱檢索字段。一般的檢索途徑包括內部特征途徑,如篇名、關鍵詞、摘要、主題(國內數據庫設置的“主題”字段一般是組合“篇名”、“關鍵詞”、“摘要”三個檢索字段,與國外的依據主題詞表的主題檢索字段并不等同)、分類等;和外部特征途徑,如著者名、刊名、刊號、會議名、著者機構、機構地址、一些特定的號碼等。但目前國外有些數據庫提供的檢索途徑遠多于現有的這些我們所熟悉的檢索途徑。 

7 引入期刊評價新指標

美國《科學引文索引》創始人尤金·加菲爾特(Eugene Garfield)多年前提出了期刊評價指標“影響因子”(Impact Factor,簡稱 IF),并隨著其產品JCR(“期刊引用報告”,Journal Citation Reports)的發行而流行多年。隨著人們對影響因子的認識和研究的深入,影響因子的缺陷也逐漸暴露出來。近年來,有多個期刊評價新指標被提出,也逐步在數據庫中出現。如:美國WOS 數據庫在2009 年時推出了如下指標:

5 年影響因子(5-Year Impact FactorIF5),即在計算影響因子時采用的是5年數據,而非一般影響因子的 2 年數據。這在一定程度上避免了一般影響因子不能較好衡量被引高峰出現較晚的期刊論文學術影響力的問題。相對來說5年的影響因子更能反映期刊近幾年的平均水準。特征因子(Eigenfactor Score),旨在說明期刊越多地被高影響的期刊所引用,其影響力越高。論文影響分值(Article Influence Score),其意義在于排除同一期刊自我引用,且是經過加權的平均被引用次數。 

8 準確定位作者信息

在數據庫的檢索中,常出現作者重名、或不同語言文化背景下的作者姓名排序差異、或同一作者名字縮寫不一致、或使用不同的姓名順序引起名字變化等現象,影響了檢索結果的全面性和準確性。近年來,國外一些文獻數據庫結合社交網絡等系統平臺,為準確定位作者做了一定程度的有意義的嘗試。如:Scopus 系統的“作者身份識別系統”(AUTHOR IDENTIFIER)。該系統可以幫助用戶排除容易混淆的作者和確定唯一作者。Scopus 2000 萬作者分配了獨有的唯一識別號,將作者身份識別與引文追蹤結合運用,有助于提高檢索結果的準確率以及后續的檢索結果數據的分析。湯森路透系統的“研究人員標識號”(Researcher ID)。每位作者通過注冊都可以建立一個唯一的研究人員標識號,作者可以建立自己的著作清單,產生個人的引用信息,不用再擔心同名同姓的問題。人們也可以通過 Researcher ID 來檢索學者信息。這個標識號也被使用在湯森路透公司的文獻數據庫中。湯森路透系統的“開放學者和貢獻者身份證”(Open Researcher and Contributor ID)。為研究人員配置唯一的并可鏈接到其研究成果的身份標識碼,從而解決學術文獻中的作者姓名混淆問題,強調作者的標志。 

9 注重細節設計

細節決定成敗,這在數據庫檢索界面設計中也能有所體現。諸如各種人性化界面設計;層層縮小檢索范圍的下拉菜單;給用戶多種下載形式的選項;檢索結果頁面重現用戶的檢索命令,便于用戶核實等等,這些都給用戶利用文獻型數據庫帶來了更多的方便。

 

發表評論
評論通過審核后顯示。
移動訪問