浅析万方、维普、CNKI三大全文数据库

2019-01-17 作者:小编

关键词:维普 CNKI 万方 分析比较
摘要:在概括介绍基本情况的基础上,本文从检索功能、检索结果、检索界面等方面对《中国期刊全文网》、《万方数据资源系统数字化期刊》、《中文科技期刊数据库》国内3大期刊全文库进行深入地分析与比较,归纳总结各数据库的检索特点及差异,以期为各类读者及机构提供有效的参考与帮助。
中图分类号:G25文献标识码:A文章编号:1003-1588(2012)01-0088-03

随着期刊电子化的发展,期刊全文数据库的发展也越来越快。对各高校图书馆而言,电子期刊在采购中所占的比重正逐年递增。如何深入地了解、分析并掌握目前我国比较有代表性的全文数据库的特点,并对其进行更好地开发和利用,直接决定了高校图书馆信息服务水平的高低。
1万方、维普、CNKI三大全文数据库的基本情况
中国期刊全文网(简称“CNKI”)是由清华同方光盘股份有限公司、光盘国家工程研究中心和中国学术期刊(光盘版)电子杂志社共同研制出版的综合性全文数据库。创建于1994年,1996年12月正式发行,是我国个连续出版的大型集成化学术期刊全文数据库。通过建立镜像站点、互联网远程访问(包库)等方式提供服务。【1】
中文科技期刊数据库(简称“维普”)由科技部西南信息中心主办,重庆资讯有限公司制作,收录了1989年以来的文献资料,2001年正式出版发行。其前身为《中文科技期刊篇名数据库》,是目前我国收录期刊全的综合性全文期刊文献数据库。【2】
万方数据资源系统数字化期刊(简称“万方”)是万方数据库资源系统三大组成部分之一,由中国科技信息研究所属下的北京万方数据股份有限公司创办。它是国家“九五”重点科技攻关项目“科技期刊网络服务系统”的组成部分,由万方数据网络中心具体运行。【3】2001年年底数字化期刊便囊括了我国所有科技学术期刊。
2三大全文数据库检索结果的分析比较PaperisOk论文查重网提供知网查重免费入口服务,所有论文查重系统均来之官网检测,查重报告均支持验证真伪!不论您学习哪个专业,写作什么类型的论文,只要您有文本相似度检测的需求,知网查重检测系统总有一个版本适合您。
能够评价数据库资源丰富程度的指标有很多,比如收录期刊的数量和回溯时间、覆盖范围,它们反映了数据库的性、完整性,在一定程度上决定着检索结果的优劣。此外,核心刊的比率代表着数据库的质量,而更新率则体现其收录文献的新颖性和及时性,更新速度越快,时效性就越高。一般论文发表在1-2年内达到引文峰值阶段,而收录过程中造成的时差则严重影响了文献资源利用时效性。在此我们就三种数据库的上述指标进行比较(见表1)。

表1三种全文数据库的基本情况
数据库名 维普返回数 CNKI返回数 万方返回数
收录时间 1989年以来 1994年以来 1998年以来
收录数量
(2007年底) 12,000种(含全文8,000余种,港台地区108种),其中核心刊1,810种,占15.1%。
8,712种,其中核心刊1,750多种,占总量的20.1%。 6,000多种,其中核心刊2,374种,占40%,质量占有优势。
学科范围
经济管理、教育科学、图书情报、自然科学、农业科学、医药卫生、工程技术等7大类,27个专辑,200个专题。 理工A(数理科学)、理工B(化学化工能源与材料)、理工C(工业技术)、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学、电子技术与信息科学9大类,126个专题。 基础科学、医药卫生、农业科学、工业技术、人文科学等8大类,77个小类。
文献类型 仅期刊论文 期刊论文、会议论文、博硕士学位论文、2,000部工具书,1,000多种年鉴及报纸、专利、标准等。 期刊论文、中外会议、博硕士学位论文、中外专利、中外标准、科技成果(题录)、企业信息(题录)、法律法规、科技动态、OA

比较显示,以全面为特色的维普几乎涵盖全部国内中文出版物,包括具有一定影响且连续性的非正式发行刊物。它偏重于地方性期刊和研究方面的论文,内容以自然科学和工程技术为主(期刊量比“CNKI”多出近50%),但在文史哲方面则几乎是空白。收录时间长,早可回溯到1989年,较适合用户进行回溯性检索,如追溯某一事物发展脉络、某一学科研究发展历程、或以收集资料的丰富性和完整性为检索目标的文献,而以精为特点的CNKI,则重点收录科学领域的核心期刊和具有专业特色的中西文期刊,以及在线工具书、年鉴、报纸、标准、专利等丰富的资源,因其更新速度快,更适合用户进行查新,从事课题跟踪、定题服务性质的文献检索。万方重点收录科技部论文统计源的核心期刊,虽然在这三个库中收录的少,但核心期刊的比例高,收录文献质量高。除期刊外,还有会议论文、博硕士学位论文、中外标准、专利及国内科技成果等,类型丰富,内容以科技信息为主,兼顾人文社会科学,适合工科或理工科院校使用。【4】
对于三大数据库自身特点、收录范围及学科类型的差别,我们通过检索实例来证明一下。在设定相同检索入口及限定条件的情况下,分别选择“题名”、“关键词”、“著者”和“分类”等四个检索入口进行检索,得出相应的结果(见表2)。

表2检索结果数量统计表

以著者字段的检索为例,钱学森教授是从事物理研究的,他所发表的论文是科技方面的,在上表中“CNKI”收录了12篇,“万方”收录了11篇,而“VIP”收录了30篇;张靖龙教授是从事文学研究的,在上表中“CNKI”收录了22篇,“万方”收录了2篇,“VIP”收录了5篇。从这个对比中可以看出,三个数据库中综合性强的是“CNKI”,收录理工科科技信息文献多的是“VIP”。5
此外,值得一提的是,三种全文数据库所收录的期刊几乎囊括了国内的核心期刊,出现重复不可避免。通过比较“CNKI”和“维普”收录期刊名录,得知两数据库期刊收录重复率约为50%,说明两数据库互补性很强,相互不可替代。而“万方”收录期刊与这两个数据库的重复率较高,在80%以上。【6】

3三大全文数据库检索功能的分析比较
数据库检索系统的好坏,是评价数据库质量高低的一个非常重要的指标。上述三种全文数据库的检索系统在检索方式、检索入口、检索技巧等方面各有不同(见表3)。
表3检索功能比较

3.1检索方式
三个全文数据库都配备了强大的检索系统,提供了导航检索、简单检索和复合检索等三种检索方式,其中导航检索都包括了期刊名称和学科分类两项功能,读者不需要输入具体的检索词,就可按照分类或期刊名称,通过层层递进的方式,检索到某一专题下的论文,并按题录链接浏览全文。检索方法的使用可谓通俗易懂、操作简便。数据库检索选择的范围较为灵活,可以选择一个或多个专辑进行检索,并且在同一专辑下,可选择一个或多个专题进行检索。

3.2检索途径
三个数据库都包括篇名、关键词、文摘、刊名、作者、机构6个检索途径,在主题、分类、全文、引文及基金等检索入口又各有特色,具体表现在以下几方面:【7】
3.2.1主题检索 
CNKI提供了主题检索,在每个检索入口提供了检索词字典,使用它可以规范所输入的检索词汇,一个概念仅用一个规范化词汇来表达,避免了同义词、多义词等现象的出现,使检索更加规范便捷。随着科学技术的突飞猛进,新学科、新技术层出不穷,当主题词表难以满足文献标引工作的需要时,关键词检索就不可或缺了。相对而言,维普更倾向于使用关键词来做标引,以精准的揭示文献主题,比较符合人们的检索习惯,但由此却增加了自由选词、用词的难度。为弥补这方面的不足,维普在主题标引词基础上编制了同义词词库及同名作者库,有助于相关文献的查找提高查全率,或者是通过限定作者单位提高查准率。
3.2.2分类检索
关键词只是概念的表现形式,不能从整体上反映文献的内容特征,缺少系统性地组织和梳理,也不能体现概念之间的等级和相关关系。而通过标准化的概念体系及知识等级结构,分类检索可使用户“鸟瞰全局”,并借助相关的背景知识实现对所需信息的浏览、判断、评价和定位。【8】维普、CNKI提供了分类检索。对于关键词不规范的学科和领域,通过分类号检索,可有效弥补篇名、关键词、文摘等检索途径的不足,以便提高文献的查准率。
3.2.3全文检索
“CNKI”提供了“全文检索”,对应于“VIP”的“任意字段检索”。在对相同检索词进行检索时发现,前者的命中率较高,在一定程度上弥补了主题标引缺乏规范化所带来的漏查,有利于提高文献的查全率,但往往检出的文献太多,用户难以挑选到合适的文章,该检索方式适用于前沿性课题或文献量较少的冷门课题检索,“VIP”的“任意字段检索”是在文章中除正文以外的其他部分进行检索,检出率虽然低于全文检索,但相对比较实用。【9,10】
3.2.4基金检索
基金论文是由国家各级政府部门、各类基金组织和企事业单位提供科研经费而产生的科研论文,普遍具备方法先进、学术水平高、研究深入等特点,能较好地反映该学科的发展趋势和动态。通过“基金”途径查找文献,可获得某一课题连续性研究成果。维普、CNKI提供了“基金”检索。
3.2.5关键词检索
需要注意的是,三大数据库虽都有关键词检索,但功能并不一样:从数量上看,CNKI关键词字段检索出的文献,实际上涵盖了篇名、关键词及中文文摘三个字段中出现的该检索词的所有文献,也就是说其检索结果是篇名、关键词及中文文摘三个字段结果的累积,其作用相当于维普的“任意字段”;从质量上看,CNKI是原文照录方式,不再进行二次加工和补充,而关键词是由不了解标引规则的作者给的,片面性、随意性较大,标引质量难以保证。相比较而言,维普的质量较高,因其同义词库是在参考、修改、补充原文作者给出关键词的基础上拟定的,经过规范化加工,标引深度得到较好的保证。
4小结
通过对万方、维普、CNKI三大全文库的比较分析,从检索功能上来看,三个数据库浏览方式和检索方式均呈现出多样化的特点,检索字段广、多、专,检索技术较为先进,对检索结果的处理也比较全面。但由于各库在收录期刊时,其侧重点、期刊的数量、品质又各自不同,为用户的使用带来了诸多的不便。个别时候用户为了查询某篇文章要在万方、维普、和CNKI三个数据库中分别进行查找,使文献的检索利用率大大地降低了。若是能把这三大全文数据库资源整合起来,建立统一的检索平台进行浏览操作,则用户在使用时,既可以实现单库检索,又能够实现跨库检索,查找起来就更加便捷了。

参考文献:
[1]hp://www.cnki.ne.
[2]hp://www.ydaa.com.
[3]hp://www.wanfangdaa.com.cn.
[4]曹开江.我国三大全文期刊数据库医学数据质量的比较研究[J].图书馆理论与实践,2008(3):25.
[5]韩红,朱江,王桦等.清华同方(CNKI)与重庆维普(VIP)网络版中文期刊全文数据库的比较研究[J].现代图书情报技术,2003(6):62.
[6]陆一.同方、万方、维普全文期刊数据库网上引文检索的比较[J].中华医学图书情报杂志,2004 (3):59-60.
[7]宋凌云.维普资讯网和万方数据资源系统的引文检索之比较[J].黑龙江科技信息,2008(16):64.
[8]王平南,吴娅娜.国内三大期刊全文数据库优势与特色评述[J].图书馆,2008(5): 89.
[9]陆一.同方、万方、维普全文期刊数据库网上引文检索的比较[J].中华医学图书情报杂志,2004 (3):59-60.
[10]宋凌云.维普资讯网和万方数据资源系统的引文检索之比较[J].黑龙江科技信息,2008(16):64.

28
来源:河南图书馆学刊 2012年1期

.—— END ——.