俗话说,三句不离本行。本文题目中的这几个英文简称,是学术科技出版界人士们经常讨论的话题之一。国内出版界的同行们也在零星地向国人们介绍,更有专门从事数据统计与信息处理的专家们对其进行剖析和栓释。但近年来,这些“出版术语”也成为国内不少学者甚至研究生们的“口头禅” 乃至“紧箍咒”,倒是很有中国特色。本文无心对国内的有关政策指手划脚,但有意从出版的角度,把这几个概念的来龙去脉在此简要地介绍一下,希望能帮助学者们从正面理解它们在出版范畴内积极的作用,同时也关注它们相关的负面效果。
SCI是科学引文索引(Science Citation Index)的英文简称,旨在显示学术科技论文在发表之后在其他学术科技期刊中的引用情况。谈到科学引文索引(SCI),难免先要说说它的主人,ISI,即科学信息研究所 (Institute For Scientific Information)。该研究所是科学引文索引(SCI)诞生的摇篮,没有科学信息研究所(ISI),也就不会有科学引文索引(SCI)了。但说到科学信息研究所(ISI),就又必然提到它的创始人Eugene (Gene) Garfield博士。Eugene于1925年9月26日生于美国纽约,后于1961年获得宾西法尼亚大学的博士学位, 是文献计量学和科学计量学的创始人之一。他不仅是位才华横溢的科学家,还是一位有头脑和前瞻意识的市场开拓者。他于二十世纪六十年代初创立的科学信息研究所(ISI)便是很好的证明。研究所的成立,不仅发挥了他个人的学术才华,还为其创建的学术理论提供了充分展示的平台,不愧是变知识为财富的典范。据说引发Garfield博士和其同伴这一创举的火花源于Vanevar Bush先生于1945年发表的那篇著名文章 “As We May Think” ,有兴趣的读者不妨去看看,也许同样能引发奇思异想。
科学引文索引(SCI)收录的科技期刊自1961年后,数量遂年增加。目前收录的期刊从印本到网上期刊,加起来大约有6400 之众。除了科学引文索引(SCI) 以外,还有社会科学引文索引 (Social Sciences Citation Index,简称SSCI,始于1956年)和艺术与人文科学引文索引 (Arts and Humanities Citation Index,简称AHCI,始于1975年) 。这样的发展壮大,一方面反映了市场的需求,另一方面也反映出这几大领域期刊的迅猛发展。但值得一提的是,科学引文索引(SCI)已不再是国际科技信息市场上独领风骚的期刊索引,近年来随着电子出版的日益成熟,已经涌现出不少新秀,比如CiteSeer 和Google Scholar (GS) 等。但它们在国内的声望和影响,目前远不如科学引文索引(SCI)。
由科学信息研究所(ISI)推出的索引系列数据除了常用的科学引文索引(SCI) 以外,还有即得索引 (The Immediacy Index),引用半周期(The Cited Half-Life),和总计影响因子(The Aggregate Impact Factor) 等 。每年承载这些数据的载体便是著名的期刊引用报告 (Journal Citation Reports) ,英文简称为JCR。该报告的出版初衷是通过分析文章被引用的次数和相应的数据统计,定量化的评估国际上相同学科/领域里学术和科技期刊的水平,为同一个学科/领域的不同期刊之间的相互比较提供方便。该报告出版后,逐渐地被学术和研究界接受,广泛地成为评价学术科技期刊的参考标尺,是衡量一本学术期刊是否重要的“量化”代言人。在50年代后国际学术科技期刊如雨后春笋般地诞生和发展的形势下,该报告的出现的确填补了图书馆管理和信息交流的市场空缺,受到管理者的欢迎。除了它的学术价值外,其商业价值同样令人瞠目。价格不菲的单价,众多的订户,为其经营者带来滚滚红利。仔细分析该报告,有两个特点。其一,它试图以量化的形式把各类期刊的水平数字化,便於比较。但使用的计算方法是否完全科学和公平,至今在部分学者中仍有很大的争论和分歧;其二,报告中的数据,不论从采样(期刊) 还是分析手段,都有不尽人意之处。比如几乎所有引用和被引用的期刊均是英文的,又比如许多文章因为是在商业性的出版物中被引用,便不能算在引用的次数之中。还有,搞出版的人都很清楚,不同领域的期刊虽然有许多共性,但同样存在着异性,统统按一个数据来衡量,难免有点过於简单化。国际上许多学者认为,该报告最好用来提供科学的参考意见,不适宜用来当做衡量所有期刊高低上下的绝对准绳。
期刊引用报告 (JCR)的卖点之一便是刊物的影响因子 (Impact Factor,简称IF 或JIF (Journal Impact Factor)) 。它是由刊物两年内发表的全部文章的被引用情况决定的。简单地说,如果一本科技期刊两年内发表的全部文章在第三年内都被引用过一次,则该期刊该年度(第三年)的影响因子即为1。不尽人意的是,因为两年内的引用数据要在第三年才进入计算程序,加上数据的收集以年为单位,故等到影响因子(IF)在期刊引用报告(JCR)中发表时,已经是第四个年头了。对新创刊的期刊显得尤为尴尬。它们头两年发表的文章,虽然有的马上被其他文章/期刊引用了,但在报告里,该刊物的影响因子在创刊后的两年里只能标明为零。如此令人费解的地方还不少,同样也是引发争议的原因。
在此背景下,又涌现出另一种影响因子,叫PAGERANK。它与科学引文索引(SCI)的影响因子的计算过程大致相似,但在数据处理过程中对影响广泛的重量级期刊和相对弱势的期刊区别对待。按这两种不同的影响因子产生的期刊排行榜,在同一年是不同的。以2006年为例,按科学引文索引(SCI)的影响因子(IF)排序,“自然”和“科学”分列第6和第8位;若按PAGERANK的结果排序,“自然”和“科学”分别为排行榜的状元和探花,该结果似乎更贴近现实中大部分学者的感觉。如果按两者结合的影响因子(Combined Impact Factor) 排行,榜上有名的前10位期刊和影响因子分别是:NATURE (51.97), SCIENCE (48.78), NEW ENGLAND JOURNAL OF MEDICINE (19.84), CELL (15.34), PNAS (14.88), JOURNAL OF BIOLOGICAL CHEMISTRY(10.62), JAMA (8.49), THE LANCET (7.78), NAT GENET (7.56), 和NATURE MEDICINE (6.53) 。从这个排序我们可以看到两个既有趣又同样令人深思的现象。其一,从第一到第十名,结合影响因子的数值相差45分之巨,换句话说,第十名只是第一名的近十分之一;其二,被科学引文索引(SCI)收录的期刊有几千本之多,除了这10本期刊,其它的云云众刊的结合影响因子在2006年都低于6.53,而且低于2甚至1的“大有人(刊)在”。
通过以上的介绍不难看出,不论是ISI,SCI,JCR,还是IF(JIF),都与试图分析和衡量学术科技期刊有关,目的主要是在众多的期刊之间,找到一个量化的平台进行相互间的比较,为信息管理和读者阅读提供一个简单易懂的参考标准。这个标准不是万能的,更不是放之四海而皆准的。不同的领域,不同的年份,不同的刊物,因为发表文章的不同,因为出版周期的不同,因为文章引用方式的不同,其引用量会有很大的出入。以单一的定点定量的概念来绝对地考量期刊的价值或级别,在出版和研究范畴,均没有太大的实际意义。换个角度说,如果把这样一个衡量学术科技期刊的参考系数,变为考量作者甚至研究单位业绩或政纪的绝对标准,决非其创立者的初衷,恐怕也不是其用武之地。
总之,不论是Eugene (Gene) Garfield博士创办的信息研究所(ISI,如今已经并入国际出版巨头之一的Thomson Scientific集团),还是他推出的期刊引用报告(JCR) ;不论是科学引文索引(SCI),还是期刊的影响因子(IF/JIF) ,对二十世纪中叶以后的信息和科技研究,尤其对数据统计与分析应用领域,做出了很大的贡献。但同时不可否认的是,作为出版品牌,其商业价值更是巨大的。从客观的角度分析,该品牌近年来在新的经营者的管理下,正在做更进一步的产品开发和市场扩充。而对用户们而言,要充分利用该产品提供的信息服务,为己所用,而不是被其左右。否则,在教学科研等运作中引发的负面效果,将不仅是商品本身的遗憾,而且更是使用者自身的悲哀。