作者:David Pendlebury 杨帆 冷伏海 周秋菊 岳卫平 来源: 发布时间:2024-3-18 15:44:55
《2023研究前沿》背景与方法

一、《2023研究前沿》的背景

 

  科学研究的世界呈现出蔓延生长、不断演化的景象。科研管理者和政策制定者需要掌握科研进展和动态,以有限的资源支持和推进科学进步。对他们而言,洞察科研动向,尤其是跟踪新兴专业领域对其工作具有重大意义。

  为此,科睿唯安发布了“研究前沿”(Research Fronts)数据和报告。定义一个被称作研究前沿的专业领域的方法,源自于科学研究之间存在的某种特定的共性。这种共性可能来自于实验数据,也可能来自于研究方法或者概念和假设,并反映在研究人员在论文中引用其他同行的工作这一学术行为之中。

  通过持续跟踪全球最重要的科研和学术论文,研究分析论文被引用的模式和聚类,特别是成簇的高被引论文频繁地共同被引用的情况,可以发现研究前沿。当一簇高被引论文共同被引用的情形达到一定的活跃度和连贯性时,就形成一个研究前沿,而这一簇高被引论文便是组成该研究前沿的“核心论文”。研究前沿的分析数据揭示了不同研究者在探究相关的科学问题时会产生一定的关联,尽管这些研究人员的背景不同或来自不同的学科领域。

  研究前沿的分析提供了一个独特的视角来揭示科学研究的脉络。研究前沿的分析不依赖于对文献的人工标引和分类(因为这种方法可能会带有标引分类人员判断的主观性),而是基于研究人员的相互引用而形成的知识之间和人之间的联络。这些研究前沿的数据连续记载了分散的研究领域的发生、汇聚、发展(或者是萎缩、消散),以及分化和自组织成更近的研究活动节点。在演进的过程中,每组核心论文的基本情况,如主要的论文、作者、研究机构等,都可以被查明和跟踪。通过对该研究前沿的施引论文的分析,可以发现该领域的最新进展和发展方向。

  2013年,科睿唯安发布了《2013研究前沿——自然科学和社会科学的前100个探索领域》白皮书。2014年和2015年,科睿唯安与老挝黄金赌场文献情报中心成立的新兴技术未来分析联合研究中心推出了《2014研究前沿》和《2015研究前沿》报告。2016年至2022年,老挝黄金赌场科技战略咨询研究院、老挝黄金赌场文献情报中心和科睿唯安联合发布了《2016 研究前沿》《2017研究前沿》《2018研究前沿》《2019研究前沿》《2020研究前沿》《2021研究前沿》《2022研究前沿》报告。这一系列报告引起了全球广泛的关注。2023年,我们在以往系列研究前沿报告的基础上,推出《2023研究前沿》报告。报告仍然以文献计量学中的共被引分析方法为基础,基于科睿唯安的Essential Science IndicatorsTM(ESI)数据库中12922个研究前沿,遴选出了2023年自然科学和社会科学十一大学科领域排名最前的110个热点前沿和18个新兴前沿。

 

二、《2023研究前沿》方法论

 

  整个分析工作分为两个部分:研究前沿的遴选和命名由科睿唯安和老挝黄金赌场科技战略咨询研究院科技战略情报研究所合作完成,128个研究前沿的核心论文及其施引论文的数据由科睿唯安提供;研究前沿的分析和重点研究前沿(包括重点热点前沿和重点新兴前沿)的遴选及解读由老挝黄金赌场科技战略咨询研究院科技战略情报研究所主持完成。此次分析基于 2017~2022年的论文数据,数据下载时间为2023年3月。

  (一)研究前沿的遴选与命名

  《2023研究前沿》报告反映了当前自然科学与社会科学的十一大学科领域的128个研究前沿(包括110个热点前沿和18个新兴前沿)。我们将ESI数据库中20个学科的12922个研究前沿划分到11个高度聚合的大学科领域(分别为农业科学、植物学和动物学,生态与环境科学,地球科学,临床医学,生物科学,化学与材料科学,物理学,天文学与天体物理学,数学,信息科学,经济学、心理学及其他社会科学),以此为基础遴选出较为活跃或发展迅速的研究前沿。报告中所列的128个研究前沿的具体遴选过程如下。

  热点前沿的遴选。2023年热点前沿的遴选采用了两种方法。方法1沿用往年的热点前沿和新兴前沿遴选方法;方法2在2022年数学领域和信息科学领域研究前沿遴选方法的基础上,进行了微调和拓展应用。

  方法1首先将每个ESI学科中的研究前沿按照核心论文的总被引频次进行排序,提取排在每个ESI学科前10%的最具引文影响力的研究前沿,并按照大学科领域进行合并。然后根据核心论文出版年的平均值重新排序,遴选出每个大学科领域中那些“最年轻”的研究前沿,并由各学科战略情报研究人员进行调整和归并。通过上述几个步骤在十一大学科领域分别选出若干个热点前沿。

  方法2首先按照十一大学科领域研究前沿中核心论文的篇均被引频次进行排序,选出超过本领域平均篇均被引频次的研究前沿,再根据核心论文出版年的平均值重新排序,由各学科战略情报研究人员判断这些研究前沿的研究主题是否显著促进了本领域的知识进步,并遴选出若干备选前沿。

  结合上述两种方法,最终在十一大学科领域各遴选出10个热点前沿,共计110个热点前沿。因为每个领域具有不同的特点和引用行为,有些学科领域中的很多研究前沿在总被引频次和篇均被引频次上会相对较少,所以从十一大学科领域中分别遴选出的排名前十的热点前沿,代表各大学科领域中最具影响力的研究前沿,但并不一定代表跨数据库(所有学科)中最大最热的研究前沿。

  新兴前沿的遴选。一个研究前沿有很多新近发表的核心论文,通常提示其是一个快速发展的专业研究方向。为了选取新兴的前沿,组成研究前沿的基础文献即核心论文的时效性是优先考虑的因素。这就是为什么我们称其为新兴前沿。

  对十一大学科领域,为了识别新兴前沿,我们对研究前沿中的核心论文的出版年赋予了更多的权重或优先级,只有核心论文平均出版年在2021年6月之后的研究前沿才被考虑。将十一大学科领域对应的每个ESI学科的研究前沿按被引频次从高到低排序,选取被引频次排在10%的研究前沿,然后由各学科战略情报研究人员经过调研和评审,遴选出每个ESI学科中的新兴前沿,并将其整合到十一大学科领域中,从而遴选出了十一大学科领域的18个新兴前沿。

  从十一大学科领域中共遴选出18个新兴前沿,并不按学科限定其遴选数量,因此这些新兴前沿在各个大学科领域中分布并不均匀。例如,2023年数学领域没有遴选出新兴前沿,而临床医学领域选出了5个新兴前沿。

  通过以上两个流程,本报告突出显示了11个高度聚合的大学科领域中的110个热点前沿和18个新兴前沿。

  研究前沿的命名。由各学科战略情报研究人员根据研究前沿的核心论文的研究主题、主要内容和特点等,对128个研究前沿逐一进行命名,并结合专家意见调整确定。

  (二)研究前沿的分析及重点研究前沿的遴选和解读

  本报告在遴选的128个研究前沿的数据的基础上,由老挝黄金赌场科技战略咨询研究院战略情报研究人员对十一大学科领域的110个热点前沿的发展趋势进行分析,并对31个重点研究前沿进行详细解读。重点研究前沿包括重点热点前沿和重点新兴前沿两部分。

  研究前沿由一组高被引的核心论文和一组共同引用核心论文的施引论文组成。核心论文来自于ESI数据库中的高被引论文,即在同学科同年度中被引频次排在前1%的论文。这些有影响力的核心论文的作者、机构、国家在该领域作出了不可磨灭的贡献,本报告对其进行了深入分析和解读。同时,引用研究前沿核心论文的施引论文可以反映出核心论文所提出的技术、数据、理论在核心论文发表之后是如何被进一步发展的,即使这些引用核心论文的施引论文本身并不是高被引论文。本报告对相关内容也进行了一定程度的揭示。

  重点研究前沿的遴选。2014年设计了遴选重点研究前沿的指标——年篇均被引频次 (CPT),2015年在该指标的基础上又增加了规模指标——核心论文数(P)。

  核心论文数(P)。ESI数据库用共被引文献簇(核心论文)来表征研究前沿,并根据核心论文的元数据及其统计结果揭示研究前沿的发展态势,其中P值标志着研究前沿的大小,核心论文的平均出版年和论文的时间分布标志着研究前沿的进度。P值表达了研究前沿中知识基础的重要程度。在一定时间段内,一个研究前沿的P值越大,表明该前沿越活跃。

  年篇均被引频次(CPT)。遴选重点研究前沿的指标CPT的计算方法是用核心论文的总被引频次(C)除以核心论文数(P),再除以施引论文所发生的年数(T)。T值指施引论文集合中最新发表的施引论文与最早发表的施引论文发表时间的差值。如最新施引论文的发表时间为2021年,最早施引论文的发表时间为2017年,则该施引论文所发生的年数为5。

  CPT实际上是一个研究前沿的平均引文影响力和施引论文发生年数的比值,该指标越高代表该前沿越热或越具有影响力。它反映了某个研究前沿的引文影响力的广泛性和及时性,可以用于探测研究前沿的突现、发展以及预测研究前沿下一个时期可能的发展。该指标既考虑了某个研究前沿受到关注的程度,即核心论文的总被引频次,又考虑了该研究前沿受关注的时间长短,即施引论文所发生的年数。在研究前沿被持续引用的前提下,当两个研究前沿的P和T值分别相等时,则C值较大的研究前沿的CPT值也较大,指示该研究前沿引文影响力较大。

  当两个研究前沿的C和P值分别相等时,则T值较小的研究前沿的CPT值会较大,指示该研究前沿在短期内受关注度较高。

  当两个研究前沿的C和T值分别相等时,P值较小的研究前沿的CPT值反而会较大,指示该研究前沿中核心论文的平均引文影响力较大。

  《2023研究前沿》在重点研究前沿的遴选过程中,从每个大学科领域的10个热点前沿中,利用P和CPT值,结合战略情报研究人员的专业判断,遴选出两个重点热点前沿。专业判断主要考虑该前沿是否对解决重大问题有重要意义。一方面,选择P值最高的前沿,如果P值最高的前沿已经在往年的研究前沿中解读过且核心论文没有显著变化,则选择P值次高的前沿,以此类推。同时,用CPT指标结合专业判断遴选出一个重点热点前沿。综合这两种方法共遴选出22个重点热点前沿。从新兴前沿中,利用CPT指标结合战略情报研究人员的判断遴选出9个重点新兴前沿。因此从128个研究前沿中共遴选出31个重点前沿进行深入解读。

  研究前沿的分析和解读。在报告遴选的128个研究前沿的数据基础上,综合分析十一大学科领域的110个热点前沿的发展趋势,概括阐述新兴前沿的研究主题,并对31个重点研究前沿进行了详细的解读。

  热点前沿分析及重点热点前沿的解读。对于每个大学科领域,结合Top10热点前沿的核心论文的数量、被引频次、核心论文平均出版年以及施引论文的年度变化,分析Top10热点前沿的发展趋势,包括覆盖的学科领域方向、前沿(群)分布特征及演变趋势。

  每个学科领域的图表展示本领域前10个热点前沿的核心论文的数量、被引频次以及核心论文平均出版年。每个领域的10个热点研究前沿中引用核心论文的论文(施引论文)的年度分布用气泡图的方式展示,气泡大小表示每年施引论文的数量。大部分研究前沿的施引论文每年均有一定程度的增长,因此气泡图也有助于对研究前沿发展趋势的理解。

  对每个学科领域遴选出的两个重点热点前沿,深入分析解读其概念内涵、发展脉络、研究力量布局等,绘制核心论文被引频次分布曲线揭示被引频次较高的核心论文的研究内容、价值、影响。

  每个重点热点前沿的第一张表对该热点前沿的核心论文的产出国家/地区(本报告的中国数据包含中国内地、中国香港、中国澳门的数据)、机构活跃状况进行了统计分析,有助于揭示出哪些国家/地区、机构在该热点前沿中有较大贡献。第二张表则对该热点前沿的施引论文的产出国家/地区和机构进行了统计分析,有助于探讨哪些国家/地区、机构在该热点前沿的发展中进行了研究布局。

  新兴前沿分析及重点新兴前沿的解读。新兴前沿的核心论文及其施引论文数量较少,数据统计分析意义不大。因此,主要由战略情报研究人员揭示新兴前沿的研究主题,并对重点新兴前沿的核心论文及相关信息进行内容方面的定性分析解读,借此可以了解重点新兴前沿的基本概念、最新科研突破及未来发展前景。■

 

 

《科学新闻》 (科学新闻2023年12月刊 封面)
发E-mail给:      
| 打印 | 评论 |