CiteSpaceⅡ:科学文献中新趋势与新动态的识别与可视化.pdf
- 文档编号:3430940
- 上传时间:2023-05-05
- 格式:PDF
- 页数:21
- 大小:1.49MB
CiteSpaceⅡ:科学文献中新趋势与新动态的识别与可视化.pdf
《CiteSpaceⅡ:科学文献中新趋势与新动态的识别与可视化.pdf》由会员分享,可在线阅读,更多相关《CiteSpaceⅡ:科学文献中新趋势与新动态的识别与可视化.pdf(21页珍藏版)》请在冰点文库上搜索。
情报学报ISSN10000135第28卷第3期401421,2009年6月JOURNALOFTHECHINASOCIETYFORSCIENFICANDTECHNICALINFORMATIONISSN100o一0135Vo128No3401421June2009doi:
103772jissn10000135200903012CiteSpaceII:
科学文献中新趋势与新动态的识别与可视化陈超美(著)(Drexel大学信息科学与技术学院,美国费城)陈悦侯剑华梁永霞(译)(1大连理工大学21世纪发展研究中心WISE实验室,大连116024;2浙江大学公共管理学院,杭州310027)【编者按】此文是国际著名信息可视化专家陈超美博士的代表作,该文系统阐述了他所研制的用于文献引文网络分析的CiteSpaceII可视化软件的原理、特点及应用案例。
它属于多元、分时、动态的第二代信息可视化技术。
其独到的创新之处,在于用CiteSpaee绘制的一幅科学知识图谱上,能够显示一个学科或知识域在一定时期发展的趋势与动向,形成若干研究前沿领域的演进历程。
如今,知识图谱和信息可视化在各国蓬勃兴起,但陈超美博士开发的历时性动态可视化技术迄今尚十分鲜见,被公认于居国际领先水平。
目前已升级到可自动聚类与术语标识的CiteSpace2-2最新版本,但本文仍是这一技术的基础性文献。
为在我国推广和普及作为科学计量学前沿的科学知识图谱与知识可视化方法,征得作者同意,特在本期全文发表此文的中译本。
摘要本文介绍了在科学文献中识别并显示科学发展新趋势和新动态的一种通用方法的最新研究进展。
这项研究在理论和方法上极大地促进了知识领域可视化研究。
研究领域(specialty)的概念和可视化基于信息科学中的两个概念“研究前沿”和“知识基础”间的时变对偶(timevariantduality)。
研究前沿(researchfront)被定义为一组突现的动态概念和潜在的研究问题。
研究前沿的知识基础(intellecturebase)是它在科学文献中(即由引用研究前沿术语的科学文献所形成的演化网络)的引文和共引轨迹。
Kleinberg设计的跳跃检测算法(burstdetectionalgorithm)适用于辨认新兴研究前沿专业术语概念。
Freeman提出的中间中心性测度可以用来使表示潜在范式变化的关键点凸显出来。
我们设计并实现了两个互补的视图:
聚类视图(clusterviews)和时区视图(timezoneviews)。
这种方法的贡献在于:
通过对研究前沿术语的算法运算,在动态中认识知识基础的本质;用研究前沿专业术语概念明确标出共引聚类的确切含义;直观地和靠算法识别的关键点的一致性大大简化了可视化的复杂性。
CiteSpace应用Java程序实现了大规模生物集群灭绝(massextinction)(19812004年)和恐怖主义(terrorism)(19902003年)两个研究领域的建模和可视化过程。
可视化网络中的突出的趋势和关键点的作用经各自领域专家直接验证,这些专家本身就是关键点文章的的作者。
本文讨论了这项研究的实际意义,并明确了今后研究工作中存在的一系列挑战和机会。
关键词CiteSpace信息可视化科学前沿图谱知识传播CiteSpace:
DetectingandVisualizingEmergingTrendsandTransientPatternsinScientificLiteratureChenChaomei(CollegeofInformationScienceandTechnology,DrexelUniversity,Philadelphia,USA)收稿日期:
2007年8月24日作者简介:
陈超美,男,1960年生,美国德雷赛尔大学信息科学与技术学院副教授(终身教职),1983年获南开大学理论数学学士,1991年获牛津大学计算硕士,1995年获利物浦大学计算机学博士,主要学科领域与研究方向:
信息科学、信息可视化和科学计量学,包括信息与知识的可视化技术、复杂网络分析、科学前沿图谱绘制、科学技术发展新态势探测等方向。
Email:
chaomeiehenci8drexe1edu。
一4O1一情报学报第28卷第3期2009年6月ChenYueHouJianhuaandLiangYongxia(1CenterforDevelopmentStudieson21stCentury,WISELab,DalianUniversityofTechnology,Dalian1160242NationalInstituteforInnovationManagement,ZhejlangUniversity,Hangzhou310027)AbstractThisarticledescribesthelatestdevelopmentofagenericapproachtodetectingandvisualizingemergingtrendsandtransientpatternsinscientificliteratureTheworkmakessubstantialtheoreticalandmethodologicalcontributionstoprogressiveknowledgedomainvisualizationAspecialtyisconceptualizedandvisualizedasatimevariantdualitybetweentwofundamentalconceptsininformationscience:
researchfrontsandintellectualbasesAresearchfrontisdefinedasanemergentandtransientgroupingofconceptsandunderlyingresearchissuesTheintellectualbaseofaresearchfrontisitscitationandcocitationfootprintinscientificliteratureanevolvingnetworkofscientificpublicationscitedbyresearchfrontconceptsKleinbergS(2002)burstdetectionalgorithmisadaptedtoidentifyemergentresearchfrontconceptsFreemanS(1979)betweennesscentralimetricisusedtohighlightpotentialpivotalpointsofparadigmshiftovertimeTwocomplementaryvisualizationviewsaredesignedandimplemented:
clusterviewsandtimezoneviewsThecontributionsoftheapproacharethatthenatureofanintellectualbaseisalgorithmicallyandtemporallyidentifiedbyemergentresearchfrontterms,thevalueofaco-citationclusterisexplicitlyinterpretedintermsofresearchfrontconcepts,andvisuallyprominentandalgorithmieallydetectedpivotalpointssubstantiallyreducethecomplexityofavisualizednetworkThemodelingandvisualizationprocessisimplementedinCiteSpace11,aJavaapplication,andappliedtotheanalysisoftworesearchfields:
nlassextinction(19812004)andterrorism(19902003)Prominenttrendsandpivotalpointsinvisualizednetworkswereverifiedincollaborationwithdomainexperts,whoaretheauthorsofpivotalpointarticlesPracticalimplicationsoftheworkarediscussedAnumberofchallengesandopportunitiesforfuturestudiesareidentifiedKeywordsCiteSpace,informationvisualization,sciencefrontiersmapping,knowledgecommunication1引言根据引文半衰期(citationhalf-lives)的明显不同,科学文献可分为持续高被引的经典文献(classicarticles)和在短暂时间内达到被引峰值的过渡文献(transientarticles)C3。
过渡文献比经典文献更为普遍。
一篇研究文献被持续引用的平均时间长度与潜在研究领域的发展速度密切相关。
了解过渡文献转变为科学领域的动力机制,对于各学科领域的科学家都具有重要的现实意义。
科学文献的新趋势(Emergenttrends)和突变(abruptchanges)是有内部和外部原因的。
典型的内因包括新发现和科学重大突破,例如,在大规模生物集群灭绝(massextintion)中陨石坑的发现和天文学中超大规模黑洞的发现。
外因是指那些可能引发科学家从新角度研究问题的事件。
例如,911恐怖主义袭击引发了在国家安全、国家卫生、创伤后应激障碍(posttraumaticstressdisorder,D)等领域一系列新课题的提出。
识别和理解由这些事件引发的学科发展新趋势和突变能极大的提高科学家适时应对这些变化的能力。
需要指出的是复杂系统中的大规模变化在没有明显引发事件时可能表现出自组织临界性(Self-organizedcriticality,SOC)63。
尽管也有人认402为科学文献的增长同自组织临界性相关,但本文主要探讨与重大事件相关的变化。
普赖斯最早提出“研究前沿”的概念,用它来描述研究领域的动态本质。
普赖斯观察到科学家似乎倾向于引用最新发表的文章,并将其称为即时因子(immediacyfactor)Is。
某个领域的研究前沿是由科学家积极引用的文章所体现的。
普赖斯认为,某个研究前沿大概由4050篇最近发表的文章组成。
迄今为止,对研究前沿至少有3种不同的认识形态:
共被引文献聚类,共被引文献聚类和所有引用这个聚类的文章mJ,引用共群文章的文献聚类。
知识基础是一个有利于进一步明晰研究前沿本质的概念。
如果我们把研究前沿定义为一个研究领域的发展状况(如研究思路),那么研究前沿的引文就形成了相应的知识基础。
一个研究领域可以被概念化成一个从研究前沿(t)到知识基础n(t)的时间映射(t),即,(t):
xr(t)力(t)我们研究的目的是要开发出一种能够识别和显示(t)随时间发展的新趋势和突变的普适方法。
在这里,(t)是一组在t时刻与新趋势和突变密切相关的词和短语(如专业术语),这些专业术语被称作研究前沿术语。
(t)是由出现前沿术语的文章引CiteSpace:
科学文献中新趋势与新动态的识别与可视化用的大量文章组成,它们之间的关系如下:
(t):
,(t)一(t)(t)=termItermESlitl。
UsabUSdUSideni6IsHotTopic(term,t)国(f)=articleIterm()termarticle0article0-articleStitle表示一系列标题专业术语,IsHotTopic(term,t)表示布尔函数,article0一article表示article0引用article。
本文介绍两个实例应用,说明内在因素和外在因素对研究领域发展的影响。
本文逻辑结构如下:
首先,对检测和显示动态网络中新趋势和突变的研究,以及对研究前沿进行定量研究的相关文献进行了概述。
然后,介绍了一种用于识别和显示科学文献中发展趋势与突变(尤指由引发事件而产生的变化)的新方法。
这项研究能使知识领域分析专家和科学家清晰地辨别和认识科学发展的结构和态势。
我们用大规模生物集群灭绝研究(19812003年)和恐怖主义研究(19902003年)两个实例来阐明这种新方法的应用,最终的研究前沿视图经该领域专家鉴定而被证实,分析结果也经大量相关文献内容的查阅而得到考证。
2识别和跟踪研究领域的演变研究者们对用于辨别和跟踪学科发展前沿的定量方法已经做了大量的研究。
研究前沿的动态本质,使得科学家、科研政策制定者和许多追赶科学快速发展的人们面临着巨大的挑战。
理解研究前沿演变的动力机制对科学家:
分析者和决策者辨认科学发展的新趋势和突变是非常关键的。
21研究前沿和知识基础研究前沿代表了一个研究领域的思想现状。
普赖斯注意到一个非常有趣的现象,即在科学引文网络中,越是频繁被引用的文章越可能是新近发表的文章。
这种即时效果很好地解释了一些文章在发表很多年后将会被完全遗忘的现象。
普赖斯将由Burton和Kebler早在1960提出的猜想表达为期刊文献可能是由两种有着不同半衰期的文献组成经典文献和过渡文献,过渡文献实质上是对应于研究前沿。
普赖斯认为,“研究前沿是基于新近研究成果的,网络也变得越来越紧密”,他估计一篇文章之前有3040篇相关文章发表,由此构成研究前沿。
普赖斯将200篇有关Nrays主题的文章按年代顺序进行排列,通过引文矩阵(列引用行)来预测学科的研究前沿,研究前沿的包容界限是一篇引文发表前的大约50篇文章。
很明显,通过研究相对小的文献网络的变化是有助于追踪不可计数的大量文献的发展轨迹。
,一与研究前沿相关的主要问题有:
它是怎么开始的?
现状如何?
其演化中的重要路径是什么?
为了回答这样的问题,我们需要识别和分析新趋势的出现和与研究前沿密切相关的突变。
我们还需要确定在某个特定时间上,基于相关知识基础的研究前沿的关注焦点,进而揭示导致研究前沿演变的重要知识转折点(intellectualturningpoints),并发掘不同研究前沿问的联系。
很多研究者从不同的角度研究学科领域的演变。
Small和Griffith认为,共被引文章聚类表征着当前活跃的研究领域。
共引聚类的本质决定于选择的词集(wordprofiles)。
假设一个聚类中的文章D被篇文章DD,D引用,选出在D文章标题中最常出现的四个词形成文章D的词集。
集合一个聚类中所有词集,选出出现频次最高的个词,就形成了词聚类库(Nwordcluster-profile)。
这种词库的最大优势就是简单,然而,初始词集的选择因受到K篇引用文献的标题限制,可能不足以揭示潜在主题领域的动态变化。
Bream等将一个研究领域定义为“一群科学研究者关注的一系列相关问题和概念”。
他们根据共引聚类间的相似性来分析一个领域发展的连续性和稳定性。
两个共引聚类的相似性依据于聚类词集的比较,尽管他们还没有提供图论或是其它的可视图形来说明研究领域从一个阶段到另一个阶段的变化,但他们辨别出同一个学科在不同发展阶段的系列相似共引聚类。
Persson基于19861990年间在美国信息科学学会会刊上发表的一篇关于研究前沿和知识基础的文章中认为研究前沿和知识基础的区别在于:
“
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CiteSpace 科学 文献 新趋势 动态 识别 可视化
![提示](https://static.bingdoc.com/images/bang_tan.gif)