科技创新研究热点及演化的可视化分析

分类:论文范文 发表时间:2021-12-09 08:58

  摘要:针对CNKI数据库中1998—2020年科技创新研究的2853篇文献,运用科学计量学方法,对科技创新的研究热点及演化开展研究。借助CiteSpace5.7.R2可视化工具,绘制科技创新研究的知识图谱,主要包括关键词共现分析和突变分布、关键词聚类分析、关键词时间线分析和时区分析。研究表明,创新是引领发展的第一动力,始终坚持创新驱动发展,把科技创新摆在发展全局的核心位置,加快建设科技强国。但科技创新研究在不同时期的侧重点有所不同:2000—2006年,农业科技创新、高校科技创新、研究型大学、科技创新体系与机制等成为主流的研究热点;2006—2012年,科技创新体系、指标体系、知识产权、科技创新对策、技术创新、科技创新评价、科技创新能力、科技创新人才成为研究热点;2012—2020年,科技创新的研究热点主要集中在科技创新政策、创新驱动等方面。

  关键词:CiteSpace;科技创新;知识图谱;研究热点;关键词

  党的十六届五中全会明确提出了增强自主创新能力、建设创新型的战略。随后开始加速推动科技创新发展。党的十八大以来,政府不断完善科技创新体制机制,鼓励创新主体多元化,推动政产学研合作创新,推进科技资源优化配置,加速提升科技创新能力。党的十九届五中全会明确提出“坚持创新在我国现代化建设全局中的核心地位,把科技自立自强作为发展的战略支撑”,强调“面向世界科技前沿、面向经济主战场,完善创新体系,加快建设科技强国”。“十四五”规划《纲要》从经济发展、创新驱动、民生福祉、绿色生态、安全保障5个方面,制定落实了“十四五”时期经济社会发展的主要指标,其中,创新驱动是推动国民经济和社会发展的重要驱动力,处于发展全局的核心位置。同时,“十四五”规划《纲要》提出了“完善创新体系,提升企业技术创新能力,激发人才创新活力,完善科技创新体制机制,全社会研发经费投入年均增长7%以上。”这为进一步强化战略科技力量,加快实现“跻身创新型前列”的发展战略目标提供了重要的战略支撑。为此,开展科技创新研究热点及演化的可视化分析研究,对于把握科技创新的研究热点和未来研究方向,完善创新体系具有重要意义。

科技创新研究热点及演化的可视化分析

  1研究方法与数据来源

  1.1研究方法

  陈超美教授开发的CiteSpace软件,作为用于分析和可视化共引网络的重要工具,能够将一个知识领域的演进历程集中展现在一幅引文网络图谱上,帮助把知识图谱上的引文节点文献和共引聚类所表征的研究前沿自动标识出来[1]。CiteSpace软件主要包含3种常用可视化方式:聚类视图、时间线视图、时区视图。其中聚类视图侧重于体现聚类间的结构特征,时间线视图侧重于勾画聚类之间的关系和某个聚类中文献的历史跨度,时区视图侧重于从时间维度上来表示知识演进的视图。为此,应用CiteSpace软件,通过国内科技创新研究文献的科学计量学分析,对科技创新的研究热点及演化开展研究。

  1.2数据来源

  科技创新研究热点及演化的数据样本取自CNKI数据库中的CSSCI期刊文献,文献检索词为“科技创新”,文献检索时间为“1998—2020年”。通过剔除掉会议访谈、会议综述、会议报告等不利于数据分析的文献,共得到2853篇文献。同时,选择TOP50为选择标准,设置时间切片为1,调节阈值得到科技创新研究的关键词共现图谱、关键词聚类图谱、时间线图、时区图。

  2科技创新研究的关键词共现分析与突变分布

  2.1关键词共现分析

  关键词是一篇文章的精髓,出现次数最多的关键词常被用来确定某个研究领域的热点主题[2]。使用CiteSpace5.7.R2中的关键词共现,将1998—2020年中国知网CNKI收录的CSSCI期刊筛选出2853篇科技创新文献,并进行数据转换,得到CiteSpace5.7.R2可处理的文件格式。同时,设置分板界面,时间设置为1998—2020,Yearsperslice默认数值为1,节点类型选择“Key-word”。最终,得到中国科技创新研究的关键词共现图(图1)。

  2.2关键词突变分布

  突变词主要是以关键词为基础,在某个时间跨度所发表的文献中专业术语的突显,反映出不同时段的研究热点,主要表现在突变词的年代分布和突变强度两个方面[4]。应用CiteSpace软件,得到国内科技创新文献中前20个突变词,主要包括知识经济、农业、高新技术产业化、科技期刊、高校科技创新、研究型大学、科技创新体系、科技创新平台、机制、指标体系、知识产权、对策、技术创新、高校、自主创新、评价、创新能力、科技创新人才、科技创新政策、创新驱动(表1)。

  3科技创新研究的关键词聚类分析

  3.1关键词聚类图

  CiteSpace软件在聚类标签的提取上提供了4种标签提取算法:LSI(潜语义索引)、TF*IDF加权算法(系统默认的自动标签词提取算法)、LLR(对数似然比检验)、MI(互信息算法)[6]。综合来看,使用LLR算法进行的聚类所提取的标签更加符合实际情况且重复情况少。同时,Muscularity(模块化)度量了网络可以划分为多个独立块(模块)的程度。低模块化表明不能将网络简化为具有清晰边界的聚类,而高模块化则意味着网络结构良好。通常,Muscularity的值介于0.4~0.8,说明适合聚类[7]。Silhouette(轮廓度量)是在解释聚类性质时,用来估计聚类所涉及的不确定性。聚类的轮廓值在-1到1之间,表示解释聚类的性质时需要考虑不确定性。通常Silhouette>0.5,则聚类合理;Silhouette>0.7,则聚类令人信服。如果某一聚类的轮廓度量为1,表示它与其他聚类完美分离[8-9]。为此,使用LLR算法,对国内科技创新文献的关键词进行聚类分析,其中,MuscularityQ=0.6058,Silhouette=0.8629。最终,得到科技创新研究文献的关键词聚类图(图2)。

  3.2时间线分析

  以关键词聚类分析为基础,可进一步剖析科技创新研究的关键词聚类的时间演变趋势。选择CiteSpace软件中的“TimelineView”后,调整相关数值,得到科技创新研究的关键词时间线图(图3)。根据图3,对科技创新研究的8个关键词聚类的时间线进行分析。其中:1)聚类“#0科技创新”与剩下的几个聚类连线较为密集,各聚类彼此之间的连线也较为密集,说明各个聚类之间具有高度相关性。该聚类时间线上最大的关键词节点是“科技创新”,与该节点相关的文献最早出现在1998年。从图3中可看出,“科技创新”一直是研究热点并且频繁出现在其余的聚类中。2)聚类“#1科技创新能力”与聚类“#0科技创新”类似,该聚类时间线上最大的关键词节点是“科技创新能力”,相关文献最早出现在1998年。究其原因,1998年,中科院实施“知识创新工程”,作为建设创新体系的试点。同年5月,江泽民同志在庆祝北京大学建校100周年大会上宣告:“为了实现现代化,我国要有若干所具有世界先进水平的一流大学”[10]。同时,1998年出现“科技人才队伍”“创新体系”等研究主题。

  3.3关键词时区分析

  关键词时区图侧重于从时间维度上来表示知识演进,可清晰展示某领域文献的更新和相互影响[18]。为此,在剖析科技创新研究的关键词聚类的时间演变趋势基础上,进一步得到科技创新研究的关键词时区图(图4)。

  根据图4,1998—2020年科技创新研究可划分为3个阶段[19]。①1998—2006年,科技创新研究主要以中小企业为主体,以政府支持为引导,构建创新体系,重点围绕农业科技创新、科技创新能力、高校科技创新、中小企业、科技创新体系、国家创新体系等关键词开展研究;②2006—2012年,科技创新研究主体多元化,不仅限于企业技术创新,同时涉及科技创新平台、科技创新团队、科技创新效率、科技创新评价、指标体系等为研究主题;③2012—2020年,科技创新研究主要涉及科技创新政策、粤港澳大湾区、创新驱动、协同创新等为研究主题,为推动区域科技协同创新、把建设成为科技强国提供了重要支撑。

  4结论

  利用CiteSpace5.7.R2绘制了科技创新研究文献的关键词共现图谱、关键词聚类图谱、关键词时间线图谱和关键词时区图。研究表明,不同时期科技创新研究的侧重点不同,中国科技创新不单以企业技术创新为重点研究方向,国家政策是影响科技创新研究的主导因素。创新是引领发展的第一动力,中国始终坚持创新驱动发展,把科技创新摆在发展全局的核心位置,以科技创新造福人类,努力建设成为世界领先的科技创新中心。

  参考文献

  [1]CHENCM.Searchingforintellectualturningpoints:Pro-gressiveknowledgedomainvisualization[J].ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica,2004,101:5303-5310.

  [2]孙新宇,姜华.国内外高等教育研究主题之比较分析[J].教育学术月刊,2014(1):19-24.

  [3]曹晶,张沛黎,周亚丽.基于CiteSpaceⅢ的国外中亚研究分析[J].农业图书情报学刊,2018,30(9):19-26.

  吴丹1,向筱茜1,冀晨辉2

上一篇:运用智能家居技术实现办公建筑智慧场景控制的实践 下一篇:智能建筑与智慧城市标准研究发展建议