从主流应用工具看科技情报的定量化研究(2)
2.2 二次分析 在一次分析的基础上,往往还要进行二次分析。一般情况下,加权统计、数量分布统计、年度增长统计分析、关联统计分析等,通过Excel或再借助VBA简单编程即可实现。而相关分析、回归分析、聚类分析等则需要借助大型的商业化统计分析软件,如 SPSS[8]、SAS[9]。
从所提供的分析功能来看,SPSS与SAS相差不大。以聚类分析为例,SPSS提供了多种层次聚类法、K-means非层次聚类法、两步聚类法以及快速聚类法等,SAS则在此基础上还包含了重叠式聚类法(Overlapping Clustering)和模糊聚类法(Fuzzy Clustering)等。从所分析数据的结构来看,SPSS要求输入的是数据矩阵(Data Matrix,表现为n×p形式的矩阵),而SAS除数据矩阵外,还可处理差异矩阵(Dissimilarity Matrix,表现为n×n形式的矩阵),这就要求我们在输入数据进行分析时,要格外注意,而不能对由输入数据的错误可能造成的错误结果去强行解释。
相对于商业化的SPSS和SAS而言,R[10]则是一个开源软件,并且也有非常广泛的使用。R的思想是:它可以提供一些集成的统计工具,但更大量的是各种数学计算、统计计算的函数。因此,与其说R是一个统计系统,还不如说R是一个计算环境。
SPSS和SAS是统计分析领域集成度很高的工具(需要进行软件或模块升级,才能提供更丰富的功能),R则由于开源和很好的扩展性而具有强大的、可供免费使用的功能。具体在分析方法方面,对于某一种分析而言,都有好多种方法,而相关工具也大都提供这样的分析功能,但是当前所使用的方法却较单一。以聚类为例,其一般分为层次聚类和非层次聚类两种方法,但当前科技情报定量分析过程中的聚类大多采用的是层次聚类法(包括单链接聚类和全链接聚类),而对K-means这样的非层次聚类法应用的非常少。相比于层次聚类而言,K-means可处理的样本量大,且聚类速度较快,同时还提供方差分析用以分辨所选变量显著与否。因此,将来可能需要尝试并验证现在并不经常使用的其他分析方法的有效性。
3 结果可视化
对数据分析结果进行可视化,可以更加方便、快速地发现数据的内在关联,以及潜在的重要信息。Excel提供的柱形图、折线图、散点图等绘图功能可基本满足一般统计数据的绘图要求,但是,对于矩阵数据,我们通常需要借助其他一些工具来进行可视化。
当前,在科技情报定量结果的可视化过程中,一个最明显的特点就是社会网络分析(Social Network A-nalysis)工具的使用,其中最为常见的就是 UCINET[11]。UCINET是收费的,但其中却捆绑了免费的Netdraw[12]和 Pajek[13]。UCINET 的功能在于将矩阵数据转换为可供Netdraw和Pajek识别的数据格式,同时,其还兼具一些网络分析功能,如中心性分析、凝聚子群分析等。Netdraw除具有一般的网络分析功能外,还可进行主成分显示和多维尺度分析等。相比于Netdraw和Pajek的功能就强大多了,可处理的数据格式多达6种(Netdraw针对网络数据):.net(网络)、.clu(分类)、.per(排序)、.cls(类)、.hie(层次)、.vec(向量),如此一来,就可同时表现出尽可能多的信息。
相比于Pajek等的图形效果而言,由荷兰莱顿大学科学技术研究中心(CWTS)开发的、可免费使用的VOSviewer[14]的图形化展现方式更丰富,标签、密度、聚类密度等可视方式的使用,使得科学结构和关联结构的可视化结果更加清晰(见图1)。
Netdraw、Pajek、VOSviewer等的分析方法已相对固定,而用于大规模网络数据分析、建模及可视化的工具集 Network Workbench[15](NWB),因为构架使用了CIShell技术,所以具有分布式、松耦合、插件式服务等优点,除可进行网络分析外,还可进行新开发算法的测试。
社会网络分析工具进入情报学领域,不是一种偶然,而是一种必然,因为情报学本身也具有社会科学的属性,所以借鉴社会网络分析方法这样一种新的社会科学研究范式是一种很正常的现象。在具体应用中,Netdraw、Pajek等社会网络分析工具不仅可以完美地展示出数据分析结果,还可在此基础上进行核心—边缘结构分析、结构对等性分析等,这样一来便可以更好地揭示学科领域的结构与发展,以及科研过程中的合作现象等。从可视化效果来看,用于大规模数据或大图(Larger Maps)可视化的VOSviewer由于采用了独特的去除重叠标签和层级显示技术,图形效果比Pajek等要清晰,同时也更易于解释。其次,由于新方法总是不断出现,所以需要像NWB这样的一个平台来进行广泛集成。总体而言,数据可视化应该满足两个标准:一是要尽可能地揭示并挖掘数据间的关系和内涵;二是可视化结果应简单明了,易于理解。
文章来源:《水产科技情报》 网址: http://www.sckjqbzz.cn/qikandaodu/2021/0726/585.html