【数据架构】社会网络分析科普
社会网络分析(SNA)是利用网络和图论研究社会结构的过程。它根据节点(网络中的个体参与者、人或事物)以及连接它们的纽带、边缘或链接(关系或交互)来描述网络结构。通常通过社交网络分析可视化的社会结构包括社交媒体网络、[2]模因传播、[3]信息流通、[4]友谊熟人网络、商业网络、社交网络、协作图、亲属关系、疾病传播和性关系。这些网络通常通过社会图来表示,其中节点表示为点,纽带表示为线。这些可视化提供了一种定性评估网络的方法,通过改变节点和边缘的可视化表示来反映感兴趣的属性。[7]
社会网络分析是现代社会学中的一项重要技术。也获得了重要的在人类学、生物学、人口、传播学、经济学、地理、历史、信息科学、组织研究、政治学、社会心理学、发展研究、社会语言学和计算机科学,现在常见的作为一个消费者的工具(见系统网络体系结构(SNA)软件列表)。[8][9][10][11]
历史
社会网络分析的理论根源在于早期社会学家的工作,如乔治•西梅尔(Georg Simmel)和埃米尔•迪尔凯姆(Emile Durkheim)。自20世纪初以来,社会学家们就一直在使用“社交网络”的概念来描述从人际关系到国际关系等各个层面的社会系统成员之间的复杂关系。20世纪30年代,雅各布•莫雷诺(Jacob Moreno)和海伦•詹宁斯(Helen Jennings)引入了基本的分析方法。[12]中国英语学习网1954年,约翰·阿伦德尔·巴恩斯开始系统地使用这个词来表示联系的模式,包括公众和社会科学家传统上使用的概念:有限的群体(如部落、家庭)和社会类别(如性别、种族)。Ronald Burt、Kathleen Carley、Mark Granovetter、David Krackhardt、Edward Laumann、Anatol Rapoport、Barry Wellman、Douglas R. White和Harrison White等学者扩展了系统社交网络分析的使用。甚至在文献研究中,网络分析也被Anheier, gerand Romo,[14] Wouter De Nooy,[15] and Burgert Senekal应用。[16]事实上,社交网络分析已经在不同的学术领域得到了应用,也在反洗钱和恐怖主义等实际应用中得到了应用。
指标
色调(从红色=0到蓝色=max)表示每个节点之间的中心性。
连接
同质性:行动者与相似或不同的人建立联系的程度。相似性可以由性别、种族、年龄、职业、教育成就、地位、价值观或任何其他显著特征来定义。[17]同质性也称为配体性。
多路性:一个连接中包含的内容形式的数量。例如,两个人是朋友,也一起工作,那么他们的多重性就是2。[19]多路性与关系强度有关。
互惠:两个行动者相互之间的友谊或其他互动的回报程度
网络闭合度:关系三元组完整性的度量。一个人对网络封闭的假设(即他们的朋友也是朋友)被称为传递性。及物性是个体或情境特征需要认知闭合的结果
接近性:演员与地理位置相近的人有更多联系的倾向
分布
桥:一种个体,它的弱连接填补了一个结构上的洞,提供了两个个体或集群之间唯一的连接。当较长的路由由于消息失真或传输失败的高风险而不可行的时候,它还包括最短的路由
中心性:中心性是指一组度量指标,旨在量化网络中特定节点(或组)的“重要性”或“影响”(在各种意义上)。测量“中心性”的常用方法有:中介中心性、接近中心性、特征向量中心性、阿尔法中心性和程度中心性
密度:网络中直接连接的比例与可能的总数之比
距离:连接两个特定角色所需的最小连接数,斯坦利·米尔格拉姆(Stanley Milgram)的“小世界实验”(small world experiment)和“六度分离”(six degrees of separation)的理念使之流行起来。
结构孔:网络的两个部分之间没有连接。发现并利用结构性漏洞可以给创业者带来竞争优势。这个概念是由社会学家罗纳德·伯特提出的,有时也被称为社会资本的另一种概念。
纽带强度:由时间、情感强度、亲密和互惠(即互惠)的线性组合来定义。强联系与同质性、接近性和传递性有关,弱联系与桥梁有关。
分割
如果每个个体都与其他个体有直接联系,那么群体就被定义为“小团体”;如果直接联系的严格程度较低,则被定义为“社交圈”;如果需要精确,则被定义为结构上具有凝聚力的群体
聚类系数:度量一个节点的两个关联是关联的可能性。聚类系数越高,说明“拉帮结派”程度越高
内聚性:行动者通过内聚纽带彼此直接联系的程度。结构内聚是指如果从一个组中移除,将断开该组的成员的最小数量
网络的建模和可视化
社交网络的可视化表示对于理解网络数据和传达分析结果具有重要意义。社会网络分析产生的数据的可视化方法有很多。许多分析软件都有用于网络可视化的模块。通过在各种布局中显示节点和纽带,并将颜色、大小和其他高级属性赋予节点,可以对数据进行探索。网络的可视化表示可能是传递复杂信息的一种强有力的方法,但仅从可视化显示解释节点和图的属性时应加以注意,因为它们可能通过定量分析较好地捕捉到结构属性的错误表示
有符号图可以用来说明人类之间的好关系和坏关系。两个节点之间的正边缘表示一种积极的关系(友谊、联盟、约会),而两个节点之间的负边缘表示一种消极的关系(仇恨、愤怒)。有符号的社交网络图可以用来预测图的未来发展。在有符号的社交网络中,存在着“平衡”和“不平衡”周期的概念。平衡循环的定义是所有符号的乘积都为正的循环。根据平衡理论,平衡图代表了一组人,他们不太可能改变他们对群体中其他人的看法。不平衡图表代表了一组人,他们很可能会改变他们对群体中其他人的看法。例如,一组3个人(a、B和C),其中a和B有正的关系,B和C有正的关系,而C和a有负的关系,这是一个不平衡的循环。这一组很可能演变成一个平衡的周期,如一个B只有一个良好的关系,并与c a和B都有负面关系利用平衡和不平衡的周期的概念,签署了社交网络的进化图可以预测。[40]
特别是当使用社会网络分析作为促进变革的工具时,不同的参与性网络映射方法已被证明是有用的。在这里,参与者/面试官通过在数据收集过程中实际绘制网络图(用笔和纸或数字)来提供网络数据。纸笔网络映射方法的一个例子是* Net-map工具箱,它还包括一些参与者属性的集合(参与者的感知影响和目标)。这种方法的一个好处是,它允许研究人员在收集网络数据时收集定性数据并提出澄清问题
社交网络的潜力
这部分可能需要清理以满足Wikipedia的质量标准。具体问题是:合并后需要更仔细的清理,如果可以,请帮助改进此部分。(了解如何以及何时删除此模板消息)
社交网络潜力(Social Networking Potential, SNP)是一个数值系数,由算法[42][43]推导而来,既表示个人社交网络的规模,也表示他们影响该网络的能力。SNP系数是Bob Gerstley在2002年首次定义和使用的。一个密切相关的术语是Alpha用户,定义为具有高SNP的人。
SNP系数有两个主要功能:
- 基于个人社交网络潜力的分类,以及
- 被调查者在定量营销研究中的权重。
通过计算受访者的SNP,并针对高SNP的受访者,定量营销研究用于驱动病毒式营销策略的强度和相关性得到了增强。
变量用于计算一个人的SNP包括但不限于:参与社交活动组成员,领导角色,识别、出版/编辑/导致非电子媒体、出版/编辑/导致电子媒体(网站、博客),和过去的频率分布的信息在他们的网络。首字母缩略词“SNP”和一些最初开发出来的用于量化个人社交网络潜力的算法,在《广告研究正在发生变化》(Gerstley, 2003)白皮书中有所描述
2004年,Ahonen、Kasper和Melkko出版了第一本书[45],讨论了Alpha用户在移动通信受众中的商业使用。Ahonen & Moore在2005年出版的《社区主导品牌》(Communities Brands)一书中,首次在社交营销智能的背景下更广泛地讨论了Alpha用户。2012年,尼古拉·格列柯(Nicola Greco, UCL)在TEDx大会上展示了社交网络的潜力,并将其与用户产生的和公司应该使用的潜在能量进行了对比,她说“SNP是每个公司都应该拥有的新资产”
实际应用
参见:社会网络分析(犯罪学)
社会网络分析在广泛的应用和学科中得到了广泛的应用。一些常见的网络分析应用包括数据聚合和挖掘、网络传播建模、网络建模和采样、用户属性和行为分析、社区维护的资源支持、基于位置的交互分析、社会共享和过滤、推荐系统开发、链接预测和实体解析。在私营部门,企业使用社交网络分析来支持活动,如客户互动和分析、信息系统开发分析、[48]营销和商业智能需求(参见社交媒体分析)。一些公共部门的应用包括制定领导者参与策略,分析个人和团体参与和媒体使用,以及基于社区的问题解决。
安全应用
社交网络分析也被用于情报、反情报和执法活动。这种技术允许分析人员绘制隐蔽组织的地图,如间谍网、有组织犯罪家庭或街头帮派。美国国家安全局(NSA)利用其秘密的大规模电子监控项目,生成对恐怖分子细胞和其他被认为与国家安全有关的网络进行此类分析所需的数据。在网络分析过程中,国安局会深入观察三个节点。社交网络的初始映射完成后,通过分析来确定网络的结构,例如确定网络中的领导者。[50]这允许军方或执法部门对处于领导地位的高价值目标发动“捕获或击毙”斩首攻击,破坏网络的功能。自911恐怖袭击事件发生后不久,美国国家安全局就一直在对通话详细记录(cdr),也就是所谓的元数据进行社交网络分析
文本分析的应用
大型文本语料库可以转化为网络,然后用社会网络分析的方法进行分析。在这些网络中,节点是社会参与者,链接是动作。可以使用解析器自动提取这些网络。然后,通过使用网络理论中的工具对包含数千个节点的最终网络进行分析,以确定关键参与者、关键社区或各方,以及总体网络的鲁棒性或结构稳定性、或某些节点的中心性等一般属性。这自动化了定量叙述分析所引入的方法,即主观-动宾三胞胎是由一对由一个动作联系起来的行动者或由行动者-客体组成的对来识别的
美国大选叙事网络[55]
互联网应用
社会网络分析也被应用于理解个人、组织和网站之间的在线行为。超链接分析可用于分析网站或网页之间的连接,以检查个人在浏览网页时信息是如何流动的。组织之间的联系已经通过超链接分析来分析问题社区中的哪些组织
社交媒体互联网应用
社交网络分析已被应用于社交媒体,作为一种工具,通过个人或组织在Twitter和Facebook等社交媒体网站上的联系来了解他们之间的行为
在计算机支持的协作学习中
计算机支持协同学习(CSCL)是目前应用SNA的主要方法之一。当应用于CSCL时,SNA被用来帮助理解学习者如何在数量、频率和长度方面进行协作,以及交流的质量、主题和策略。此外,SNA可以关注网络连接的特定方面,或者整个网络作为一个整体。它使用图形表示、书面表示和数据表示来帮助检查CSCL网络中的连接。当将SNA应用于CSCL环境时,参与者之间的交互被视为一个社交网络。分析的重点是参与者之间建立的“联系”——他们如何互动和沟通——而不是每个参与者各自的行为。
关键术语
在计算机支持的协同学习中,有几个与社会网络分析研究相关的关键术语,如:密度、中心性、独立性、超度和社会图。
- 密度是指参与者之间的“联系”。密度定义为参与者拥有的连接数,除以参与者可能拥有的连接总数。例如,如果有20个人参与,每个人都有可能与19个人建立联系。密度为100%(19/19)是系统中最大的密度。密度为5%表明19种可能的连接中只有1种
- 中心关注网络中个体参与者的行为。它衡量的是个体与网络中其他个体交互的程度。一个人在网络中与他人连接得越多,他们在网络中的中心地位就越大
度内和度外变量与中心性相关。
- 度中心性以某一特定个体为焦点;所有其他个体的中心是基于他们与“在度”个体的焦点的关系
- 外度是对中心性的一种度量,它仍然关注单个个体,但分析关注个体的外向交互作用;度外中心度的度量是焦点个体与其他人交互的次数
- 社会图是在网络中定义了连接边界的可视化。例如,一个显示参与者a的出度中心点的社会图将说明参与者a在研究网络中建立的所有出度连接
独特的功能
研究人员将社会网络分析应用于计算机支持的协作学习的研究,部分原因是它提供了独特的功能。这种特殊的方法允许研究网络学习社区中的交互模式,并有助于说明参与者与组中其他成员的交互程度。使用SNA工具创建的图形提供了参与者之间的连接和用于在组内通信的策略的可视化。一些作者还认为,SNA提供了一种分析成员参与模式随时间变化的简便方法
许多研究都将SNA应用到CSCL中。研究结果包括网络的密度与教师的存在之间的相关性,[59]更重视“中心”参与者的建议,[61]网络中跨性别互动的频率较低,[62]以及教师在异步学习网络中扮演的角色相对较小。
与SNA一起使用的其他方法
虽然很多研究已经证明了社交网络分析在计算机支持的协同学习领域的价值,但是[59]的研究人员认为SNA本身不足以完全理解CSCL。交互过程的复杂性和无数的数据源使得SNA很难对CSCL进行深入的分析。[64]研究人员指出,SNA需要与其他分析方法相补充,以形成更准确的协作学习体验图景。[65]
在CSCL的研究中,许多研究将其他类型的分析与SNA相结合。这可以称为多方法方法或数据三角剖分,这将导致CSCL研究中评估可靠性的提高。
- 定性方法——定性案例研究的原则构成了将SNA方法整合到CSCL经验研究中的坚实框架。
- 民族志数据,如学生问卷、访谈和课堂非参与者观察[65]
- 案例研究:综合研究特定的CSCL情况,并将研究结果与一般方案相关联[65]
- 内容分析:提供成员之间沟通内容的信息[65]
- 定量方法——这包括对事件进行简单的描述性统计分析,以确定无法通过SNA跟踪的群体成员的特定态度,以便发现总体趋势。
- 计算机日志文件:提供学习者如何使用协作工具的自动数据[65]
- 多维缩放(MDS):绘制行动者之间的相似度图表,使更多相似的输入数据更接近[65]
- 软件工具:QUEST、SAMSA(邻接矩阵和基于社会语法的分析系统)和Nud*IST[65]
原文:https://en.wikipedia.org/wiki/Social_network_analysis
本文:https://pub.intelligentx.net/wikipedia-social-network-analysis
讨论:请加入知识星球或者小红圈【首席架构师圈】
- 159 次浏览