基于社交网络的用户行为研究

2023-01-20 07:36:16   第一文档网     [ 字体: ] [ 阅读: ] [ 文档下载 ]

#第一文档网# 导语】以下是®第一文档网的小编为您整理的《基于社交网络的用户行为研究》,欢迎阅读!
社交,基于,行为,用户,研究
基于社交网络的用户行为研究

作者:纪程文

来源:《中国新通信 2018年第23



一、社交网络用户行为研究概述

随着Web2.0 技术的不断发展和智能设备的日益普及,互联网已经成为人们日常生活中不可或缺的重要组成部分。社交网络作为互联网上人与人之间进行交流沟通的社交工具越来越受到大众的欢迎,并且呈现出多样性的发展趋势[1]。同时,由于活跃用户不断提升,用户自身贡献力量不断增强,社交网络得到了长足的发展。目前,国外较流行的社交网络FacebookTwitterMyspace 等;国内较流行的社交网络有人人网、新浪微博、腾讯微博等。在这些社交网络上,人们可以发布博文、图片视频等多媒体内容,也即用户生成内容。这些内容使得社网络更加真实生动,同时也是人们在网上互动的起点[2]

由于社交网络上用户生成内容多样性,越来越多的研究者开始关注社交网络并且开展了大量的研究,比如用户关系研究、角色分析、社区发现等[2]。在这众多研究中,用户行为研究一个研究热点。事实上,社交网络用户的行为也是多种多样,比如有用户基本的访问行为、互动行为、发布博文行为、转发行为等[2]。本文着重研究社交网络中的转发行为。通常,转发是社交网络信息传播的主要方式。

本文的目的是分析用户转发行为的特征,并且建模用户转发行为。研究用户转发行为在理论和实践方面都具有重大的意义[4]理论上,转发行为的研究对探索转发行为规律和内在机理提供帮助,对进一步探索社交网络中的信息转播提供理论支撑。实践上,社交网络用户行转发行为研究有助于挖掘大量的商业价值。具体来说,通过分析社交网络中用户生成内容,能够发掘用户行为存在大量的特征,为网络推广或者其他的商业提供依据。因此,探究哪些关键因素会对用户转发行为产生影响、如何建模用户转发行为变得尤为迫切。

二、相关理论

用户行为预测涉及因素比较广泛,比如关注、评论、点赞、访问主页等交互 因素。给定特定的社交网络研究者们大多从社交网络图结构和社交网络功能两个角度分析用户行为[4, 5]网络结构着重于分析用户行为的产生过程,功能分析则着重于分析用户行为的具体内容。本节将从社交网络的结构和功能两个角度来分析用户行为研究的相关理论

社会网络图结构分析法主要是对社会网络的关系结构或者属性信息进行分析,行动的主体可以是人、社区或者群体等,主体之间的关系能够反映出一定的现象或者规律。基于网络结构常有的衡量网络特性的属性有:度、网络直径、聚类系数、介数等[6]。这里,节点的度指的是网络结构中与该节点相连的边的数目。网络直径是指网络结构中任意两点间距离的最大值。聚类系数也称为簇系数,是网路中的一个局部特征量。聚类系数的取值范围0 1 之间,它客观上描述了网络中拓扑连接的聚集程度,刻画了网络中某一节点与其相邻节点之间共有边的密集程度。节点介数指的是网络中经过该节点的所有最短路径的数目与总的最短路径数目的比值。

社交网络的功能特性侧重于分析用户的具体行为,比如点赞、转发、关注等行为。这些用户的具体行为实质上是社交网络提供给用户基本功能的在用户微观层面上的反映。因此,通过研究这些基本功能的用户历史信息可以深入地分析用户特征,为社交网络运营部门提供理论持。以转发行为为例,文献[6] 中提到一些学者通过分析社交网络中多维度用户主体特征和博文特征在转发微博和不转发微博中的呈现出来的不同表象,采用加权预测模型来实例化特征,进一步将用户转发行为预测转化为二分类问题。也有一些学者将影响用户转发行为的因素分为


用户自身特征、社交行为特征和博文特征,通过采用分类模型研究这些特征对用户转发行为的影响,并利用单跳转发方式来预测用户转发博文路径形成的概率。

三、用户行为相关特征

特征选择是进行社交网络用户行为分析的基础工作,正确识别社交网络文本特征对有效分析用户行为具有重要的保障性作用。本章主要分析了以下用户行为建模的特征。

发文用户的影响力。社交网络中,一个发布微博用户的影响力大小会影响其所发博文的影响力,进而影响网络中其他用户转发此用户博文的概率[8]。在一些社交网络中,根据用户是否认证分成了加V 用户和不加V 用户。加V 的用户一般为娱乐明星、知名人物等。一般来说,V 用户拥有更多的粉丝数、发博博文总数较多且博文质量较高。当加V 用户发布一条博文之后,会得到较多粉丝参与互动,会引来更多粉丝的关注,个人影响力也会不断提升,进而该微博被转发的几率也就会更大。

博文属性。博文内容是否能够获得转发,是否能够变得流行一定程度上取决于博文内容所容纳的信息量的大小以及博文内容情感因子的大小[9]。社交网络中用户更愿意发布或转发他感兴趣的博文.因此,用户发布的博文内容一定程度上反应了用户的兴趣,且转发了同一类与用户兴趣较为相近的微博。由于博文属于短文本数据,本文采用实体词和情感词来计算博文信息量大小。用实体词个数来量化博文信息量,博文包含实体词个数越多,博文信息量越大。与此同时,用情感词来量化博文的情感因子,博文包含的情感词越多,代表博文有更多的情感因素,更加容易引起其他用户转发。

用户的转发活跃度。此特征主要考虑网络中用户平时是否有转发习惯,有些用户倾向于发布原创微博,很少转发别的微博,活跃度低;有些的用户喜欢获取信息,倾向于访问他人的微博,但不愿意发布或转发他人微博,活跃度一般;还有些用户为了吸引关注,习惯于转发各类博文,即便是自己不感兴趣的内容,也会不断地进行转发,活跃度较高[8]。直觉上,用户的活跃度会影响到用户转发的概率。喜欢转发的用户对于博文信息的传播具有比较强的促进作用。下一章,我们将给出转发活跃度的定义。

四、社交网络用户行为模型构建

基于上一章用户行为的特征分析,本章首先对微博数据进行特征表示,然后对行为特征进行量化,最后提出了用户转发行为的预测方法。

给定一个网络,其中U 表示用户集合,E 表示用户关系集合。如果用户ui 是用户uj 粉丝,那么E 中存在有向边ui?uj,这里用户uj 的微博都会出现在用户ui 的时间线上。转发行为可以实例化为:用户uj 发布了一条博文p,用户ui的行为定义为R={ui,uj,p}。这里,对于每一条博文p,我们可以进行粉分词得到一个词表W(p)={w1,w2,…,wn}, 其中wi表示关键词,n 表示词的数目。

本文从用户的粉丝数、用户发表博文数以及博文转发数来定量用户的影响力。用户u 的影响力定义如下:

F(u)=α log NF+β log NS+γ log Nr

其中,NFNSNr 分别代表用户u 的粉丝数、发布博文数和博文转发数;α、β、γ 分别表示每一项的权重因子。接下来,我们考虑用户转发活跃度的实例化。本文的用户活跃度是指用户在社交网络上的活跃程度,本研究以用户u 在某一段时间内单位时间发布的博文数代表用户的活跃度,其定义如下:




H(u)=TN/T

其中,TN 表示观测时间内用户u 发布的博文总数,T代表观测时间长度。

进一步,本文给出了用户转发行为建模过程:

(1) 定义若干个博文类别C={c1,c2,…,cn},把所有用户博文进行分类,也即p ∈ ci;

(2) G 中,针对目标用户u,找出TOP-K 个影响力最大的朋友;

(3) 给定观测时间T,找出TOP-K TOP-M 个转发活跃度最大的朋友;

(4) 分别找出用户u 发布的博文类别集合C TOP-M 个用户博文集合中用户u 未发布博文类别集合?C

(5) 在观测时间T 内,提取用户u 的兴趣空间。假设用户在T 内,发表了m 条博文。首先,找出用户相关的博文类别集合?C,然后,找出用户兴趣向量,也即最具代表性的词表W(p)(6) ?C 中,利用?C确定用户转发博文的类别。之后,用余弦相似性计算确定类别中的博文内容和用户兴趣向量的相似性,值越接近于1,说明相似度越高,也即用户u 转发该博文的可能性越大。

五、结论

本文针对社交网络用户行为建模这个研究热点,进行了深入的研究。本文首先对社交网络用户行为及其相关理论进行介绍,然后分析了用户行为相关特征,之后对用户行为相关特征进行了量化,并在此基础上提出用户行为建模的六个步骤。未来,我们将考虑更多的特征,比如用户交互度,来建模用户行为。


本文来源:https://www.dy1993.cn/hb1K.html

相关推荐