【#第一文档网# 导语】以下是®第一文档网的小编为您整理的《数学类短论文_数据分析方法翻译》,欢迎阅读!

数据分析方法
通常,管理研究中运用比较普遍的数据分析方法是多元回归分析法,但是多元回归方法存在两个弱点(李怀祖,2000): (1)、管理研究中难以回避一些无法直接观测的变量,而多元回归的因变量和自变量都要求可测,才能估计出回归系数。比如本论文种的运营质量,需要通过准确性、可靠性、准时性等来阐述一样。结构方程模型的广泛应用主要是因为在一般的回归研究中所涉及的很多变量并不能直接、准确地测量,这些变量称为潜变量( Latent Variable ,简称LV)。人们可以找到一些可观测的变量将其作为这些潜变量的“指标”( Indicators) ,进而间接研究潜变量的性质(刘金兰 2005)。传统的统计分析方法通常不能有效处理这些含潜变量的问题,而结构方程模型正是用来检验观测变量和潜变量、潜变量和潜变量之间关系的一种多元统计方法。(理顺一下逻辑) (2)、回归分析难以处理多重共线性问题。
因此,在涉及自变量多或自变量相互关联复杂的系统时,人们需要在多元回归分析的基础上,探索新的数据分析方法。目前,在管理研究中,特别是采用问卷法收集数据的情况下,结构方程建模是针对上述回归分析的弱点而研发出来的并已得到较广泛应用的数据分析方法(李怀祖,2000)。根据所研究的关联模型的特点,本文选择结构方程建模作为研究工具。
本论文采用的分析检验方法包括:一般线性相关分析、多元回归分析、主成分分析等,统计软件是采用的是SPSS 15,以及用于偏最小二乘的PLS( Partial Least Square )软件SmartPLS 2.0。
4.3.1 结构方程简介
结构方程模型(Structural Equation Modeling,简称SEM)是由瑞典统计学家Karl G Joreskog 于和Dag Sorbom等学者在20世纪70年代提出来的一种线性统计建模技术。是对探索性因子分析、验证性因子分析、路径分析、多元回归及方差分析等统计方法的综合运用和改进提高。最近十多年来,结构方程模型已成为一种非常通用的、主要的线性统计建模技术,广泛应用于经济学、管理学、行为科学等领域的研究。人们所熟悉的多元回归(Multiple regression)、因子分析(Factor Analysis)和路径分析(Path Analysis)等统计方法实际上都只是结构方程模型的一种特例。结构方程模型目前仍然是多元统计分析中一个前沿研究领域。
目前,主要有两大类估计技术来求解结构方程模型。-种是基于最大似然估计(ML) 的协方差结构分析方法,如以LISREL 方法为代表(Anderson J.C , Rungtusanathamm, Schroeder R Get al, et al 1995); 另一种则是基于偏最小二乘( PLS) 的分析方法,以PLS 方法为代表(Chin.W.W 1998)。 国内关于前者的讨论已有很多,但对后者的研究却较少。本论文的所应用的分析技术就是偏最小二乘方法(PLS Partial Least Squares)。 4.3.2 偏最小二乘PLS简介
偏最小二乘法(PLS:Partial Least Squares)被称为第二代的多变量技术,是一种新型的多元统计分析技术,是近年来模型参数估计的常用方法(Herman Wold,1992)。PLS 理论由两个部分组成:PLS 回归与PLS 路径建模。最初,PLS 回归的应用主要在化工领域。PLS 路径建模方法是PLS 回归的扩展与延伸,它于八十年代早期由Herman Wold 和Joreskog等人开发出来,相对PLS 回归的应用范围而言,PLS 路径建模技术在计量经济学和心理学以及管理行为等领域发挥着更为重要的作用。
偏最小二乘回归具有方法简便、受限制小、应用范围广的优点。一般认为基于成分提取
的PLS方法具有很强的解释与预测能力,PLS是一种将主成分分析与多元回归结合起来的迭代估计, 该方法对不同潜变量的显变量子集抽取主成分, 放在回归模型系统中使用, 然后调整主成分权数, 以最大化模型的预测能力。此外,PLS最大的好处就是非参数检验,例如:如果不能保证变量的正态性以及同方差性质,就可以用PLS。PLS对数据的分布没有严格要求而且可以是小样本。而基于协方差拟合的LISREL 方法对数据的分布有一定的要求且需要足够大的样本,且必须要保证变量分布的严格假设。
PLS方法也有它自己的缺点,首先PLS方法是有“偏”的最小二乘,因为估计的每一步都在给定其他参数条件下,对某个参数子集的残差方差进行最小化。虽然在收敛的极限下,对所有残差方差联合的进行最小化,但PLS方法仍然是“偏”的,因为没有对总体残差方差或其他总体最优标准严格的进行最小化。PLS通过最大化测量变量的可靠性估计和潜变量回归的R2来计算潜变量得分,导致PLS参数估计有偏,使潜变量得分的价值大打折扣。此外,因为PLS估计的潜变量路径系数有低估,不能很准确的揭示潜变量之间的关系(Dijkstra, 1983);基于成分分析的算法(PLS)的外生潜变量的R2 的数值比基于协方差的SEM的算法得出的值偏小(HSU, Sheng-Hsun et al 2006)。PLS的潜变量载荷的参数估计易于趋同,且有高估偏差;无法给出模型的检验,它所给出解释变量与因变量之间的结构关系过于抽象、难以理解,无法确定它们之间准确的数量关系。
尽管如此,PLS还是由于它对于假设的限制比较小,且不需要有联合多元正态分布,不需要大量的样本,被认为是适合于理论发展的早期使用。目前,PLS成功的应用于市场营销研究、组织行为研究、以及信息系统研究。 4.3.3 为什么选择偏最小二乘PLS
在使用结构方程建模中,PLS和LISREL两种建模技术应用最为广泛,对于LISREL和PLS来说人们在两种方法的选择上一直存在分歧,一般认为PLS适用于以下情况:
1、研究者更加关注通过测量变量对潜变量的预测,胜于关注模型的参数估计值大小,虽然PLS的估计量是有偏的,但可以根据测量变量得到潜变量的最优预测。
2、适用于数据有偏分布的情况,因为PLS使用非参数推断方法(例如Jackknife),不需要对数据进行严格假定(比如多元正态分布、同方差性等等);而LISREL却有严格的假设观测是独立的,且必须服从多元正态分布。
3、适用于小样本研究,因为PLS是一种有限信息估计方法,所需要的样本量比完全信息估计方法LISREL小得多。Chin and Newsted (1999)进行的Monte Carlo Simulation证明显示样本的大小可以小至50。
4、适用于较大、较复杂的结构方程模型,因为PLS收敛速度非常快,计算效率比LISREL更高。
5、适用于有形成型(Formative)变量的结构模型,LISREL只能处理反映型(Reflective)的潜变量,而不能处理形成型(Formative)的潜变量。而本文中的XX,XX是形成型的变量,而XX,XX是反应型的变量,整个模型是属于混合模型,因此,使用lisrel或AMOS是无法完成的。而关于形成型与反映型的区分,在大多数文章里面是没有区分的,这样的误用会导致统计中的一类错误和二类错误的发生,从而导致检验的失效。 本论文采用PLS的主要原因:
1、本文的主要研究目的是找出对于外包合作关系有影响的因素,更加关注的是变异量的解释。更加关注的是服务质量对外包关系的解释能力,而不是用所调查的数据与理论模型的拟合程度。
2、样本数量少,本文的样本数量只有XX,对于用lisrel来说,样本数量远远不够,因此只能选择PLS,PLS可以有效的处理小样本问题。
3、本文中的潜变量的结构既有形成型(Formative)的又有反映型(Reflective)的,其中
XXX的测量是形成型的潜变量,而其余的是反映型(Reflective)的潜变量。由形成型和反映型的指标组织的混合模型的分析只有PLS能解决,LISREL或AMOS只能解决反映型的变量。
基于以上原因,PLS(偏最小二乘法)分析方法被用来分析本论文的模型假设。
本文来源:https://www.dy1993.cn/QNp.html