【www.arisingsemi.com--实用文档】

相关性分析结果怎么看
用下面的数据做相关分析和一元线性回归分析:

选用普通高等学校毕业生数和高等学校发表科技论文数量做相关分析和一元线性回归分析。
一、相关分析
1. 作散点图

普通高等学校毕业生数和高等学校发表科技论文数量的相关图

从散点图可以看出:普通高等学校毕业生数和高等学校发表科技论文数量的相关性很大。
2. 求普通高等学校毕业生数和高等学校发表科技论文数量的相关系数


把要求的两个相关变量移至变量中,因为都是定距数据,选择相关系数中的Pearson,点击确定,可以得到下面的结果:
Correlations
普通高等学校毕业生数(万人)
高等学校发表科技论文数量(篇)
普通高等学校毕业生数(万人)
Pearson Correlation
1
.998**
Sig. (2-tailed)
.000
N
14
14
高等学校发表科技论文数量(篇)
Pearson Correlation
.998**
1
Sig. (2-tailed)
.000
N
14
14
**. Correlation is significant at the 0.01 level (2-tailed).
两相关变量的Pearson相关系数=0.0998,表示呈高度正相关;相关系数检验对应的概率P值=0.000,小于显著性水平0.05,应拒绝原假设(两变量之间不具有相关性),即毕业生人数好发表科技论文数之间的相关性显著。
3. 求两变量之间的相关性

选择相关系数中的全部,点击确定:
Correlations
(万人)
(篇)
Kendall"s tau_b
(万人)
Correlation Coefficient
1.000
1.000**
Sig. (2-tailed)
.
.
N
14
14
(篇)
Correlation Coefficient
1.000**
1.000
Sig. (2-tailed)
.
.
N
14
14
Spearman"s rho
(万人)
Correlation Coefficient
1.000
1.000**
Sig. (2-tailed)
.
.
N
14
14
(篇)
Correlation Coefficient
1.000**
1.000
Sig. (2-tailed)
.
.
N
14
14
**. Correlation is significant at the 0.01 level (2-tailed).
注解:两相关变量(毕业生数和发表论文数)的Kendall相关系数=1.000,呈正相关;无相关系数检验对应的概率P值,应接受原假设(两变量之间不具有相关性),即毕业生数与发表论文数之间相关性不显著。

两相关变量(毕业生数和发表论文数)的Spearman相关系数=1.000,呈正相关;无相关系数检验对应的概率P值,应接受原假设(两变量之间不具有相关性),即毕业生数与发表论文数之间相关性不显著。
4. 普通高等学校毕业生数和高等学校发表科技论文数量的相关系数


将所求变量移至变量,将控制变量移至控制中,选中显示实际显著性水平,点击确定:
Correlations
普通高等学校毕业生数(万人)
高等学校发表科技论文数量(篇)
普通高等学校毕业生数(万人)
Pearson Correlation
1
.998**
Sig. (2-tailed)
.000
N
14
14
高等学校发表科技论文数量(篇)
Pearson Correlation
.998**
1
Sig. (2-tailed)
.000
N
14
14
**. Correlation is significant at the 0.01 level (2-tailed).
注解:两相关变量(普通高校毕业生数和发表论文数)的偏相关系数=0.998,呈正相关;对应的偏相关系数双侧检验p值0,小于显著性水平0.05,应拒绝原假设(两变量之间不具有相关性),即普通高校毕业生数与发表论文数之间相关性显著。

二、一元线性回归
从前面的相关分析可以看出普通高等学校毕业生数和高等学校发表科技论文数量呈高度正相关关系,所以,下面对这两个变量做一元线性回归分析。
1. 建立回归方程



点击选项,选中使用F的概率,如上图所示。
点击继续,确定:
Variables Entered/Removedb
Model
Variables Entered
Variables Removed
Method
1
(篇)a
.
Enter
a. All requested variables entered.
b. Dependent Variable: (万人)
此图显示的是回归分析方法引入变量的方式。
Model Summary
Model
R
R Square
Adjusted R Square
Std. Error of the Estimate
1
.998a
.996
.996
11.707
a. Predictors: (Constant), (篇)
此图是回归方程的拟合优度检验。
注解:上图是回归方程的拟合优度检验。
第二列:两变量(被解释变量和解释变量)的相关系数R=0.998.
第三列:被解释变量(毕业人数)和解释变量(发表科技论文数)的判定系数=0.996是一元线性回归方程拟合优度检验的统计量;判定系数越接近1,说明回归方程对样本数据的拟合优度越高,被解释变量可以被模型解释的部分越多。
第四列:被解释变量(毕业人数)和解释变量(发表科技论文数)的调整判定系数=0.996。这主要适用于多个解释变量的时候。
第五列:回归方程的估计标准误差=11.707.
ANOVAb
Model
Sum of Squares
df
Mean Square
F
Sig.
1
Regression
448318.664
1
448318.664
3271.335
.000a
Residual
1644.535
12
137.045
Total
449963.199
13
a. Predictors: (Constant), (篇)
b. Dependent Variable: (万人)
注解:回归方程的整体显著性检验—回归分析的方差分析
第二列:被解释变量(毕业人数)的总离差平方和=449963.199,被分解为两部分:回归平方和=448318.664;剩余平方和=1644.535.
F检验统计量的值=3271.335,对应概率的P值=0.000,小于显著性水平0.05,应拒绝回归方程显著性检验的原假设(回归系数与0不存在显著性差异),结论:回归系数不为0,被解释变量(毕业人数)与解释变量(发表科技论文数)的线性关系是显著的,可以建立线性模型。
Coefficientsa
Model
Unstandardized Coefficients
Standardized Coefficients
t
Sig.
B
Std. Error
Beta
1
(Constant)
-316.259
14.029
-22.543
.000
(篇)
.001
.000
.998
57.196
.000
a. Dependent Variable: (万人)
注解:回归方程的回归系数和常数项的估计值,以及回归系数的显著性检验。
第二列:常数项估计值=-316.259;回归系数估计值=0.001.
第三列:回归系数的标准误差=0.000
第四列:标准化回归系数=0.998.
第五、六列:回归系数T检验的t统计量值=57.196,对应的概率P值=0.000,小于显著性水平0.05,拒绝原假设(回归系数与0不存在显著性差异),结论:回归系数不为0,被解释变量(毕业人数)与解释变量(发表科技论文数)的线性关系是显著的。
于是,回归方程为:
=-316.259+0.001x
2. 回归方程的进一步分析


(1)在统计量中选中误差条图的表征,水平百分之95.

点击继续,然后点击确定,输出每个非标准化回归系数的95%置信区间:

选中统计量中的描述性,点击继续,然后确定,输出变量的均值、标准差相关系数矩阵和单侧检验概率值:
Descriptive Statistics
Mean
Std. Deviation
N
(万人)
465.92
186.044
14
(篇)
932780.57
221459.019
14
Correlations
(万人)
(篇)
Pearson Correlation
(万人)
1.000
.998
(篇)
.998
1.000
Sig. (1-tailed)
(万人)
.
.000
(篇)
.000
.
N
(万人)
14
14
(篇)
14
14


(2)残差分析

选中统计量中的个案诊断,所有个案,点击继续,然后确定:
Residuals Statisticsa
Minimum
Maximum
Mean
Std. Deviation
N
Predicted Value
137.72
707.16
465.92
185.704
14
Std. Predicted Value
-1.767
1.299
.000
1.000
14
Standard Error of Predicted Value
3.153
6.536
4.320
.995
14
Adjusted Predicted Value
139.53
713.78
466.40
185.620
14
Residual
-26.276
19.112
.000
11.247
14
Std. Residual
-2.245
1.633
.000
.961
14
Stud. Residual
-2.511
1.696
-.018
1.048
14
Deleted Residual
-32.896
20.618
-.473
13.403
14
Stud. Deleted Residual
-3.491
1.862
-.073
1.259
14
Mahal. Distance
.015
3.123
.929
.890
14
Cook"s Distance
.000
.795
.100
.205
14
Centered Leverage Value
.001
.240
.071
.068
14
a. Dependent Variable: (万人)
Casewise Diagnosticsa
Case Number
Std. Residual
(万人)
Predicted Value
Residual
1
-2.245
681
707.16
-26.276
2
.811
659
649.87
9.494
3
.834
639
628.96
9.759
4
.314
625
621.02
3.678
5
-.542
608
614.50
-6.341
6
.061
575
574.71
.711
7
-.418
531
536.00
-4.896
8
1.633
512
492.84
19.112
9
.370
448
443.45
4.336
10
-.259
378
380.53
-3.032
11
1.070
307
294.27
12.527
12
-.447
239
244.33
-5.228
13
-.842
188
197.55
-9.852
14
-.341
134
137.72
-3.993
a. Dependent Variable: (万人)
从上表可以看出,第8例的残差和标准化残差最大。

本文来源:http://www.arisingsemi.com/wendangdaquan/141486/