10.2.1 示例_统计挖掘与机器学习：大数据预测建模和分析技术（原书第3版）-QQ阅读女生短篇网

数据集合A包括10个个体和3个变量，见表10.1。二值变量是RESPONSE（Y），INCOME的单位是千美元（X₁），AGE的单位是年（X₂）。我用数据集合A对INCOME和AGE的回应做一个逻辑斯谛回归分析。

表10.1　数据集合A

表10.2是标准的LRM结果，其中包括逻辑斯谛回归系数和其他信息“列”（这些内容超出了本章范围）。“参数估计值”这一栏是变量INCOME、AGE的系数和截距值。截距是一个数学概念，记作X₀，通常等于1（即截距=X₀=1）。系数b₀作为“初始”值赋值给所有个体，不管模型里的预测变量的值是多大。

表10.2　LRM结果

LRM的估计值见公式10.3：

记住，LRM预测的是RESPONSE的logit值，不是RESPONSE的概率。