试题详情
简答题对于分类变量作为自变量时为什么要进行哑变量化?如何进行哑变量化?如何考察哑变量化是否有统计学意义?
  • 如果自变量为无序多分类变量,由于每个分类通常没有数量的意义,所以需要进行哑变量化处理。对于有序分类变量,如果直接引入模型,则需要假定模型的自变量改变一个单位的效应变化与自变量取值。如Logistic回归模型中,直接引入有序多分类变量,则要求模型满足两个相邻分类的优势比均为常数;Cox回归中,直接引入有序多分类变量,要求模型满足两个相邻分类的风险比均为常数;在线性回归模型中,要求总体回归方程满足总体均数与有序多分类变量呈线性关系。不满足上述要求,则有序多分类变量在引入模型时,需要亚变量化。回归模型要求同一变量生成的一组亚变量同时进入模型或同时剔除模型。
  • 关注下方微信公众号,在线模考后查看

热门试题