Project 1房价预测 答疑区



  • project 1,有问题在这里扔出来哈



  • Project 1 - 这是个 upcoming project ?



  • 老师你好,现在为止有3个小问题:
    1.在ppt 39页drop的variables里,我发现删除了BsmtFinSF2。但是查看他的p-value发现很小而且vif值也很小时为什么删除他呢?
    2.在durbin-waston test时候,结果p value大于5%不是没法拒绝原假设从而没有足够的证据说明有autocorrelation么?但是课件里写的是因为大于5%所以要reject null hypothesis. ppt 40
    3.想问下ppt41页选取interaction的时候老师是为什么选择这两个做interaction?真实做项目的时候我们怎么确定哪些量之间要去做interaction?



  • 你好.

    1. 删除这个variable是因为 multicollinearity issue. 详见ppt 37页.
    2. 同学说的对.我看了确实是fail to rejecct H0. (作为一个做数据的人表示抱歉)
    3. 首先我选这两个variable是因为其中一个造成了multicollinearity的问题.那我们可以去找这个variable到底和其他什么variable有关系.是不是在model中是它们两个共同interact之后的新variable对我们predict的y值起了解释性. 真正工作中一要靠主观去怀疑.二要去试.这里会很耗时.我同事已经跑这个跑了几天了.


  • @Joanne_Zhou
    谢谢老师!



  • 老师在CART以后,

    #Test original and imputed

    table(train$GarageType)

    table(imp_train$imp$GarageType)

    为什么imp_train后面还要加$imp, 而不是train(imp_train$GarageType)



  • @Dennis_Wang 你可以run一下 names(imp_train) 看看. imp只是一种. imp_train并不是一个类比train的data frame.


登录后回复
 

与 BitTiger Community 的连接断开,我们正在尝试重连,请耐心等待