要求
数据为2000个银行顾客的信息,好的顾客=1, 坏的顾客=0。 为了更好识别顾客好坏,防止顾客贷款不还,需要用建立决策树用rpart(Decision tree)和神经网络(Ariticial Neural Network)。Training data为70% 和 testing data 为30%
1. 决策树和神经网络中哪些变量是重要的和需要用哪些变量来建立这个模型
2. 用ROC来看两个模型中的表现。
3. 用testing data来预测,预测顾客好坏准确率为多少
4. 对比两个模型,你推荐哪个模型来评估顾客的好坏,原因是什么
5. 每个模型的优点和缺点
6. 数据中有缺失值,如何处理缺失值。