R语言-向量机-员工离职预测训练赛

  • Post author:
  • Post category:其他


题目:员工离职预测训练赛

网址:http://www.pkbigdata.com/common/cmpt/员工离职预测训练赛_竞赛信息.html

要求:

数据主要包括影响员工离职的各种因素(工资、出差、工作环境满意度、工作投入度、是否加班、是否升职、工资提升比例等)以及员工是否已经离职的对应记录。

数据分为训练数据和测试数据,分别保存在pfm_train.csv和pfm_test.csv两个文件中。

其中训练数据主要包括1100条记录,31个字段。

测试数据主要包括350条记录,30个字段,跟训练数据的不同是测试数据并不包括员工是否已经离职的记录,学员需要通过由训练数据所建立的模型以及所给的测试数据,得出测试数据相应的员工是否已经离职的预测。

数据:https://pan.baidu.com/s/1qXZOS8W  密码:bxgm

代码:

#######################  训练  #############################
data <- read.csv("E:/.../pfm_train.csv", sep=",", header=TRUE)
colnames(data)[1]<-c("Age")     #首列列名乱码
data[,2] <- as.factor(as.vector(data)[,2])

library(e1071)
#########线性支持向量机
#########传递给函数svm()的关键参数是kernel、cost和gamma。Kernel指的是支持向量机的类型,它可能是线性SVM、多项式SVM、径向SVM或Sigmoid SVM。Cost是违反约束时的成本函数,gamma是除线性SVM外其余所有SVM都使



版权声明:本文为wlt9037原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。