数据说明
数据集共计5000条数据,字段共有21个,其中目标字段为y,数据类型字段无缺失值,部分字符类型字段有缺失值,缺失值用unknown表示。
NOMBER | 字段名称 | 数据类型 | 字段描述 |
---|---|---|---|
1 | age | int | 客户年龄 |
2 | job | string | 客户职业(分类:“行政管理”、“蓝领”、“企业家”、“女佣”、“管理”、 “退休”、“个体户”、“服务”、“学生”、“技术员”、“失业”、“未知”) |
3 | martial | string | 婚姻状况(分类:“离婚”、“已婚”、“单身”、“未知”;注:“离婚”指离婚或丧偶) |
4 | education | string | 教育状况(分类:“4年基础教育”、“6年基础教育”、“9年基础教育”、“高中”、“文盲”、“专业课程教育”、“大学”、“未知”) |
5 | default | string | 违约状况(分类:“否”、“是”、“未知”) |
6 | housing | string | 是否住有房贷款(分类:“否”、“是”、“未知”) |
7 | loan | string | 是否有个人贷款(“否”、“是”、“未知”) |
8 | contact | string | 交流方式(分类:“移动电话”、“固定电话”) |
9 | month | string | 最后一个联系月份(分类:"jan", "feb", "mar", ..., "nov", "dec") |
10 | day_of_week | string | 最后联系的星期数(分类:"mon","tue","wed","thu","fri") |
11 | duration | int | 距离上次联系的时间间隔(s) |
12 | campaign | int | 活动期间与该客户的联系的次数 |
13 | pdays | int | 距离上次联系的时间间隔(天)(999:表示从未联系) |
14 | previous | int | 活动之前与该客户的联系次数 |
15 | poutcome | string | 前一次的营销结果(分类:“失败”,“不存在”,“成功”) |
16 | emp_var_rate | double | 就业变化率-季度指标 |
17 | cons_price_idx | double | 消费者价格指数-月度指标 |
18 | cons_conf_idx | double | 消费者信心指数-月度指数 |
19 | euribor3m | double | 欧元银行同业拆借利率 |
20 | nr_employed | double | 职工人数-季度指标 |
21 | y | string | 预测客户是否会订购定期存款业务 |
部分数据截图部分数据截图,如下: