二手车交易价格预测

背景描述及需求

自2010年开始，中国的二手车市场开始步入了快速发展阶段，并开始成为汽车市场重要的组成部分，二手车市场已经具备了实现跨越式发展的基本条件，为符合国际通行的运营模式的应用打下了坚实的市场基础。面对市场上激烈的二手车价格竞争，为了针对二手车高效的销售，对此根据二手车历史数据进行分析价格的涨幅情况。

本次对二手车历史销售数据进行合理的价格预测，本次数据挖掘数据建模目标如下：

1、借助二手车历史销售数据分析对价格的影响的相关因素；

2、建立模型预测二手车销售价格，掌握二手车价格的情况；

3、针对二手车价格预测情况做好活动方便合理销售。

(1) 获取数据，数据来源于赛题二手车交易价格预测；

(2) 对获取的数据进行基本的处理操作，相关性分析输入特征；

(3) 根据统计特征数据建立二手车交易价格预测模型；

(4) 对模型结果进行评估。

本案例共收集到15万条二手车历史数据，字段详细说明如下表2-1所示。

字段名称	类型	字段说明
SaleID	整型	交易ID，唯一编码
name	整型	汽车交易名称，已脱敏
regDate	整型	汽车注册日期，例如20160101，2016年01月01日
model	浮点型	车型编码，已脱敏
brand	整型	汽车品牌，已脱敏
bodyType	浮点型	车身类型：豪华轿车：0，微型车：1，厢型车：2，大巴车：3，敞篷车：4，双门汽车：5，商务车：6，搅拌车：7
fuelType	浮点型	燃油类型：汽油：0，柴油：1，液化石油气：2，天然气：3，混合动力：4，其他：5，电动：6
gearbox	浮点型	变速箱：手动：0，自动：1
power	整型	发动机功率：范围 [ 0, 600 ]
kilometer	整型	汽车已行驶公里，单位万km
notRepairedDamage	字符串	汽车有尚未修复的损坏：是：0，否：1
regionCode	整型	地区编码，已脱敏
seller	整型	销售方：个体：0，非个体：1
offerType	整型	报价类型：提供：0，请求：1
creatDate	整型	汽车上线时间，即开始售卖时间
price	整型	二手车交易价格（预测目标）
v系列特征	整型	匿名特征，包含v0-14在内15个匿名特征