随机森林在分类问题中的应用(sklearn的RandomForestClassifier)

Post author:xfxia
Post published:2023年9月13日
Post category:其他

一、导入相关模块

import  pandas as pd　　
import numpy as np
from sklearn.ensemble import RandomForestClassifier
from sklearn.cross_validation import cross_val_score, ShuffleSplit

pandas 对文件数据进行基本操作

numpy　对数据进行计算的库

sklearn.cross_validation　　用来划分训练集，测试集

二、导入数据

data=pd.read_csv('aa.csv')  #文件是aa.csv

看看数据的基本形状

data.head()

三、数据预处理

对于缺失的数据一般有删除行，删除列，拟合补充，均值补充等方法。这儿选择用零来填充

data=data.fillna(0)
data.

原文链接：https://blog.csdn.net/yang123p/article/details/79853605

你可能也喜欢