输入
CSV
|
|
预处理
iloc: 数据截取
|
|
fillna: 把空值 NA 用指定值填充
|
|
get_dummies: 进行
one-hot 编码
|
|
如果 Alley 有其他值比如 Bave,则会多一列 Alley_Bave 只在值为 Bave 的行为 1
Why one-hot?
模型通常用 类型值 の差作为两个类别的差距 一般类别之间差距是两两等距的,而 label 编码不符合该特征,one-hot 编码符合
get_numpy: 转为张量
|
|