2019年5月3日 21:31 by wst
数据处理例如鸢尾花数据中的列别:
# y为numpy.loadtxt载入后的鸢尾花数据
y[y == 'Iris-setosa'] = 0
y[y == 'Iris-versicolor'] = 1
y[y == 'Iris-virginica'] = 2
le = preprocessing.LabelEncoder()
le.fit(['Iris-setosa', 'Iris-versicolor', 'Iris-virginica'])
print le.classes_
y = le.transform(y)
iris_feature = u'花萼长度', u'花萼宽度', u'花瓣长度', u'花瓣宽度',u'类别'
path = 'iris.data' # 数据文件路径
data = pd.read_csv(path, header=None)
data.columns=iris_feature
data['类别']=pd.Categorical(data['类别']).codes
---------------------
作者:SherryAnna_
来源:CSDN
原文:https://blog.csdn.net/zsdust/article/details/79726118