Error de entrenamiento del modelo de Sklearn: ValueError: Tipo de etiqueta desconocido: 'desconocido'

Sklearn Model Training Error

Pruebe un modelo de LogisticRegression simple con el siguiente código:

|_+_|

Ocurrió un error: ValueError: tipo de etiqueta desconocido: 'desconocido'



|_+_|

A partir de la información de la pila de errores, debería ser que el tipo del conjunto de datos de la etiqueta es incorrecto, luego use import numpy as np import pandas as pd from sklearn.cross_validation import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.decomposition import PCA from sklearn.linear_model import LogisticRegression from sklearn.pipeline import Pipeline df = pd.read_csv('breast-cancer.data') df = df.replace(to_replace='?', value=np.nan) Df = df.dropna(how='any') # Remove all data with missing values X = df.values[:, 1:-1] y = df.values[:,-1] # This part is wrong X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) pi_line = Pipeline([('sc', StandardScaler()), ('pca', PCA(n_components = 2)), ('clf', LogisticRegression(random_state=1)), ]) pi_line.fit(X_train, y_train) print('res:') print(pi_line.score(X_test, y_test)) Imprima el tipo de datos para ver (no use 169 if y_type not in ['binary', 'multiclass', 'multiclass-multioutput', 170 'multilabel-indicator', 'multilabel-sequences']: --> 171 raise ValueError('Unknown label type: %r' % y_type) 172 173 Función, esto encontrará todos los tipos int ), encontró que el tipo de datos de la etiqueta en este momento es dtype Por lo tanto, sklearn es irreconocible, así que use type Forzando una conversión:



|_+_|