我正在使用KNN对IMDb和Youtube电影预告片进行分类。
因为它有很多尺寸,所以我决定使用TSNE。
但是,错误不断出现,说:无法将字符串转换为浮点数:“头像”
这是我的代码。
import matplotlib.pyplot as plt
from sklearn.manifold import TSNE
model = TSNE(learning_rate=100)
transformed = model.fit_transform(df2)
xs = transformed[:,0]
ys = transformed[:,1]
plt.scatter(xs,ys,c=labels)
我相信我应该只删除“ movie_title”列,以便仅留下TSNE的数字数据。有没有办法删除数据集中的特定列?
我的数据集列是:
movie_title
,genres
,country
,range
,gross
,budget
,imdb_score
,views
,rating
。我试过了table.Columns.Remove(“ movie_title”),但这似乎不起作用...
感谢您的阅读!
最佳答案
您可以使用df.drop()
。如果您的DataFrame
被命名为table
,请使用以下命令:
table.drop('movie_title', axis=1, inplace=True)