在Graphlab中,
我正在处理较大列表中的一小部分电影。
movieIds_5K_np = LL_features_SCD_min.to_numpy()[:,0]
ratings_33K_np = ratings_33K.to_numpy()
movieIds_5K_np
是包含我的movieIds的数组。 ratings_33K_np是一个具有四列的数组,其第二列包含所有电影的电影ID。我只需要选择
ratings_33K_np
中ID在`movieIds_5K_np'中的行。我尝试了这种方法,但似乎不起作用:
ratings_5K_np = ratings_33K_np[ratings_33K_np[:,2]==movieIds_5K_np]
如何在Graphlab中或使用一些Python库来做到这一点?我应该说最初
ratings_33K
和movieIds_5K
是作为SFrame导入的。谢谢
最佳答案
假设您有2个sframe
,则可以执行join
,如下所示:
ratings_5K = LL_features_SCD_min[['id_column_name']].join(ratings_33K, on='id_column_name', how='left')
据您的代码了解,
LL_features_SCD_min
是与您的小型集(5K数据)相对应的sframe
。因此,您只需获取所需的ID,然后将其与整个数据集连接起来,从而获得仅包含所需ID的新sframe
。只需替换您的id列名称,就可以了。有关
join
在graphlab
中如何工作的更多信息,请考虑检查SFrame
上的documentation。祝好运!
关于python - 在Graphlab或Python中查找特定的行,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/36250370/