在Graphlab中,

我正在处理较大列表中的一小部分电影。

  movieIds_5K_np = LL_features_SCD_min.to_numpy()[:,0]
  ratings_33K_np = ratings_33K.to_numpy()


movieIds_5K_np是包含我的movieIds的数组。 ratings_33K_np是一个具有四列的数组,其第二列包含所有电影的电影ID。

我只需要选择ratings_33K_np中ID在`movieIds_5K_np'中的行。

我尝试了这种方法,但似乎不起作用:

 ratings_5K_np = ratings_33K_np[ratings_33K_np[:,2]==movieIds_5K_np]


如何在Graphlab中或使用一些Python库来做到这一点?我应该说最初ratings_33KmovieIds_5K是作为SFrame导入的。

谢谢

最佳答案

假设您有2个sframe,则可以执行join,如下所示:

ratings_5K = LL_features_SCD_min[['id_column_name']].join(ratings_33K, on='id_column_name', how='left')


据您的代码了解,LL_features_SCD_min是与您的小型集(5K数据)相对应的sframe。因此,您只需获取所需的ID,然后将其与整个数据集连接起来,从而获得仅包含所需ID的新sframe。只需替换您的id列名称,就可以了。

有关joingraphlab中如何工作的更多信息,请考虑检查SFrame上的documentation

祝好运!

关于python - 在Graphlab或Python中查找特定的行,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/36250370/

10-12 23:07