我有一个带有选举数据的 Deedle 系列,例如:
"Party A", 304
"Party B", 25
"Party C", 570
....
"Party Y", 2
"Party Z", 258
我想创建一个这样的新系列:
"Party C", 570
"Party A", 304
"Party Z", 258
"Others", 145
所以我想按原样取前 3 名,并将所有其他人作为新行加起来。做这个的最好方式是什么?
最佳答案
我认为我们在 Deedle 中没有任何东西可以使它成为单线(多么令人失望......)。因此,我能想到的最好方法是获取前 3 名政党的 key ,然后将 Series.groupInto
与返回政党名称(前 3 名)或返回“其他”(其他政党)的 key 选择器一起使用:
// Sample data set with a bunch of parties
let election =
[ "Party A", 304
"Party B", 25
"Party C", 570
"Party Y", 2
"Party Z", 258 ]
|> series
// Sort the data by -1 times the value (descending)
let byVotes = election |> Series.sortBy (~-)
// Create a set with top 3 keys (for efficient lookup)
let top3 = byVotes |> Series.take 3 |> Series.keys |> set
// Group the series using key selector that tries to find the party in top3
// and using an aggregation function that sums the values (for one or multiple values)
byVotes |> Series.groupInto
(fun k v -> if top3.Contains(k) then k else "Other")
(fun k s -> s |> Series.mapValues float |> Stats.sum)
关于f# - Deedle:将时间序列分组在前 3 名和其余,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/27530749/