我有多个时间序列:
x
| date | value |
| 2017-01-01 | 1 |
| 2017-01-05 | 4 |
| ... | ... |
y
| date | value |
| 2017-01-03 | 3 |
| 2017-01-04 | 2 |
| ... | ... |
令人沮丧的是,在我的数据集中,两个系列中的日期都不总是匹配的。对于缺少一个的情况,我想使用最后一个可用的日期(如果没有一个,则为0)。
例如对于
2017-01-03
我将使用y=3
和x=1
(从之前的日期开始)来获取output = 3 + 1 = 4
我有以下形式的每个时间序列:
class Timeseries {
List<Event> x = ...;
}
class Event {
LocalDate date;
Double value;
}
并读入
List<Timeseries> allSeries
我以为我可以使用流来总结它们
List<TimeSeries> allSeries = ...
Map<LocalDate, Double> byDate = allSeries.stream()
.flatMap(s -> s.getEvents().stream())
.collect(Collectors.groupingBy(Event::getDate,Collectors.summingDouble(Event::getValue)));
但是,这不会像我上面提到的那样缺少我的约会逻辑。
我还能怎么实现呢? (不必通过流)
最佳答案
我想说您需要为适当的查询功能扩展Timeseries类。
class Timeseries {
private SortedMap<LocalDate, Integer> eventValues = new TreeMap<>();
private List<Event> eventList;
public Timeseries(List<Event> events) {
events.forEach(e -> eventValue.put(e.getDate(), e.getValue());
eventList=new ArrayList(events);
}
public List<Event> getEvents() {
return Collections.unmodifiableList(eventList);
}
public Integer getValueByDate(LocalDate date) {
Integer value = eventValues.get(date);
if (value == null) {
// get values before the requested date
SortedMap<LocalDate, Integer> head = eventValues.headMap(date);
value = head.isEmpty()
? 0 // none before
: head.get(head.lastKey()); // first before
}
return value;
}
}
然后合并
Map<LocalDate, Integer> values = new TreeMap<>();
List<LocalDate> allDates = allSeries.stream().flatMap(s -> s.getEvents().getDate())
.distinct().collect(toList());
for (LocalDate date : allDates) {
for (Timeseries series : allSeries) {
values.merge(date, series.getValueByDate(date), Integer::ad);
}
}
编辑:实际上,在这种情况下
NavigableMap
接口(interface)甚至更有用,它使数据丢失Integer value = eventValues.get(date);
if (value == null) {
Entry<LocalDate, Integer> ceiling = eventValues.ceilingKey(date);
value = ceiling != null ? eventValues.get(ceiling) : 0;
}