确定周期我可以做
select * from input A join input B on A.prv=B.cur and A.cur=B.prv但是
如何在循环中仅保留一条具有相同start_dt的记录?除了Prv和curr这些记录的所有列都是相同的。我正在使用spark sql / Hive

Input

prv  cur  start_dt
A     B   2099-12-31
B     A   2099-12-31
P     Q   2018-12-31
Q     P   2018-12-31

Output (any of one record in cycle)
prv  cur  start_dt
A     B   2099-12-31
P     Q   2018-12-31

最佳答案

如果您没有Prv = Cur记录(例如A, A, 2099-12-31),则可以使用:

    SELECT * FROM input A
    JOIN input B ON A.prv=B.cur AND A.cur=B.prv
    WHERE A.prv > B.prv

关于mysql - 如何排除在同一start_dt上的数据中创建周期的记录?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58460571/

10-09 00:34