确定周期我可以做select * from input A join input B on A.prv=B.cur and A.cur=B.prv
但是
如何在循环中仅保留一条具有相同start_dt的记录?除了Prv和curr这些记录的所有列都是相同的。我正在使用spark sql / Hive
Input
prv cur start_dt
A B 2099-12-31
B A 2099-12-31
P Q 2018-12-31
Q P 2018-12-31
Output (any of one record in cycle)
prv cur start_dt
A B 2099-12-31
P Q 2018-12-31
最佳答案
如果您没有Prv = Cur
记录(例如A, A, 2099-12-31
),则可以使用:
SELECT * FROM input A
JOIN input B ON A.prv=B.cur AND A.cur=B.prv
WHERE A.prv > B.prv
关于mysql - 如何排除在同一start_dt上的数据中创建周期的记录?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58460571/