我有一个生产数据库,其中偶尔需要“合并”单个表中的冗余行。
让我们假设该表中的两行具有相同的值,除了它们的 ID。
Table "PrimaryStuff"
ID | SomeValue
1 | "I have value"
2 | "I have value"
3 | "I am different"
我们还假设存在许多相关表。因为在“PrimaryStuff”表中创建了重复项,所以通常在这些子表中创建的行都应该与 PrimaryStuff 表上的单个记录相关。 这些表的数量和名称不在我的控制之下,应该在运行时动态考虑。 IE:我不知道相关记录的名称甚至数量,因为其他人可能会在我不知情的情况下编辑数据库。
Table "ForeignStuff"
ID | PrimaryStuffId | LocalValue
1| 1| "I have the correct FK"
2| 1| "I have the correct FK"
3| 2| "I should get pointed to an FK of 1"
为了解决 PrimaryStuff 的第 1 行和第 2 行的重复问题,我希望所有相关的表都将它们的 FK 更改为 1,然后删除 PrimaryStuff 的第 2 行。这应该是微不足道的,好像 PrimaryStuff 的第 1 行不存在一样,我可以更新行 2 上的主键到 1,更改将级联出来。我不能这样做,因为这将是 PrimaryStuff 的唯一索引中的重复键。
随时提出问题,我会尽力解决任何令人困惑的问题。
最佳答案
首先让我们获取需要更新的行列表(据我所知,您希望最低的 ID 替换所有较高的 ID)
SELECT MIN(ID) OVER (PARTITION BY SomeValue ORDER BY SomeValue, ID ASC) AS FirstID,
ID,
SOMEVALUE
FROM PrimaryStuff
我们可以删除 FirstID 和 ID 匹配的那些,这些都没有关系
SELECT FirstID, ID FROM
(
SELECT MIN(ID) OVER (PARTITION BY SomeValue ORDER BY SomeValue, ID ASC) AS FirstID,
ID,
SOMEVALUE
FROM PrimaryStuff
) T
WHERE FirstID != ID
现在我们有一个更改列表。我们可以在更新语句中使用它,将其放入临时表(或我在下面所做的 CTE)中:
WITH ChangeList AS
(
SELECT FirstID, ID FROM
(
SELECT MIN(ID) OVER (PARTITION BY SomeValue ORDER BY SomeValue, ID ASC) AS FirstID,
ID
FROM PrimaryStuff
) T
WHERE FirstID != ID
)
UPDATE ForeignStuff
SET PrimaryStuffId = ChangeList.FirstID
FROM ForeignStuff
JOIN ChangeList ON ForeignStuff.ID = ChangeList.ID
注意 - 代码未经测试,可能有错别字。
关于sql - T-SQL 到 "Merge"两行,或 "Rekey"所有 FK 关系,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/18853771/