我有一个生产数据库,其中偶尔需要“合并”单个表中的冗余行。

让我们假设该表中的两行具有相同的值,除了它们的 ID。

Table "PrimaryStuff"
ID | SomeValue
1  | "I have value"
2  | "I have value"
3  | "I am different"

我们还假设存在许多相关表。因为在“PrimaryStuff”表中创建了重复项,所以通常在这些子表中创建的行都应该与 PrimaryStuff 表上的单个记录相关。 这些表的数量和名称不在我的控制之下,应该在运行时动态考虑。 IE:我不知道相关记录的名称甚至数量,因为其他人可能会在我不知情的情况下编辑数据库。
Table "ForeignStuff"
ID | PrimaryStuffId | LocalValue
1| 1| "I have the correct FK"
2| 1| "I have the correct FK"
3| 2| "I should get pointed to an FK of 1"

为了解决 PrimaryStuff 的第 1 行和第 2 行的重复问题,我希望所有相关的表都将它们的 FK 更改为 1,然后删除 PrimaryStuff 的第 2 行。这应该是微不足道的,好像 PrimaryStuff 的第 1 行不存在一样,我可以更新行 2 上的主键到 1,更改将级联出来。我不能这样做,因为这将是 PrimaryStuff 的唯一索引中的重复键。

随时提出问题,我会尽力解决任何令人困惑的问题。

最佳答案

首先让我们获取需要更新的行列表(据我所知,您希望最低的 ID 替换所有较高的 ID)

 SELECT MIN(ID) OVER (PARTITION BY SomeValue ORDER BY SomeValue, ID ASC) AS FirstID,
        ID,
        SOMEVALUE
 FROM PrimaryStuff

我们可以删除 FirstID 和 ID 匹配的那些,这些都没有关系
SELECT FirstID, ID FROM
(
 SELECT MIN(ID) OVER (PARTITION BY SomeValue ORDER BY SomeValue, ID ASC) AS FirstID,
        ID,
        SOMEVALUE
 FROM PrimaryStuff
) T
WHERE FirstID != ID

现在我们有一个更改列表。我们可以在更新语句中使用它,将其放入临时表(或我在下面所做的 CTE)中:
WITH ChangeList AS
(
  SELECT FirstID, ID FROM
  (
   SELECT MIN(ID) OVER (PARTITION BY SomeValue ORDER BY SomeValue, ID ASC) AS FirstID,
        ID
   FROM PrimaryStuff
  ) T
  WHERE FirstID != ID
)
UPDATE ForeignStuff
SET PrimaryStuffId = ChangeList.FirstID
FROM ForeignStuff
JOIN ChangeList ON ForeignStuff.ID = ChangeList.ID

注意 - 代码未经测试,可能有错别字。

关于sql - T-SQL 到 "Merge"两行,或 "Rekey"所有 FK 关系,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/18853771/

10-11 14:05