我遇到的情况是我有一个巨大的表,其中包含大量的行,看起来像(例如):
id Timestamp Value
14574499 2011-09-28 08:33:32.020 99713.3000
14574521 2011-09-28 08:33:42.203 99713.3000
14574540 2011-09-28 08:33:47.017 99713.3000
14574559 2011-09-28 08:38:53.177 99720.3100
14574578 2011-09-28 08:38:58.713 99720.3100
14574597 2011-09-28 08:39:03.590 99720.3100
14574616 2011-09-28 08:39:08.950 99720.3100
14574635 2011-09-28 08:39:13.793 99720.3100
14574654 2011-09-28 08:39:19.063 99720.3100
14574673 2011-09-28 08:39:23.780 99720.3100
14574692 2011-09-28 08:39:29.167 99758.6400
14574711 2011-09-28 08:39:33.967 99758.6400
14574730 2011-09-28 08:39:40.803 99758.6400
14574749 2011-09-28 08:39:49.297 99758.6400
好的,所以规则是:
时间戳可以相隔n秒,5s,30s,60s等,它根据记录的年代(存档发生)而变化。
我希望能够查询该表以基于时间戳选择第n行。
因此,例如:
从mytable中选择*,其中intervalBetweenTheRows = 30s
(出于这个问题的目的,基于假设,所请求的间隔始终比数据库中的间隔具有更高的精度)
因此,第n行基于每行之间的时间
有任何想法吗?!
卡尔
对于那些感兴趣的人,递归CTE实际上非常慢,我想到了一种稍微不同的方法:
SELECT TOP 500
MIN(pvh.[TimeStamp]) as [TimeStamp],
AVG(pvh.[Value]) as [Value]
FROM
PortfolioValueHistory pvh
WHERE
pvh.PortfolioID = @PortfolioID
AND pvh.[TimeStamp] >= @StartDate
AND pvh.[TimeStamp] <= @EndDate
GROUP BY
FLOOR(DateDiff(Second, '01/01/2011 00:00:00', pvh.[TimeStamp]) / @ResolutionInSeconds)
ORDER BY
[TimeStamp] ASC
我将时间戳减去任意日期以得到一个基本整数,然后将其除以所需的分辨率,然后按此进行分组,以最小时间戳(该邮票“区域”的第一个)和该“期间”的平均值。
这用于绘制历史数据图,因此平均值很好。
根据我能想到的表大小,这是最快的执行
谢谢大家的帮助。
最佳答案
假设要求确定是否返回某行取决于从上一个返回的行开始耗时,则需要采取一种程序方法。递归CTE可能比游标更有效率。
WITH RecursiveCTE
AS (SELECT TOP 1 *
FROM @T
ORDER BY [Timestamp]
UNION ALL
SELECT id,
[Timestamp],
Value
FROM (
--Can't use TOP directly
SELECT T.*,
rn = ROW_NUMBER() OVER (ORDER BY T.[Timestamp])
FROM @T T
JOIN RecursiveCTE R
ON T.[Timestamp] >=
DATEADD(SECOND, 30, R.[Timestamp])) R
WHERE R.rn = 1)
SELECT *
FROM RecursiveCTE