我在徘徊是否有人使用BDD测试大数据ETL应用程序?
我可以看到BDD如何用于测试具有客户端交互功能的应用程序,但是在使用大数据ETL应用程序的情况下,没有客户端交互功能,因此很难知道我可能使用的“何时”。
例如:
给出100个A型事件
5分钟后发生50次B型事件
然后,数据库行应为:
|类型|计数|桶|
| A | 100 | 1 |
| B | 50 | 2 |
但这似乎是错误的。
有见识的人吗?
最佳答案
您能举一个我期望在ETL输出中看到的例子吗?
您可以对此做出一些回应。一种可能是您期望的不同类型的数据库行,而且其中一些可能会重复,而其他则不会重复。这让我感到很奇怪,但是如果您习惯使用星型模式,那么您可能会注意到其他差异。
通常,我会避免人们谈论数据库,但是,如果您使用的是星型模式,我认为可以提及事实和维度(我并没有使用ETL进行过很多工作,但是我确实记得通过讨论具体示例以及我希望看到的内容)。
替代方法是使用客户端。
我看到你说没有客户。但是,总是有一个客户,即使将来可能存在。 ETL涉及安全,性能和访问等方面。值得一个客户端(即使它是基于字符串或基于SQL的玩具)来探索可能会使您绊倒的事情。
你为什么做这个?如果企业,用户或客户能够做到这一点,而企业又无法做到,那么这又是什么新事物呢?您可以举一个例子吗?
“我们将能够了解X相对于Y标准的表现如何。”
大。您能举一些X,Y和一些标准的例子吗?您将如何衡量效果?您要寻找什么数据?每个人都应该能够看到该数据吗?您能想到有人无法访问的任何情况吗?
这些示例等同于场景的ETL。对话保持相同的模式。由于您的API是面向机器而不是面向人的,因此您最终只能在不同级别上自动化它们,并且您的某些对话是关于监视而不是测试。您的对话仍应与人们进行。
您的“时间”将是您在运行它的数据,权限和安全性上下文中运行的查询或报告。