执行分组并依靠平面文件

执行分组并依靠平面文件

本文介绍了SSIS - 执行分组并依靠平面文件的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我对平面 .CSV 文件进行了一些转换和验证以导入数据.我想添加一个列,其中包含员工在平面文件中出现的次数,例如:

I make some transformations and validation on a flat .CSV file to import data.I'd like to add a column with the number of time an employee is present in the flat file for exemple :

输入数据流:

输出数据流:

我不知道如何转换我的数据流...有想法吗?

I don't know how to transform my dataflow... have an idea?

推荐答案

我会这样做:

  1. 如果您的数据尚未排序,请根据 Employee_Id 对其进行排序.
  2. 使用多播将您的数据流分成两个流.
  3. 在其中一个流中,添加一个按 Employee_Id 分组的聚合转换,并为每个 Employee_Id 添加一个包含 COUNT(*) 的新计数列.此流中的时间将被忽略和丢弃.
  4. 合并 在 Employee_Id 上将两个流重新连接在一起,仅保留聚合流中的 Count 列.

这应该会为您提供源数据中每一行的所需输出,但每一行都有每个 Employee_Id 的计数.

This should leave you with the desired output of one row for every row in the source data, but with the Count per Employee_Id on each row.

这篇关于SSIS - 执行分组并依靠平面文件的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

09-02 01:07