我使用的不是我写的一些最佳代码...:-|
我有以下代码:
string fmtLine = "";
string[] splitedFmtLine;
int counterFMTlines = 0;
foreach (string fmtF in fmtFiles)
{
using (StreamReader sr = new StreamReader(fmtF))
{
while ((fmtLine = sr.ReadLine()) != null)
{
Console.WriteLine(counterFMTlines++);
foreach (L3Message message in rez)
{
splitedFmtLine = Regex.Split(fmtLine, "\t");
if (message.Time == splitedFmtLine[0])
{
message.ScramblingCode = splitedFmtLine[7];
}
}
}
}
}
当List为空并且只有一个文件(制表符分隔的280000行)时,我测试了此代码,即使如此,它花了整个生命(1分钟)遍历了文件的所有280000行。这意味着执行跳过了foreach循环,这是我的myObjs列表。
我不明白为什么花了这么长时间?
例如,我用不同的文本文件(源文件)填充了myObjs列表(树层次结构),但大于此制表符分隔的(制表符分隔的:16MB,源文件:36MB),并且只花了1分钟而不是2分钟。
最佳答案
除了写入控制台的问题之外,您还具有O(m * n)运行时,其中n是文件中的行数,m是消息数。如果m或n大,则不好。您可以改为使用Dictionary
并消除内部循环,从而将此操作简化为O(n)操作。
您可以使用“时间”作为键将邮件放在Dictionary
中。在循环中,您只需要在特定时间向字典询问消息:
string fmtLine = "";
string[] splitedFmtLine;
int counterFMTlines = 0;
var messageTimes = new Dictionary<string, LinkedList<L3Message>>();
foreach (L3Message message in rez)
{
LinkedList<L3Message> list=null;
messageTimes.TryGetValue(message.Time, out list);
list = list ?? new LinkedList<L3Message>();
list.AddLast(message);
messageTimes[message.Time] = list;
}
foreach (string fmtF in fmtFiles)
{
using (StreamReader sr = new StreamReader(fmtF))
{
while ((fmtLine = sr.ReadLine()) != null)
{
//Console.WriteLine(counterFMTlines++);
splitedFmtLine = fmtLine.Split('\t');
LinkedList<L3Message> messageList = null;
messageTimes.TryGetValue(splitedFmtLine[0], out messageList);
if(messageList != null)
{
foreach (var message in messageList)
{
message.ScramblingCode = splitedFmtLine[7];
}
messageTimes.Remove(splitedFmtLine[0]); //see comments
}
if(messageTimes.Count==0) break; //see comments
}
}
if(messageTimes.Count==0) break; //see comments
}
这应该超级快。
编辑:我更改了示例,以便它支持一次有多个消息的情况。
Edit2:我基于消息时间和ScramblingCode始终相关的事实添加了优化(请参见注释)。
关于c# - C#非常慢的StreamReader,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/9955916/