我正在阅读应该被压缩的数据(adCenter 报告,因为它发生)。用普通流读取内容,我得到了几千字节的乱码,所以这似乎是合理的。所以我将流提供给 DeflateStream。
首先,它报告“块长度与其补码不匹配”。一个简短的搜索表明有一个两字节的前缀,实际上如果我在打开 DeflateStream 之前调用 ReadByte() 两次,异常就会消失。
但是, DeflateStream 现在根本不返回任何内容。我花了下午的大部分时间在这方面寻找线索,但没有运气。帮助我,StackOverflow,你是我唯一的希望!谁能告诉我我错过了什么?
这是代码。当然,我在测试时一次只启用了两个注释块之一。
_results = new List<string[]>();
using (Stream compressed = response.GetResponseStream())
{
// Skip the zlib prefix, which conflicts with the deflate specification
compressed.ReadByte(); compressed.ReadByte();
// Reports reading 3,000-odd bytes, followed by random characters
/*byte[] buffer = new byte[4096];
int bytesRead = compressed.Read(buffer, 0, 4096);
Console.WriteLine("Read {0} bytes.", bytesRead.ToString("#,##0"));
string content = Encoding.ASCII.GetString(buffer, 0, bytesRead);
Console.WriteLine(content);*/
using (DeflateStream decompressed = new DeflateStream(compressed, CompressionMode.Decompress))
{
// Reports reading 0 bytes, and no output
/*byte[] buffer = new byte[4096];
int bytesRead = decompressed.Read(buffer, 0, 4096);
Console.WriteLine("Read {0} bytes.", bytesRead.ToString("#,##0"));
string content = Encoding.ASCII.GetString(buffer, 0, bytesRead);
Console.WriteLine(content);*/
using (StreamReader reader = new StreamReader(decompressed))
while (reader.EndOfStream == false)
_results.Add(reader.ReadLine().Split('\t'));
}
}
正如您可能从最后一行猜测的那样,解压缩的内容应该是 TDT。
只是为了好玩,我尝试使用 GZipStream 进行解压缩,但它报告说魔数(Magic Number)不正确。 MS 的文档只是说“下载的报告是使用 zip 压缩进行压缩的。您必须先解压缩报告,然后才能使用其内容。”
这是最终有效的代码。我不得不将内容保存到一个文件中并重新读入。这似乎不合理,但对于我正在处理的少量数据,这是可以接受的,我会接受的!
WebRequest request = HttpWebRequest.Create(reportURL);
WebResponse response = request.GetResponse();
_results = new List<string[]>();
using (Stream compressed = response.GetResponseStream())
{
// Save the content to a temporary location
string zipFilePath = @"\\Server\Folder\adCenter\Temp.zip";
using (StreamWriter file = new StreamWriter(zipFilePath))
{
compressed.CopyTo(file.BaseStream);
file.Flush();
}
// Get the first file from the temporary zip
ZipFile zipFile = ZipFile.Read(zipFilePath);
if (zipFile.Entries.Count > 1) throw new ApplicationException("Found " + zipFile.Entries.Count.ToString("#,##0") + " entries in the report; expected 1.");
ZipEntry report = zipFile[0];
// Extract the data
using (MemoryStream decompressed = new MemoryStream())
{
report.Extract(decompressed);
decompressed.Position = 0; // Note that the stream does NOT start at the beginning
using (StreamReader reader = new StreamReader(decompressed))
while (reader.EndOfStream == false)
_results.Add(reader.ReadLine().Split('\t'));
}
}
最佳答案
您会发现 DeflateStream 在解压缩的数据方面非常有限。事实上,如果你期待整个文件,它根本没有用。
ZIP 文件有数百种(大部分很小)变体,而 DeflateStream 只能处理其中的两三个。
最好的方法可能是使用专用库来读取 Zip 文件/流,如 DotNetZip 或 SharpZipLib(有些未维护)。
关于c# - 原始流有数据,放气返回零字节,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/5047859/