我尝试使用a react native audio record library录制一个3秒的.wav音频文件。在记录过程中,可以通过此“连接” /“功能”接收base64数据,每次从记录中接收到一大块数据时都会激活该base64数据(不确定您会叫什么名字):

AudioRecord.on('data', data => {
  // base64-encoded audio data chunks
});
我在按下按钮时激活的功能中执行此操作。当我尝试将收到的所有数据存储在这样的变量中时,就会出现问题:
var tempString = '';
AudioRecord.on('data', data => {
  tempString += data;
});
出于某种原因,当录制完成后使用console.log tempString(使用settimeout)时,似乎只存储了第一次接收到任何数据的数据。另外,当我创建一个可变计数时,每次接收到数据时都会递增计数,它只是正常计数而已。
当我console.log数据时,它确实会打印出所有数据。我试过将数据推送到数组,并在变量发生变化时进行监听,但是我尝试的所有结果都只是存储了我收到的第一条数据。如何将收到的所有数据存储在变量中?这有可能吗?

最佳答案

背景:Base64填充

Base64中,每个输出字符代表输入的6位(26 = 64)。对数据进行编码时,第一步是将输入的位拆分为6位的块。让我们以输入字符串“hello”(以ASCII或UTF-8编码为二进制)为例。如果我们尝试将其位分割为6位的块,我们将意识到它并不是平均分配的:最后一个块只有4位。

h         e         l         l         o
01101000  01100101  01101100  01101100  01101111
011010 000110 010101 101100 011011 000110 1111??
a      G      V      s      b      G      ?

我们可以用0填充输入流,以填充丢失的位。

011010 000110 010101 101100 011011 000110 111100
a      G      V      s      b      G      8

这给了我们"aGVsbG8",并且在JavaScript中进行了快速的健康测试,确认了atob("aGVsbG8") === "hello"。没问题

如果我们自己解码此块,则此方法有效,因为我们知道,一旦到达该块的末尾,我们尚未解码的其余两位必须填充,并且可以忽略。但是,如果这只是流的一部分,紧接着是更多的base64数据,则我们不能说我们处在块的末尾!

例如,让我们尝试将aGVsbG8与自身连接起来,并将aGVsbG8aGVsbG8解码为单个值。

a      G      V      s      b      G      8      a      G      V      s      b      G      8
011010 000110 010101 101100 011011 000110 111100 011010 000110 010101 101100 011011 000110 111100
                                              ||- padding that should be ignored
01101000 01100101 01101100 01101100 01101111  00011010 00011001 01011011 00011011 00011011 1100????
h        e        l        l        o         \x1A     \x19     [        \x1B     \x1B     ?

这两个填充位导致解码流变得未对齐,并且剩余数据被整齐。

在这些情况下,标准解决方案是在编码数据后的两个=填充字符之间添加零。每个=代表六位填充数据。这些标记了编码值的结尾,但是它们也允许在输入数据和输出数据之间保持对齐:通过在流中进行适当的填充,可以将编码数据的每四个字符块明确地解码为1-3个字节。解码的数据,而无需单独了解数据对齐方式。我们的示例需要六位填充来保持对齐,从而给我们aGVsbG8=。如果将其自身连接起来,我们可以看到解码现在成功了:

a      G      V      s      b      G      8      =      a      G      V      s      b      G      8       =
011010 000110 010101 101100 011011 000110 111100 PPPPPP 011010 000110 010101 101100 011011 000110 111100 PPPPPP
01101000 01100101 01101100 01101100 01101111  00PPPPPP 01101000 01100101 01101100 01101100 01101111  00PPPPPP
h        e        l        l        o         padding  h        e        l        l        o         padding

问题:无能的解码器

使用功能齐全的编码器和解码器,您的方法应该可以正常工作。每个块应包括适当的填充,并且解码器应能够跳过它并组合正确的结果。

不幸的是,许多最常见的base64解码库不支持此功能。

Node的Buffer只是假设它获得了一个编码值,因此当它看到填充(可能在第一个块的末尾)时,它假定它是该值的末尾,并停止解码,并丢弃其余数据。
> Buffer.from('aGVsbG8=', 'base64')
<Buffer 68 65 6c 6c 6f>
> Buffer.from('aGVsbG8=aGVsbG8=', 'base64')
<Buffer 68 65 6c 6c 6f>

浏览器的atob引发错误,而不是静默忽略数据:
> atob("aGVsbG8=")
"hello"
> atob("aGVsbG8=aGVsbG8=")
InvalidCharacterError: String contains an invalid character

解决方案

手动拆分填充

如果我们采用您将所有数据存储在单个字符串中的方法,则我们需要负责填充自己的数据。 (注意:通常,重复附加到字符串上可能会出现问题,因为如果JavaScript引擎无法优化字符串,它会变得非常慢。在这里实际上可能不是问题,但通常可以避免。)

我们可以使用匹配一个或多个=填充字符序列的正则表达式来执行此操作,
const input = "aGVsbG8=aGVsbG8=aGVsbG8=aGVsbG8=";
const delimiter = /=+/g;

拆分字符串,
const pieces = input.split(delimiter);

分别解码片段,
const decodedPieces = pieces.map(piece => Buffer.from(piece, 'base64'));

然后将它们的输出合并为一个步骤(比增量执行效率更高)。
const decoded = Buffer.concat(decodedPieces);
console.log(decoded.toString('ascii'));
'hellohellohellohello'

分别存储块

但是,在您的情况下,仅从头开始将块存储在数组中,然后跳过级联和完全拆分可能会更简单。
const decodedPieces = [];
AudioRecord.on('data', data => {
  decodedPieces.push(Buffer.from(data, 'base64'));
});

// later, when you need to collect the data...
const decoded = Buffer.concat(decodedPieces);

关于javascript - 为什么存储base64数据流不起作用?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/54171688/

10-09 16:18
查看更多