我想知道如何控制从DocumentDB提取数据到映射器的方式吗?我的意思是给映射器等提供了几个JSON文档?

最佳答案

当前,文档以700批的批次批量获取,这是一个很好的平均值。
您最多可以设置1000个文档,请问为什么要更改它?

您目前无法将其更改为配置。
如果您自己构建连接器,如果您自己构建,则可以在此处更改
github link

如果您有很好的用例,则可以在github上打开一个问题,要求使用config进行更改的功能。

关于hadoop - 在Hadoop作业中如何从DocumentDB获取数据,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30466298/

10-10 19:31