hadoop - 谁在hadoop中分割文件？是Job Tracker吗？ | 文件

文件

json - 如何找到已保存的Docker镜像tar文件中包含的内容？

c# - 如何在运行时将rowstate属性设置为Deleted？

namespaces - 什么是命名空间污染？

entity-framework - EF4 中的多对多关系与 "Shared"列

ruby-on-rails - 生成新模型时出现"wrong constant name"错误

jquery - 从jQuery AJAX读取HTTP状态/错误代码时出现问题

django - docker未运行Django服务器

html - 如何在图像上有许多单选按钮？ (HTML，CSS)

mysql - MySQL查询卡在此

php - 在 PHP 5.1.6 上运行 Zend Framework - ksort() 的补丁或修复程序？

c# - 具有现有用户表的ASP.NET MVC身份

php - 在utf-8中为php页面强制编码

php - 如何从普通SQL中的NOT EXISTS转换为DOCTRINE ORM

asp.net - 如何从ASPX控件事件中调用Javascript函数？

linux - Freeswitch安装过程中如何解决“LUA脚本解析/执行错误”？

hadoop - 谁在hadoop中分割文件？是Job Tracker吗？

扫码查看

我想知道
当客户端将数据存储到hdfs中时，谁完全执行将大文件拆分为较小块的任务？
客户端是否直接将数据写入DataNodes？如果是这样，什么时候将数据分成64 MB或128 MB？

最佳答案

JobClient不会执行作业跟踪程序

输入本身依赖于集群。客户端仅计算从名称节点获得的元信息(块大小，数据长度，块位置)。这些computed输入拆分将元信息携带到任务中，例如块偏移量和要计算的长度。

关于hadoop - 谁在hadoop中分割文件？是Job Tracker吗？，我们在Stack Overflow上找到一个类似的问题：https://stackoverflow.com/questions/24443495/

10-16 14:36