Hadoop_搜你所想

Spark面试整理-Spark与Hadoop的区别

Apache Spark和Hadoop是两个在大数据领域广泛使用的框架，它们有一些相似之处，但在设计和性能方面也有显著的不同。了解它们之间的区别有助于选择适合特定需求的工具。相似之处目的：Spark和Hadoop都是为了处理大规模的数据集。生态系统：它们都拥有一个丰富的生态系统和社区，提供各种工具和扩展。开源：两者都是开源项目，广泛用于学术和商业应用。兼容性：Spark可以运行在Hadoop的YA...

(view)

Hadoop集群配置与管理指南

目录前言一、Hadoop集群配置历史服务器二、配置日志的聚集三、集群启动/停止方式总结四、编写Hadoop集群常用脚本五、常用端口号说明最后前言这篇文章内容覆盖了Hadoop集群中一些重要且常用的配置和管理任务。首先，我们将介绍如何配置Hadoop集群的历史服务器，这对于查看和分析任务的历史信息非常有帮助。其次，我们将探讨如何配置日志的聚集和管理，以便有效地监控和故障排查集群。然后，我们将总结集群的启...

(view)

Hive安装教程-Hadoop集成Hive

文章目录前言一、安装准备1. 安装条件2. 安装jdk3. 安装MySQL4. 安装Hadoop 二、安装Hive1. 下载并解压Hive2. 设置环境变量3. 修改配置文件3. 创建hive数据库4. 下载MySQL驱动5. 初始化hive数据库6. 进入Hive命令行界面7. 设置允许远程访问总结前言本文将介绍安装和配置Hive的步骤。在开始之前，我们需要满足一些安装条件，包括安装JDK、MyS...

(view)

hadoop集群部署教程

配置文件位置1.1 只读默认配置文件1.2 可修改配置文件1.3 相关环境变量配置文件二、安装准备1. 准备centos2. 配置集群免密登录3. 部署规划4. 安装条件5. 安装jdk 三、安装hadoop1. 下载并解压hadoop2. 设置环境变量2.1 设置hadoop安装目录环境变量2.2 设置hadoop的root用户环境变量 3. 修改配置文件3.1 修改 etc/hadoop/hadoop...

(view)

hadoop伪集群部署教程

文章目录前言一、安装准备1. 安装条件2. 安装jdk3. 配置本节点免密登录二、安装hadoop1. 下载并解压hadoop2. 设置环境变量2.1 设置hadoop安装目录环境变量2.2. 设置hadoop的root用户环境变量 3. 修改配置文件3.1 修改 etc/hadoop/hadoop-env.sh 文件3.2 修改 etc/hadoop/core-site.xml 文件3.3 修改 et...

(view)

hadoop-hdfs简介及常用命令详解（超详细）

件的末尾内容。16. 以文本格式显示文件的内容。17. 统计文件和目录的数量。18. 设置文件的副本数。19. 在 HDFS 上创建一个空文件。20. 检查文件或目录的存在性。总结前言 HDFS（Hadoop Distributed File System）是Apache Hadoop生态系统中的分布式文件系统，用于存储和处理大规模数据集。HDFS具有高容错性、高可靠性和高吞吐量的特点，适用于大数据处理和...

(view)

Hadoop和Spark的区别

Hadoop 表达能力有限。磁盘IO开销大，延迟度高。任务和任务之间的衔接涉及IO开销。前一个任务完成之前其他任务无法完成，难以胜任复杂、多阶段的计算任务。 Spark Spark模型是对Mapreduce模型的改进，可以说没有HDFS、Mapreduce就没有Spark。 Spark可以使用Yarn作为他的资源管理器，并且可以处理HDFS数据。这对于已经部署了Hadoop集群的用户特别重要，因为他们不需要任...

(view)

【Hadoop面试】HDFS读写流程

HDFS（Hadoop Distributed File System）是GFS的开源实现。 HDFS架构 HDFS是一个典型的主/备（Master/Slave）架构的分布式系统，由一个名字节点Namenode(Master) +多个数据节点Datanode(Slave)组成。其中Namenode提供元数据服务，Datanode提供数据流服务，用户通过HDFS客户端与Namenode和Datanode交互访问...

(view)

格式化名称节点，启动Hadoop

1.循环删除hadoop目录下的tmp文件，记住在hadoop目录下进行 rm tmp -rf 使用上述命令，hadoop目录下为： 2.格式化名称节点 # 格式化名称节点./bin/hdfs namenode -format 3.启动所有节点 ./sbin/start-all.sh 效果图： 4.查看节点启动效果 jps 能够看到有六个节点，我打码那个是我自己下载的eclipse，与内容无关，我直...

(view)

hadoop在本地创建文件，然后将文件拷贝/上传到HDFS

1.要$cd {对应目录}进入到对应目录，一般为 cd /usr/local/hadoop/ 2.创建文件，$sudo gedit {文件名}，例 sudo gedit test.txt 然后在弹出的txt文件输入内容，点击右上角的保存之后，关闭即可。 3.拷贝本地文件到HDFS，$./bin/hdfs dfs -copyFromLocal {本地文件或者文件夹名} {HDFS上的文件或者文件夹名或者./} ...

(view)

上一页 1 3 4 5 6 7 8 9 10 下一页