资讯专栏INFORMATION COLUMN

HDFS shell操作

Tecode / 1921人阅读

摘要:目录返回列表的信息如下目录名修改日期修改时间权限用户组示例返回值成功返回,失败返回。这个命令允许有多个源路径,此时目标路径必须是一个目录。不允许在不同的文件系统间移动文件。示例返回值成功返回,失败返回。

调用文件系统(FS)Shell命令应使用 bin/hadoop fs 的形式

ls
使用方法:hadoop fs -ls

如果是文件,则按照如下格式返回文件信息: 文件名 <副本数> 文件大小 修改日期 修改时间 权限 用户ID 组ID 如果是目录,则返回它直接子文件的一个列表,就像在Unix中一样。目录返回列表的信息如下: 目录名

修改日期 修改时间 权限 用户ID 组ID 示例: hadoop fs -ls /user/hadoop/file1 /user/hadoop/file2 hdfs://host:port/user/hadoop/dir1 /nonexistentfile 返回值: 成功返回0,失败返回-1。
text
使用方法:hadoop fs -text

将源文件输出为文本格式。允许的格式是zip和TextRecordInputStream。

mv
使用方法:hadoop fs -mv URI [URI …]

将文件从源路径移动到目标路径。这个命令允许有多个源路径,此时目标路径必须是一个目录。不允许在不同的文件系统间移动文件。 示例:

hadoop fs -mv /user/hadoop/file1 /user/hadoop/file2
hadoop fs -mv hdfs://host:port/file1 hdfs://host:port/file2 hdfs://host:port/file3 hdfs://host:port/dir1
返回值:

成功返回0,失败返回-1。

put
使用方法:hadoop fs -put ...

从本地文件系统中复制单个或多个源路径到目标文件系统。也支持从标准输入中读取输入写入目标文件系统。

hadoop fs -put localfile /user/hadoop/hadoopfile
hadoop fs -put localfile1 localfile2 /user/hadoop/hadoopdir
hadoop fs -put localfile hdfs://host:port/hadoop/hadoopfile
hadoop fs -put - hdfs://host:port/hadoop/hadoopfile 从标准输入中读取输入。
返回值:

成功返回0,失败返回-1。

rm
使用方法:hadoop fs -rm URI [URI …]

删除指定的文件。只删除非空目录和文件。请参考rmr命令了解递归删除。 示例:

hadoop fs -rm hdfs://host:port/file /user/hadoop/emptydir
返回值:

成功返回0,失败返回-1。

http://hadoop.apache.org/docs/r1.0.4/cn/hdfs_shell.html

HDFS shell操作练习

在centos 中创建 test.txt

touch test.txt

在centos中为test.txt 添加文本内容

vi test.txt

在HDFS中创建 hadoop001/test 文件夹

hadoop fs -mkdir -p /hadoop001/test

把text.txt文件上传到HDFS中

hadoop fs -put test.txt /hadoop001/test/

查看hdfs中 hadoop001/test/test.txt 文件内容

hadoop fs -cat /hadoop001/test/test.txt

将hdfs中 hadoop001/test/test.txt文件下载到centos

hadoop fs -get /hadoop001/test/test.txt test.txt

删除HDFS中 hadoop001/test/

hadoop fs -rm -r /hadoop001

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/125941.html

相关文章

  • Hadoop Shell命令

    摘要:调用文件系统命令应使用的形式。命令的使用者必须是超级用户。这个命令允许有多个源路径,此时目标路径必须是一个目录。目录返回列表的信息如下目录名修改日期修改时间权限用户组示例返回值成功返回,失败返回。示例返回值成功返回,失败返回。 调用文件系统(FS)Shell命令应使用 bin/Hadoop fs 的形式。 所有的的FS shell命令使用URI路径作为参数。URI格式是scheme://au...

    Darkgel 评论0 收藏0
  • 大数据系列(5)——hdfs的学习

    摘要:分布式文件系统分布式文件系统数据集的大小超过一台独立的计算机的存储能力时就要通过网络中的多个机器来存储数据集把管理网络中多台计算机组成的文件系统称为分布式文件系统的特点分布式数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多 1. hdfs(分布式文件系统) 1.1 分布式文件系统 ​ 数据集的大小超过一台独立的计算机的存储能力时,就要通过网络中的多个机器来存储数...

    kyanag 评论0 收藏0
  • 通过HBase Observer同步数据到ElasticSearch

    摘要:包含两个组件,一个是类似关系型数据库的存储过程,用以加快特定查询的响应,另一个就是类似关系型数据库的触发器。应用场景我们在同一个主机集群上同时建立了集群和集群,存储到的数据必须实时地同步到。通过修改表结构,加入信息。 Observer希望解决的问题 HBase是一个分布式的存储体系,数据按照RowKey分成不同的Region,再分配给RegionServer管理。但是RegionSe...

    FrozenMap 评论0 收藏0
  • 慕课网_《HBase入门》学习总结

    摘要:慕课网入门学习总结时间年月日星期一说明本文部分内容均来自慕课网。而且底层使用,本身也有备份高性能底层的数据结构和有序排列等架构上的独特设计,使用具有非常高的写入性能。 慕课网《HBase入门》学习总结 时间:2018年06月11日星期一 说明:本文部分内容均来自慕课网。@慕课网:https://www.imooc.com 教学源码:无 学习源码:无 第一章:课程介绍 1-1 课程...

    zsy888 评论0 收藏0
  • 大数据入门指南(GitHub开源项目)

    摘要:项目地址前言大数据技术栈思维导图大数据常用软件安装指南一分布式文件存储系统分布式计算框架集群资源管理器单机伪集群环境搭建集群环境搭建常用命令的使用基于搭建高可用集群二简介及核心概念环境下的安装部署和命令行的基本使用常用操作分区表和分桶表视图 项目GitHub地址:https://github.com/heibaiying... 前 言 大数据技术栈思维导图 大数据常用软件安装指...

    guyan0319 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<