操作命令
常用的HDFS操作命令(hdfs dfs)
首先开启hdfs:
1 | start-dfs.sh/start-all.sh |
用法查看:
hdfs dfs
1 | 与hadoop fs等价的 |
创建目录(-p 表示会创建父目录)
hdfs dfs -mkdir /001
hdfs dfs -mkdir /001/demo1 /001/demo2 /001/demo3 一次创建多个目录
hdfs dfs -mkdir -p /001/x/y 一次性创建多层目录
1 | hdfs dfs -mkdir xxx //这样不指定路径,会另创建/user/root目录,再在下面创建xxx目录 |
列出子目录或子文件
1 | hdfs dfs -ls [-d][-h][-R] <paths> |
上传文件
将本地目录下的文件上传到HDFS上,并分别重命名
1 | hdfs dfs -put [-f] [-p] <localsrc> <dst> |
hdfs dfs -put 本地文件名 hdfs路径
hdfs dfs -copyFromLocal 本地文件名 hdfs路径
例: hdfs dfs -put text1.txt /001/demo1/hdfs1.txt
例: hdfs dfs -copyFromLocal text1.txt /001/demo1/hdfs1.txt
将本地文件移动到HDFS
hdfs dfs -moveFromLocal 本地文件名 HDFS路径
下载文件到本地
1 | hdfs dfs -get [-p] <src> <localdst> |
hdfs dfs copyToLocal hdfs文件 本地path
hdfs dfs -get hdfs文件 本地路径
查看文件
1 | 命令: hdfs dfs -cat/text[-ignoreCrc] <src> |
删除目录或文件
1 | 命令: hdfs dfs -rm [-f] [-r] <src> |
追写文件
1 | 命令: hdfs dfs -appendToFile <localsrc> <dst> |
复制文件或文件夹
1 | 命令: hdfs dfs -cp [-f] [-p | -p[topax]] <src> <dst> |
hdfs dfs -cp hdfs文件/文件夹 hdfs文件名/hdfs文件夹
文件或文件夹的移动
hdfs dfs -mv hdfs文件 hdfs路径/文件名
使用touchz命令创建文件
hdfs dfs -touchz 文件
查看文件大小
1 | 命令: hdfs dfs -du [-s] [-h] <path> |
hdfs dfs -du hdfs文件
count统计(显示:目录个数,文件个数,文件总计大小)
1 | 命令: hdfs dfs -count [-q] [-h] <path> |
hdfs dfs -count hdfs文件夹
获取扩展属性,设置扩展属性
hdfs dfs -setfattr -n user.from -v http://www.baidu.com hdfs文件
hdfs dfs -getfattr -d hdfs文件
文件合并再下载
将路径中的文件合并并命名下载
hdfs dfs -getmerge 文件夹 文件名
追加数据文件末尾的指令
hdfs dfs -appendToFile 本地文件 hdfs文件
打印Block报告
hdfs fsck /user/hadoop/hadoop-2.7.3.tar.gz -files -blocks
打印文件块的位置信息(-locations)
hdfs fsck /user/hadoop/hadoop-2.7.3.tar.gz -files -blocks -locations
过去的别再遗憾

