HDFS 回收站功能介绍


1. 介绍

  • hadoop 的回收站trash功能默认是关闭的,所以需要在core-site.xml中手动开启

  • 在HDFS里,删除文件时,不会真正的删除,其实是放入回收站 /trash

  • 回收站里的文件可以快速恢复

  • 可以设置一个时间阈值,当回收站里文件的存放时间超过这个阈值或是回收站被清空时,文件才会被彻底删除,并且释放占用的数据块。

2. 开启回收站

  • 手动开启trash功能,添加 fs.trash.interval 属性
# 查看回收站路径下的文件
bin/hadoop dfs -ls /user/grid/.Trash
ls: Cannot access /user/grid/.Trash: No such file or directory.

# 编辑配置文件开启回收站
vi conf/core-site.xml 


  fs.trash.interval
  1440
 
   Number of minutes between trash checkpoints. If zero, the trash feature is disabled.
  

注:fs.trash.interval 的含义是文件删除后保留时长,,默认为0,单位为分钟,这里设的是1天(60*24)

3. 测试回收站是否开启成功

  1. 测试删除数据

  2. 检查回收站数据,发现多出了.Trash目录

注:在HDFS上的回收站数据在 /user/$USER/.Trash/Current/user/$USER/目录下

  1. 恢复回收站数据

将删除的数据从回收站移动到其他文件夹即可

  1. 清空回收站

清空回收站命令:hdfs dfs -expunge


文章作者: hnbian
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 hnbian !
评论
 上一篇
NoClassDefFoundError org/cloudera/htrace/Trace NoClassDefFoundError org/cloudera/htrace/Trace
Eclipse 中执行 HBase 程序时出现 java.lang.NoClassDefFoundError: org/cloudera/htrace/Trace 这是由于缺少 htrace-core.jar,该包在 Hbase 的 lib
2016-04-13
下一篇 
HBase 介绍 HBase 介绍
1. HBase 介绍HBase是一个开源的非关系型分布式数据库,它参考了谷歌的BigTable建模,实现的编程语言为Java。它是Apache软件基金会的Hadoop项目的一部分,运行于HDFS文件系统之上,为 Hadoop 提供类似于B
2016-04-01
  目录