您现在的位置是:首页 > 正文

面试题:rm 删除文件之后,空间就被释放了吗?你知道答案吗?

2024-01-31 00:11:04阅读 0
  • 产生一个指定大小的随机内容文件

  • 一个文件什么情况下才会被删除?

  • 如何释放已经被删除文件占用的空间?

  • 总结

在Linux,你是不是曾经天真的以为,使用rm删除一个文件,占用的空间就释放了?事情可能不是常常如人意。

产生一个指定大小的随机内容文件

我们先看一下当前各个挂载目录的空间大小:

$ df -h
/dev/sda11      454M  280M  147M  66% /boot
 

我这里挑选了其中一个结果展示(你可以选择任一挂载目录),接下来准备在/boot下生成一个文件。

首先我们产生一个50M大小的文件:

$ dd if=/dev/urandom of=/boot/test.txt bs=50M count=1
 

至此,我们产生了一个50M大小的文件,再看boot下:

$ df -h
/dev/sda11      454M  312M  115M  74% /boot
 

这里你不用关心到底多了多少,你只需要关注,/boot下的文件增多了。

测试程序:

#include<stdio.h>
#include<unistd.h>
int main(void)
{
    FILE *fp = NULL;
    fp = fopen("/boot/test.txt", "rw+");
    if(NULL == fp)
    {
       perror("open file failed");
       return -1;
    }
    while(1)
    {
       //do nothing
       sleep(1);
    }
    fclose(fp);
    return 0;
}
 

至于程序本身,也没干啥实际的事情,就是打开一个文件,然后一直循环。编译并运行:

$ gcc -o openFile openFile.c
$ ./openFile
 

打开另外一个窗口,删掉test.txt:

$ rm /boot/test.txt
 

再看一下boot空间:

$ df -h
dev/sda11      454M  312M  115M  74% /boot
 

咦?空间大小怎么一点都没变!!明明使用rm把它删除了啊?

我们把openFile程序停掉,再看看:

$$ df -h
/dev/sda11      454M  280M  147M  66% /boot
 

乖乖,空间马上就释放掉了,也就是按照预期,我们的文件被删除了。

一个文件什么情况下才会被删除?

实际上,只有当一个文件的引用计数为0(包括硬链接数)的时候,才可能调用unlink删除,只要它不是0,那么就不会被删除。所谓的删除,也不过是文件名到 inode 的链接删除,只要不被重新写入新的数据,磁盘上的block数据块不会被删除,因此,你会看到,即便删库跑路了,某些数据还是可以恢复的。换句话说,当一个程序打开一个文件的时候(获取到文件描述符),它的引用计数会被+1,rm虽然看似删除了文件,实际上只是会将引用计数减1,但由于引用计数不为0,因此文件不会被删除。

struct inode {
struct hlist_node   i_hash; /* hash链表的指针 */
struct list_head    i_list; /* backing dev IO list */
struct list_head    i_sb_list; /* 超级块的inode链表 */
struct list_head    i_dentry; /* 引用inode的目录项对象链表头 */
unsigned long    i_ino; /* 索引节点号 */
atomic_t         i_count; /* 引用计数 */
unsigned int     i_nlink; /* 硬链接数目 */
 

关于里面的细节,还有很多内容(如硬链接数量也会影响文件是否被删除),这里不一一展开。

如何释放已经被删除文件占用的空间?

关于释放,前面已经说了,重启打开该文件的进程即可。但是有没有方法找到哪些文件被删除了,但还是被某些进程打开了呢?

自然是有方法的:

$ lsof |grep deleted

 

其中被标记为deleted的文件,就是这样的一些文件。

其实在前面的例子中,我们也可以很容易观察到(openFile程序运行,test.txt文件被删除):

$ ls -al /proc/`pidof openFile`/fd
total 0
lrwx------ 1 root root 64 5月   4 09:27 0 -> /dev/pts/25
lrwx------ 1 root root 64 5月   4 09:27 1 -> /dev/pts/25
lrwx------ 1 root root 64 5月   4 09:27 2 -> /dev/pts/25
lrwx------ 1 root root 64 5月   4 09:27 3 -> /boot/test.txt (deleted)

 

看见没有,test.txt后面还有deleted字样。

既然我们都说了,这样的情况下文件是没有被删除的,那么还能不能恢复呢?实际上还是可以读取的。

总结

实际上对于这种文件被删除了,常常出现于程序的日志文件中,可能你有一个定时任务去清理程序产生的日志文件,但是如果程序本身忘记关闭句柄,就会导致磁盘空间得不到释放,最终就是你认为文件都被删除了,但是磁盘却依然被占着。所以,养成好习惯,打开文件后,不用时,记得关闭文件描述符。

如果发现明明已经删除了大量文件,但是空间却并没有恢复正常,那么不妨看看是不是还有程序打开了这些文件。

小编总结了2020面试题,这份面试题的包含的模块分为19个模块,分别是: Java 基础、容器、多线程、反射、对象拷贝、Java Web 、异常、网络、设计模式、Spring/Spring MVC、Spring Boot/Spring Cloud、Hibernate、MyBatis、RabbitMQ、Kafka、Zookeeper、MySQL、Redis、JVM 。 关注公众号:程序员白楠楠

 

网站文章

  • 动态规划-多边形游戏

    动态规划-多边形游戏

    算法思想:动态规划 实际问题:多边形游戏 编写语言:Java 前言 多边形游戏问题是矩阵连乘的最优计算次序问题与凸多边形最优三角剖分问题的推广。我在解决凸多边形最优三角剖分问题时偶然间看到了这个结论,...

    2024-01-31 00:10:35
  • Baobab的Windows替代品

    一台老电脑,100G硬盘,竟然满了,什么都没装。该死的Windows,要是Windows下有Baobab就好了。于是找到这个:http://alternativeto.net/software/baobab/?platform=windows

    2024-01-31 00:10:30
  • python 多组直方图 画图_Python Matplotlib 直方图(Histograms)

    1、直方图(Histograms)直方图是显示频率分布的图。该图显示了每个给定间隔内的观察次数。示例:假设您要求250人的身高,则最终可能会得到如下所示的直方图:可以从直方图中看到大约有:2人从140...

    2024-01-31 00:10:23
  • 如何查看设备的 VendorID 和 DeviceID

    如何查看设备的 VendorID 和 DeviceID

    如何查看网卡的 VendorID 和 DeviceID

    2024-01-31 00:10:05
  • 1356 根据数字二进制下1的数目排序

    直接除基取余法暴力 class Solution { int m[10005]; public: vector sortByBits(vector&amp; arr) { memset(m, 0, sizeof(m)); for(int i : arr) { int ...

    2024-01-31 00:09:34
  • 两个线程循环交替打印

    不加锁,while+boolean变量死循环 public class Solution { volatile static boolean open=false; volatile static int index=0; static String s="adasdfsafwfvgs"; static Thread t1=new Thread(new myRun1(),"线程1...

    2024-01-31 00:09:27
  • 【DevOps】通过kubernetes可视化界面(rancher)安装kibana

    服务器地址:192.168.1.128 挂载情况 部署 创建kibana的配置文件 需要去NFS的服务器目录下,我们下面会把这个文件映射到容器内部 创建pv 1、创建kibana config的pv ...

    2024-01-31 00:09:23
  • 算法笔记(15)特征提取及Python代码实现

    算法笔记(15)特征提取及Python代码实现

    特征提取从初始的一组测量数据开始,并建立旨在提供信息和非冗余的派生值(特征),从而促进后续的学习和泛化步骤,并且在某些情况下带来更好的可解释性。本节主要讲述2种特征提取方法:PCA主成分分析法用于特征...

    2024-01-31 00:08:52
  • 配置webpack报错:Error: error:0308010C:digital envelope routines::unsupported

    配置webpack报错:Error: error:0308010C:digital envelope routines::unsupported

    配置webpack报错:Error: error:0308010C:digital envelope routines::unsupported

    2024-01-31 00:08:44
  • springBoot--集成springsession利用redis来实现session共享

    springBoot--集成springsession利用redis来实现session共享

    转:https://www.cnblogs.com/mengmeng89012/p/5519698.html这次带来的是spring boot + redis 实现session共享的教程。 在spr...

    2024-01-31 00:08:37