本文旨在对 Linux 文件系统概念进行非常高层次的讨论。它并非旨在对特定文件系统类型(如 EXT4)的工作原理进行低层次描述,也并非旨在作为文件系统命令的教程。
每台通用计算机都需要在硬盘驱动器 (HDD) 或某些等效设备(如 USB 记忆棒)上存储各种类型的数据。这有几个原因。首先,当计算机关闭时,RAM 会丢失其内容。存在非易失性类型的 RAM,可以在断电后保持存储在那里的数据(例如 USB 记忆棒和固态驱动器中使用的闪存 RAM),但闪存 RAM 比标准易失性 RAM(如 DDR3 和其他类似类型)昂贵得多。
数据需要存储在硬盘驱动器上的第二个原因是,即使是标准 RAM 也比磁盘空间更昂贵。RAM 和磁盘成本都在迅速下降,但就每字节成本而言,RAM 仍然领先。根据 16GB RAM 与 2TB 硬盘驱动器的成本进行的快速计算表明,RAM 的单位成本大约是硬盘驱动器的 71 倍。如今,RAM 的典型成本约为每字节 0.0000000043743750 美元。
为了快速回顾历史,以便将目前的 RAM 成本置于背景之中,在计算机的早期,一种类型的内存是基于 CRT 屏幕上的点。这非常昂贵,大约每比特 1.00 美元!
定义
您可能会听到人们以多种不同且令人困惑的方式谈论文件系统。“文件系统”这个词本身可以有多种含义,您可能需要从讨论或文档的上下文中辨别出正确的含义。
我将尝试根据我观察到的“文件系统”一词在不同情况下的使用方式来定义它的各种含义。请注意,虽然我试图符合标准的“官方”含义,但我的目的是根据其各种用法来定义该术语。这些含义将在本文的后续章节中更详细地探讨。
- 整个 Linux 目录结构从顶部 (/) 根目录开始。
- 特定类型的数据存储格式,例如 EXT3、EXT4、BTRFS、XFS 等。Linux 支持近 100 种文件系统类型,包括一些非常旧的文件系统以及一些最新的文件系统。这些文件系统类型中的每一种都使用自己的元数据结构来定义数据的存储和访问方式。
- 使用特定类型的文件系统格式化的分区或逻辑卷,可以挂载到 Linux 文件系统上的指定挂载点。
基本文件系统功能
磁盘存储是一种必然的需求,它带来了一些有趣且不可避免的细节。显然,文件系统旨在为数据的非易失性存储提供空间;这是它的最终功能。然而,还有许多其他重要功能源于这一需求。
所有文件系统都需要提供命名空间——即命名和组织方法。这定义了如何命名文件,特别是文件名的长度以及可以用于文件名的字符子集(从可用字符总集中)。它还定义了磁盘上数据的逻辑结构,例如使用目录来组织文件,而不是将它们全部堆积在一个庞大的文件集合中。
一旦定义了命名空间,就需要元数据结构来为该命名空间提供逻辑基础。这包括支持分层目录结构所需的数据结构;确定磁盘上哪些空间块已使用以及哪些可用的结构;允许维护文件和目录名称的结构;有关文件的信息,例如文件的大小以及它们的创建、修改或上次访问时间;以及属于该文件的磁盘上数据的位置或位置。其他元数据用于存储有关磁盘细分的高级信息,例如逻辑卷和分区。这种更高级别的元数据及其表示的结构包含描述存储在驱动器或分区上的文件系统的信息,但与文件系统元数据是分开且独立的。
文件系统还需要应用程序编程接口 (API),该接口提供对系统函数调用的访问,这些调用操作文件系统对象,如文件和目录。API 提供创建、移动和删除文件等任务。它还提供算法来确定文件在文件系统上的放置位置。此类算法可能会考虑速度或最大程度地减少磁盘碎片等目标。
现代文件系统还提供安全模型,这是一种定义文件和目录访问权限的方案。Linux 文件系统安全模型有助于确保用户只能访问自己的文件,而不能访问其他用户或操作系统本身的文件。
最后一个构建块是实现所有这些功能所需的软件。Linux 使用两部分软件实现来提高系统和程序员的效率。

图 1:Linux 两部分文件系统软件实现。
此两部分实现的第一部分是 Linux 虚拟文件系统。此虚拟文件系统为内核和开发人员提供了一组用于访问所有类型文件系统的命令。虚拟文件系统软件调用特定设备驱动程序,该驱动程序是与各种类型的文件系统进行交互所必需的。特定于文件系统的设备驱动程序是实现的第二部分。设备驱动程序将标准的文件系统命令解释为特定于分区或逻辑卷上文件系统类型的命令。
目录结构
作为一个通常非常有条理的处女座,我喜欢将东西存储在较小的、有组织的组中,而不是在一个大桶中。目录的使用帮助我能够存储文件,并在我寻找它们时找到我想要的文件。目录也称为文件夹,因为可以将它们视为文件夹,文件保存在其中,类似于物理桌面。
在 Linux 和许多其他操作系统中,目录可以构建为树状层次结构。Linux 目录结构在Linux 文件系统层次标准 (FHS) 中得到了很好的定义和记录。当访问这些目录时,通过使用由正斜杠 (/) 连接的顺序更深的目录名称(如 /var/log 和 /var/spool/mail)来引用它们。这些被称为路径。
下表简要列出了标准的、众所周知的和已定义的顶层 Linux 目录及其用途。
目录 | 描述 |
---|---|
/(根文件系统) | 根文件系统是文件系统的顶层目录。它必须包含在挂载其他文件系统之前启动 Linux 系统所需的所有文件。它必须包含启动其余文件系统所需的所有必需的可执行文件和库。系统启动后,所有其他文件系统都作为根文件系统的子目录挂载在标准的、定义良好的挂载点上。 |
/bin | /bin 目录包含用户可执行文件。 |
/boot | 包含启动 Linux 计算机所需的静态引导加载程序以及内核可执行文件和配置文件。 |
/dev | 此目录包含连接到系统的每个硬件设备的设备文件。这些不是设备驱动程序,而是表示计算机上每个设备并方便访问这些设备的文件。 |
/etc | 包含主机计算机的本地系统配置文件。 |
/home | 用户文件的主目录存储。每个用户在 /home 中都有一个子目录。 |
/lib | 包含启动系统所需的共享库文件。 |
/media | 用于挂载外部可移动媒体设备(如可能连接到主机的 USB 拇指驱动器)的位置。 |
/mnt | 用于常规文件系统(即非可移动媒体)的临时挂载点,管理员可以在修复或处理文件系统时使用。 |
/opt | 可选文件,如供应商提供的应用程序程序应位于此处。 |
/root | 这不是根 (/) 文件系统。它是 root 用户的主目录。 |
/sbin | 系统二进制文件。这些是用于系统管理的可执行文件。 |
/tmp | 临时目录。操作系统和许多程序使用它来存储临时文件。用户也可以在此处临时存储文件。请注意,存储在此处的文件可能随时删除,恕不另行通知。 |
/usr | 这些是可共享的只读文件,包括可执行二进制文件和库、man 文件以及其他类型的文档。 |
/var | 可变数据文件存储在此处。这可以包括日志文件、MySQL 和其他数据库文件、Web 服务器数据文件、电子邮件收件箱等等。 |
表 1 中显示的目录及其子目录,以及具有青色背景的子目录,被认为是根文件系统的组成部分。也就是说,它们不能创建为单独的文件系统并在启动时挂载。这是因为它们(特别是它们的内容)必须在启动时存在,以便系统正常启动。
/media 和 /mnt 目录是根文件系统的一部分,但它们绝不应包含任何数据。相反,它们只是临时挂载点。
其余目录,即表 1 中没有背景颜色的目录,在启动序列期间不需要存在,但会在稍后启动,在启动序列期间准备主机以执行有用的工作。
请务必参考官方Linux 文件系统层次标准 (FHS) 网页,了解有关这些目录及其众多子目录的详细信息。维基百科也对 FHS 进行了很好的描述。应尽可能严格地遵守此标准,以确保操作和功能的一致性。无论主机上使用的文件系统类型如何,这种分层目录结构都是相同的。
Linux 统一目录结构
在某些非 Linux PC 操作系统中,如果有多个物理硬盘驱动器或多个分区,则每个磁盘或分区都分配一个驱动器盘符。有必要知道文件或程序位于哪个硬盘驱动器上,例如 C: 或 D:。然后,您发出驱动器盘符作为命令,例如 D:,以更改为 D: 驱动器,然后使用 cd 命令更改为正确的目录以找到所需的文件。每个硬盘驱动器都有自己单独且完整的目录树。
Linux 文件系统将所有物理硬盘驱动器和分区统一到一个目录结构中。这一切都从顶部开始——根 (/) 目录。所有其他目录及其子目录都位于单个 Linux 根目录下。这意味着只有一个目录树可用于搜索文件和程序。
这之所以可行,仅仅是因为文件系统(如 /home、/tmp、/var、/opt 或 /usr)可以在单独的物理硬盘驱动器、不同的分区或与 /(根)文件系统不同的逻辑卷上创建,然后作为根文件系统树的一部分挂载到挂载点(目录)上。即使是可移动驱动器(如 USB 拇指驱动器或外部 USB 或 ESATA 硬盘驱动器)也将挂载到根文件系统上,并成为该目录树的组成部分。
这样做的一个很好的理由在从一个版本的 Linux 发行版升级到另一个版本,或从一个发行版更改为另一个发行版时显而易见。一般来说,除了 Fedora 中的 dnf-upgrade 等任何升级实用程序之外,明智的做法是在升级期间偶尔重新格式化包含操作系统的硬盘驱动器,以积极地清除随着时间推移积累的任何垃圾。如果 /home 是根文件系统的一部分,它也将被重新格式化,然后必须从备份中恢复。通过将 /home 作为单独的文件系统,安装程序会将其识别为单独的文件系统,并且可以跳过格式化。这也适用于存储数据库、电子邮件收件箱、网站和其他可变用户和系统数据的 /var。
将 Linux 目录树的某些部分维护为单独的文件系统还有其他原因。例如,很久以前,当我还没有意识到将所有必需的 Linux 目录作为 /(根)文件系统的一部分可能存在潜在问题时,我设法用大量非常大的文件填满了我的主目录。由于 /home 目录和 /tmp 目录都不是单独的文件系统,而只是根文件系统的子目录,因此整个根文件系统都已填满。操作系统没有剩余空间来创建临时文件或扩展现有数据文件。起初,应用程序程序开始抱怨没有空间保存文件,然后操作系统本身开始表现得非常奇怪。启动到单用户模式并清除我的主目录中的违规文件使我能够再次启动。然后,我使用相当标准的 多文件系统设置重新安装了 Linux,并且能够防止再次发生完全系统崩溃。
我曾经遇到过一种情况,Linux 主机继续运行,但阻止用户使用 GUI 桌面登录。我能够使用命令行界面 (CLI) 在本地使用虚拟控制台之一登录,并使用 SSH 远程登录。问题是 /tmp 文件系统已满,并且 GUI 桌面所需的某些临时文件在登录时无法创建。由于 CLI 登录不需要在 /tmp 中创建文件,因此那里的空间不足并没有阻止我使用 CLI 登录。在这种情况下,/tmp 目录是一个单独的文件系统,并且 /tmp 逻辑卷所属的卷组中有足够的可用空间。我只是扩展了 /tmp 逻辑卷,使其大小足以容纳我对该主机上临时文件空间量的新理解,问题就解决了。请注意,此解决方案不需要重新启动,并且一旦 /tmp 文件系统扩大,用户就可以登录到桌面。
另一种情况发生在我作为一家大型科技公司的实验室管理员工作期间。我们的一位开发人员将应用程序安装在错误的位置 (/var)。该应用程序崩溃了,因为 /var 文件系统已满,并且由于空间不足,无法将日志文件(存储在该文件系统上的 /var/log 中)附加新消息。但是,系统保持运行,因为关键的 /(根)和 /tmp 文件系统没有填满。删除违规应用程序并将其重新安装到 /opt 文件系统解决了该问题。
文件系统类型
Linux 支持读取大约 100 种分区类型;它只能创建和写入其中的少数几种。但可以将不同类型的文件系统挂载到同一个根文件系统上——这是可能且非常常见的。在此上下文中,我们谈论的文件系统是指存储和管理硬盘驱动器或逻辑卷分区上的用户数据所需的结构和元数据。此处提供了 Linux fdisk 命令识别的文件系统分区类型的完整列表,以便您可以了解 Linux 与多种系统的高度兼容性。
0 Empty 24 NEC DOS 81 Minix / old Lin bf Solaris
1 FAT12 27 Hidden NTFS Win 82 Linux swap / So c1 DRDOS/sec (FAT-
2 XENIX root 39 Plan 9 83 Linux c4 DRDOS/sec (FAT-
3 XENIX usr 3c PartitionMagic 84 OS/2 hidden or c6 DRDOS/sec (FAT-
4 FAT16 <32M 40 Venix 80286 85 Linux extended c7 Syrinx
5 Extended 41 PPC PReP Boot 86 NTFS volume set da Non-FS data
6 FAT16 42 SFS 87 NTFS volume set db CP/M / CTOS / .
7 HPFS/NTFS/exFAT 4d QNX4.x 88 Linux plaintext de Dell Utility
8 AIX 4e QNX4.x 2nd part 8e Linux LVM df BootIt
9 AIX bootable 4f QNX4.x 3rd part 93 Amoeba e1 DOS access
a OS/2 Boot Manag 50 OnTrack DM 94 Amoeba BBT e3 DOS R/O
b W95 FAT32 51 OnTrack DM6 Aux 9f BSD/OS e4 SpeedStor
c W95 FAT32 (LBA) 52 CP/M a0 IBM Thinkpad hi ea Rufus alignment
e W95 FAT16 (LBA) 53 OnTrack DM6 Aux a5 FreeBSD eb BeOS fs
f W95 Ext'd (LBA) 54 OnTrackDM6 a6 OpenBSD ee GPT
10 OPUS 55 EZ-Drive a7 NeXTSTEP ef EFI (FAT-12/16/
11 Hidden FAT12 56 Golden Bow a8 Darwin UFS f0 Linux/PA-RISC b
12 Compaq diagnost 5c Priam Edisk a9 NetBSD f1 SpeedStor
14 Hidden FAT16 <3 61 SpeedStor ab Darwin boot f4 SpeedStor
16 Hidden FAT16 63 GNU HURD or Sys af HFS / HFS+ f2 DOS secondary
17 Hidden HPFS/NTF 64 Novell Netware b7 BSDI fs fb VMware VMFS
18 AST SmartSleep 65 Novell Netware b8 BSDI swap fc VMware VMKCORE
1b Hidden W95 FAT3 70 DiskSecure Mult bb Boot Wizard hid fd Linux raid auto
1c Hidden W95 FAT3 75 PC/IX bc Acronis FAT32 L fe LANstep
1e Hidden W95 FAT1 80 Old Minix be Solaris boot ff BBT
支持读取如此多种分区类型的主要目的是允许与其他计算机系统的文件系统兼容并至少实现一定的互操作性。使用 Fedora 创建新文件系统时可用的选项显示在以下列表中。
- btrfs
- cramfs
- ext2
- ext3
- ext4
- fat
- gfs2
- hfsplus
- minix
- msdos
- ntfs
- reiserfs
- vfat
- xfs
其他发行版支持创建不同的文件系统类型。例如,CentOS 6 仅支持创建以上列表中以粗体突出显示的文件系统。
挂载
Linux 中术语“挂载”文件系统可以追溯到计算机的早期,那时磁带或可移动磁盘组需要物理挂载到适当的驱动器设备上。物理放置在驱动器上后,磁盘组上的文件系统将由操作系统逻辑挂载,以使操作系统、应用程序程序和用户可以访问其内容。
挂载点只是一个目录,与任何其他目录一样,它是作为根文件系统的一部分创建的。因此,例如,主文件系统挂载在目录 /home 上。文件系统可以挂载在其他非根文件系统上的挂载点上,但这不太常见。
Linux 根文件系统在启动序列的早期挂载在根目录 (/) 上。其他文件系统稍后由 Linux 启动程序挂载,在 SystemV 下为 rc,或者在较新的 Linux 版本中为 systemd。启动过程中文件系统的挂载由 /etc/fstab 配置文件管理。记住它的一个简单方法是 fstab 代表“文件系统表”,它是一个要挂载的文件系统列表、它们指定的挂载点以及特定文件系统可能需要的任何选项。
文件系统使用 mount 命令挂载到现有目录/挂载点上。一般来说,用作挂载点的任何目录都应该是空的,并且不包含任何其他文件。Linux 不会阻止用户将一个文件系统挂载在已存在的文件系统之上,或挂载在包含文件的目录之上。如果将文件系统挂载在现有目录或文件系统上,则原始内容将被隐藏,并且仅显示新挂载的文件系统的内容。
结论
我希望本文能够消除一些围绕术语文件系统的可能混淆。我花了很长时间,并且有一位非常有帮助的导师,才真正理解和欣赏 Linux 文件系统在其所有含义中的复杂性、优雅性和功能。
如果您有任何问题,请将其添加到下面的评论中,我会尽力回答。
下个月
另一个重要的概念是,对于 Linux 来说,一切皆文件。这个概念对于用户和系统管理员来说有一些有趣且重要的实际应用。我之所以提到这一点,是因为您可能想在阅读我计划在下个月发布的关于 /dev 目录的文章之前,阅读我的“一切皆文件”文章。
11 条评论