探索 Linux 内核:Kconfig/kbuild 的秘密

深入了解 Linux 配置/构建系统的工作原理。
199 位读者喜欢这篇文章。
a compass on top of a map

Nietjuh 通过 Pixabay, CC0

Linux 内核配置/构建系统,也称为 Kconfig/kbuild,已经存在很长时间了,自从 Linux 内核代码迁移到 Git 以来就有了。然而,作为支持基础设施,它很少受到关注;即使是每天使用它的内核开发人员也从未真正考虑过它。

为了探索 Linux 内核是如何编译的,本文将深入研究 Kconfig/kbuild 的内部流程,解释 .config 文件和 vmlinux/bzImage 文件是如何生成的,并介绍一个用于依赖跟踪的巧妙技巧。

Kconfig

构建内核的第一步始终是配置。Kconfig 帮助使 Linux 内核高度模块化和可定制。Kconfig 为用户提供了许多配置目标

config 使用面向行的程序更新当前配置
nconfig 使用基于 ncurses 菜单的程序更新当前配置
menuconfig 使用基于菜单的程序更新当前配置
xconfig 使用基于 Qt 的前端更新当前配置
gconfig 使用基于 GTK+ 的前端更新当前配置
oldconfig 使用提供的 .config 作为基础更新当前配置
localmodconfig 更新当前配置,禁用未加载的模块
localyesconfig 更新当前配置,将本地模块转换为核心
defconfig 使用 Arch 提供的 defconfig 中的默认值创建新配置
savedefconfig 将当前配置保存为 ./defconfig(最小配置)
allnoconfig 所有选项都回答“否”的新配置
allyesconfig 所有选项都回答“是”的新配置
allmodconfig 尽可能选择模块的新配置
alldefconfig 所有符号都设置为默认值的新配置
randconfig 所有选项都随机回答的新配置
listnewconfig 列出新选项
olddefconfig 与 oldconfig 相同,但将新符号设置为其默认值而不提示
kvmconfig 为 KVM 客户机内核支持启用其他选项
xenconfig 为 xen dom0 和客户机内核支持启用其他选项
tinyconfig 配置尽可能小的内核

我认为 menuconfig 是这些目标中最受欢迎的。这些目标由不同的主机程序处理,这些主机程序由内核提供并在内核构建期间构建。一些目标具有 GUI(为了用户的方便),而大多数则没有。与 Kconfig 相关的工具和源代码主要位于内核源代码的 scripts/kconfig/ 下。正如我们从 scripts/kconfig/Makefile 中看到的,有几个主机程序,包括 confmconfnconf。除了 conf 之外,它们中的每一个都负责一个基于 GUI 的配置目标,因此,conf 处理它们中的大多数。

从逻辑上讲,Kconfig 的基础设施有两个部分:一部分实现了一种 新语言 来定义配置项(参见内核源代码下的 Kconfig 文件),另一部分解析 Kconfig 语言并处理配置操作。

大多数配置目标都具有大致相同的内部流程(如下所示)

Kconfig process

请注意,所有配置项都有默认值。

第一步读取源根目录下的 Kconfig 文件以构建初始配置数据库;然后,它根据以下优先级读取现有配置文件来更新初始数据库

.config

/lib/modules/$(shell,uname -r)/.config

/etc/kernel-config

/boot/config-$(shell,uname -r)

ARCH_DEFCONFIG

arch/$(ARCH)/defconfig

如果您通过 menuconfig 进行基于 GUI 的配置,或通过 oldconfig 进行基于命令行的配置,则数据库会根据您的自定义进行更新。最后,配置数据库被转储到 .config 文件中。

但是 .config 文件不是内核构建的最终素材;这就是 syncconfig 目标存在的原因。syncconfig 曾经是一个名为 silentoldconfig 的配置目标,但它没有做旧名称所说的,所以它被重命名了。此外,由于它是供内部使用(而不是供用户使用),因此它已从列表中删除。

以下是 syncconfig 功能的说明

Syncconfig

syncconfig 以 .config 为输入,并输出许多其他文件,这些文件分为三类

  • auto.conf & tristate.conf 用于 makefile 文本处理。例如,您可能会在组件的 makefile 中看到这样的语句: 
    obj-$(CONFIG_GENERIC_CALIBRATE_DELAY) += calibrate.o
  • autoconf.h 用于 C 语言源文件中。
  • include/config/ 下的空头文件用于 kbuild 期间的配置依赖项跟踪,这将在下面解释。

配置完成后,我们将知道哪些文件和代码片段未被编译。

kbuild

组件式构建,称为递归 make,是 GNU make 管理大型项目的常用方法。Kbuild 是递归 make 的一个很好的例子。通过将源文件划分为不同的模块/组件,每个组件都由其自己的 makefile 管理。当您开始构建时,顶层 makefile 以正确的顺序调用每个组件的 makefile,构建组件,并将它们收集到最终可执行文件中。

Kbuild 指的是不同类型的 makefile

  • Makefile 是位于源根目录中的顶层 makefile。
  • .config 是内核配置文件。
  • arch/$(ARCH)/Makefile 是 arch makefile,它是顶层 makefile 的补充。
  • scripts/Makefile.* 描述了所有 kbuild makefile 的通用规则。
  • 最后,大约有 500 个 kbuild makefile

顶层 makefile 包含 arch makefile,读取 .config 文件,进入子目录,借助 scripts/Makefile.* 中定义的例程在每个组件的 makefile 上调用 make,构建每个中间对象,并将所有中间对象链接到 vmlinux 中。内核文档 Documentation/kbuild/makefiles.txt 描述了这些 makefile 的所有方面。

作为一个例子,让我们看看 vmlinux 是如何在 x86-64 上生成的

vmlinux overview

所有进入 vmlinux 的 .o 文件首先进入它们自己的 built-in.a,这通过变量 KBUILD_VMLINUX_INITKBUILD_VMLINUX_MAINKBUILD_VMLINUX_LIBS 指示,然后被收集到 vmlinux 文件中。

让我们看看递归 make 是如何在 Linux 内核中实现的,借助简化的 makefile 代码

# In top Makefile
vmlinux: scripts/link-vmlinux.sh $(vmlinux-deps)
		+$(call if_changed,link-vmlinux)

# Variable assignments
vmlinux-deps := $(KBUILD_LDS) $(KBUILD_VMLINUX_INIT) $(KBUILD_VMLINUX_MAIN) $(KBUILD_VMLINUX_LIBS)

export KBUILD_VMLINUX_INIT := $(head-y) $(init-y)
export KBUILD_VMLINUX_MAIN := $(core-y) $(libs-y2) $(drivers-y) $(net-y) $(virt-y)
export KBUILD_VMLINUX_LIBS := $(libs-y1)
export KBUILD_LDS          := arch/$(SRCARCH)/kernel/vmlinux.lds

init-y          := init/
drivers-y       := drivers/ sound/ firmware/
net-y           := net/
libs-y          := lib/
core-y          := usr/
virt-y          := virt/

# Transform to corresponding built-in.a
init-y          := $(patsubst %/, %/built-in.a, $(init-y))
core-y          := $(patsubst %/, %/built-in.a, $(core-y))
drivers-y       := $(patsubst %/, %/built-in.a, $(drivers-y))
net-y           := $(patsubst %/, %/built-in.a, $(net-y))
libs-y1         := $(patsubst %/, %/lib.a, $(libs-y))
libs-y2         := $(patsubst %/, %/built-in.a, $(filter-out %.a, $(libs-y)))
virt-y          := $(patsubst %/, %/built-in.a, $(virt-y))

# Setup the dependency. vmlinux-deps are all intermediate objects, vmlinux-dirs
# are phony targets, so every time comes to this rule, the recipe of vmlinux-dirs
# will be executed. Refer "4.6 Phony Targets" of `info make`
$(sort $(vmlinux-deps)): $(vmlinux-dirs) ;

# Variable vmlinux-dirs is the directory part of each built-in.a
vmlinux-dirs    := $(patsubst %/,%,$(filter %/, $(init-y) $(init-m) \
                     $(core-y) $(core-m) $(drivers-y) $(drivers-m) \
                     $(net-y) $(net-m) $(libs-y) $(libs-m) $(virt-y)))

# The entry of recursive make
$(vmlinux-dirs):
		$(Q)$(MAKE) $(build)=$@ need-builtin=1

递归 make 配方被展开,例如

make -f scripts/Makefile.build obj=init need-builtin=1

这意味着 make 将进入 scripts/Makefile.build 以继续构建每个 built-in.a 的工作。借助 scripts/link-vmlinux.sh,vmlinux 文件最终位于源根目录下。

理解 vmlinux 与 bzImage

许多 Linux 内核开发人员可能不清楚 vmlinux 和 bzImage 之间的关系。例如,这是它们在 x86-64 中的关系

vmlinux vs. bzImage

源根目录 vmlinux 被剥离、压缩、放入 piggy.S,然后与其他对等对象链接到 arch/x86/boot/compressed/vmlinux 中。同时,一个名为 setup.bin 的文件在 arch/x86/boot 下生成。根据 CONFIG_X86_NEED_RELOCS 的配置,可能存在可选的第三个文件,其中包含重定位信息。

一个名为 build 的主机程序,由内核提供,将这两个(或三个)部分构建到最终的 bzImage 文件中。

依赖跟踪

Kbuild 跟踪三种依赖项

  1. 所有先决条件文件(*.c 和 *.h
  2. 所有先决条件文件中使用的 CONFIG_ 选项
  3. 用于编译目标的命令行依赖项

第一个很容易理解,但是第二个和第三个呢?内核开发人员经常看到这样的代码片段

#ifdef CONFIG_SMP
__boot_cpu_id = cpu;
#endif

CONFIG_SMP 更改时,此代码片段应重新编译。编译源文件的命令行也很重要,因为不同的命令行可能会导致不同的目标文件。

.c 文件通过 #include 指令使用头文件时,您需要编写如下规则

main.o: defs.h
	recipe...

当管理大型项目时,您需要很多这样的规则;全部编写它们将是乏味且无聊的。幸运的是,大多数现代 C 编译器都可以通过查看源文件中的 #include 行为您编写这些规则。对于 GNU 编译器集合 (GCC),只需添加一个命令行参数:-MD depfile

# In scripts/Makefile.lib
c_flags        = -Wp,-MD,$(depfile) $(NOSTDINC_FLAGS) $(LINUXINCLUDE)     \
                 -include $(srctree)/include/linux/compiler_types.h       \
                 $(__c_flags) $(modkern_cflags)                           \
                 $(basename_flags) $(modname_flags)

这将生成一个 .d 文件,内容如下

init_task.o: init/init_task.c include/linux/kconfig.h \
 include/generated/autoconf.h include/linux/init_task.h \
 include/linux/rcupdate.h include/linux/types.h \
 ...

然后,主机程序 fixdep 通过将 depfile 和命令行作为输入来处理其他两个依赖项,然后以 makefile 语法输出一个 .<target>.cmd 文件,该文件记录目标的命令行和所有先决条件(包括配置)。它看起来像这样

# The command line used to compile the target
cmd_init/init_task.o := gcc -Wp,-MD,init/.init_task.o.d  -nostdinc ...
...
# The dependency files
deps_init/init_task.o := \
$(wildcard include/config/posix/timers.h) \
$(wildcard include/config/arch/task/struct/on/stack.h) \
$(wildcard include/config/thread/info/in/task.h) \
...
  include/uapi/linux/types.h \
  arch/x86/include/uapi/asm/types.h \
  include/uapi/asm-generic/types.h \
  ...

.<target>.cmd 文件将在递归 make 期间包含,提供所有依赖项信息,并帮助决定是否重建目标。

这背后的秘密是 fixdep 将解析 depfile.d 文件),然后解析内部的所有依赖项文件,在文本中搜索所有 CONFIG_ 字符串,将它们转换为相应的空头文件,并将它们添加到目标的先决条件中。每次配置更改时,相应的空头文件也会更新,因此 kbuild 可以检测到该更改并重建依赖于它的目标。由于命令行也被记录下来,因此很容易比较上次和当前的编译参数。

展望未来

Kconfig/kbuild 在很长一段时间内保持不变,直到新的维护者 Masahiro Yamada 在 2017 年初加入,现在 kbuild 又重新进入活跃开发阶段。如果您很快看到与本文内容不同的东西,请不要感到惊讶。

标签
User profile image.
开源项目贡献者,对底层事物有浓厚的兴趣。

评论已关闭。

© . All rights reserved.