模块扩展

借助模块扩展程序,用户可以通过以下方式扩展模块系统:从依赖关系图中的模块读取输入数据 ,执行必要的逻辑来解析 依赖项,最后通过调用代码库规则来创建代码库。这些扩展程序 的功能与代码库规则类似,因此能够执行文件 I/O、 发送网络请求等操作。除此之外,它们还允许 Bazel 与其他软件包管理系统进行交互,同时遵守由 Bazel 模块构建的依赖关系图。

您可以像代码库规则一样在 .bzl 文件中定义模块扩展程序。它们不会被直接调用;相反,每个模块都会指定一些称为标记的数据,供扩展程序读取。Bazel 会先运行模块解析,然后再评估任何 扩展程序。扩展程序会读取整个 依赖关系图。

扩展程序使用方式

扩展程序托管在 Bazel 模块本身中。如需在 模块中使用扩展程序,请先在托管扩展程序的模块上添加 bazel_dep,然后 调用 use_extension 内置函数 将其纳入作用域。请看以下示例,这是 MODULE.bazel文件中的代码段,用于使用“maven”扩展程序,该扩展程序在 rules_jvm_external 模块中定义:

bazel_dep(name = "rules_jvm_external", version = "4.5")
maven = use_extension("@rules_jvm_external//:extensions.bzl", "maven")

这会将 use_extension 的返回值绑定到变量,从而允许 用户使用点语法为扩展程序指定标记。标记必须遵循 扩展程序定义中指定的相应 标记类的架构 。以下示例指定了一些 maven.installmaven.artifact 标记:

maven.install(artifacts = ["org.junit:junit:4.13.2"])
maven.artifact(group = "com.google.guava",
               artifact = "guava",
               version = "27.0-jre",
               exclusions = ["com.google.j2objc:j2objc-annotations"])

使用 use_repo 指令将扩展程序生成的代码库 纳入当前模块的作用域。

use_repo(maven, "maven")

扩展程序生成的代码库是其 API 的一部分。在此示例中, “maven”模块扩展程序承诺生成一个名为 maven 的代码库。通过上述 声明,扩展程序可以正确解析标签(例如 @maven//:org_junit_junit),以指向“maven” 扩展程序生成的代码库。

扩展程序定义

您可以使用 module_extension函数定义模块扩展程序,这与定义代码库规则类似。不过, 代码库规则有许多属性,而模块扩展程序有 tag_classes,每个 都有许多属性。标记类定义了此扩展程序使用的标记的架构。例如,上面的“maven”扩展程序可以定义如下:

# @rules_jvm_external//:extensions.bzl

_install = tag_class(attrs = {"artifacts": attr.string_list(), ...})
_artifact = tag_class(attrs = {"group": attr.string(), "artifact": attr.string(), ...})
maven = module_extension(
  implementation = _maven_impl,
  tag_classes = {"install": _install, "artifact": _artifact},
)

这些声明表明,可以使用指定的属性架构指定 maven.installmaven.artifact 标记。

模块扩展程序的实现函数与代码库 规则的实现函数类似,不同之处在于,它们会获得一个 module_ctx 对象, 该对象授予对使用该扩展程序的所有模块和所有相关标记的访问权限。 然后,实现函数会调用代码库规则来生成代码库。

# @rules_jvm_external//:extensions.bzl

load("@bazel_tools//tools/build_defs/repo:http.bzl", "http_file")  # a repo rule
def _maven_impl(ctx):
  # This is a fake implementation for demonstration purposes only

  # collect artifacts from across the dependency graph
  artifacts = []
  for mod in ctx.modules:
    for install in mod.tags.install:
      artifacts += install.artifacts
    artifacts += [_to_artifact(artifact) for artifact in mod.tags.artifact]

  # call out to the coursier CLI tool to resolve dependencies
  output = ctx.execute(["coursier", "resolve", artifacts])
  repo_attrs = _process_coursier_output(output)

  # call repo rules to generate repos
  for attrs in repo_attrs:
    http_file(**attrs)
  _generate_hub_repo(name = "maven", repo_attrs)

扩展程序身份

模块扩展程序由名称和 .bzl 文件标识,该文件显示 在对 use_extension 的调用中。在以下示例中,扩展程序 maven.bzl 文件 @rules_jvm_external//:extension.bzl 和 名称 maven 标识:

maven = use_extension("@rules_jvm_external//:extensions.bzl", "maven")

从不同的 .bzl 文件重新导出扩展程序会为其赋予新的身份 如果扩展程序的两个版本都在传递模块图中被使用, 那么它们将被单独评估,并且只会看到与该特定身份关联的标记。

作为扩展程序作者,您应确保用户只会从一个 .bzl 文件中使用您的 模块扩展程序。

代码库名称和可见性

扩展程序生成的代码库的规范名称采用 module_repo_canonical_name~extension_name~repo_name 的形式。对于托管在 根模块中的扩展程序,module_repo_canonical_name 部分将 替换为字符串_main。请注意,规范名称格式不是您应依赖的 API,它可能会随时发生变化。

此命名政策意味着每个扩展程序都有自己的“代码库命名空间”;两个 不同的扩展程序可以各自定义一个同名的代码库,而不会有任何冲突风险。这也意味着 repository_ctx.name 会报告代码库的规范名称 ,该名称与代码库规则 调用中指定的名称不同

考虑到模块扩展程序生成的代码库,有 以下几条代码库可见性规则:

  • Bazel 模块代码库可以通过其 MODULE.bazel 文件 通过 bazel_depuse_repo 查看其引入的所有代码库。
  • 模块扩展程序生成的代码库可以查看托管该扩展程序的模块可见的所有代码库,以及同一模块扩展程序生成的所有其他代码库(使用代码库规则调用中指定的名称作为 其显示名称)。
    • 这可能会导致冲突。如果模块代码库可以看到 显示名称为 foo 的代码库,并且扩展程序生成了一个 指定名称为 foo 的代码库,那么对于该扩展程序生成的所有代码库, foo 都指的是前者。

最佳实践

本部分介绍了编写扩展程序时的最佳实践,以便它们 易于使用、易于维护,并且能够很好地适应随时间发生的变化。

将每个扩展程序放在单独的文件中

当扩展程序位于不同的文件中时,一个扩展程序可以加载 另一个扩展程序生成的代码库。即使您不使用此 功能,最好也将它们放在单独的文件中,以防日后需要使用 。这是因为扩展程序的身份基于其文件,因此稍后将 扩展程序移到另一个文件会更改您的公共 API,并且对您的用户来说是向后 不兼容的更改。

指定操作系统和架构

如果您的扩展程序依赖于操作系统或其架构类型, 请务必使用 os_dependentarch_dependent 布尔值属性在扩展程序定义中指明这一点。这可确保 Bazel 识别出需要重新评估(如果其中任何一个发生更改)。

只有根模块应直接影响代码库名称

请注意,当扩展程序创建代码库时,它们是在 扩展程序的命名空间内创建的。这意味着,如果不同的 模块使用相同的扩展程序并最终创建了同名的 代码库,则可能会发生冲突。这通常表现为模块扩展程序的 tag_class 具有一个 name 实参,该实参作为代码库规则的 name 值传递。

例如,假设根模块 A 依赖于模块 B。这两个模块都 依赖于模块 mylang。如果 AB 都调用 mylang.toolchain(name="foo"),那么它们都会尝试在 mylang 模块中创建一个名为 foo 的代码库,并且会发生错误。

为避免这种情况,您可以移除直接设置代码库名称的功能, 或者仅允许根模块执行此操作。允许根模块执行此 操作是没问题的,因为没有任何内容会依赖于它,因此它不必担心 另一个模块创建冲突的名称。