빌드 이벤트 프로토콜 예시

문제 신고 소스 보기

빌드 이벤트 프로토콜의 전체 사양은 프로토콜 버퍼 정의에서 확인할 수 있습니다. 하지만 사양을 살펴보기 전에 직관을 쌓으면 도움이 될 수 있습니다.

예를 들어 foo.shfoo_test.sh라는 두 개의 빈 셸 스크립트와 다음 BUILD 파일로 구성된 간단한 Bazel 작업공간이 있다고 가정해 보겠습니다.

sh_library(
    name = "foo_lib",
    srcs = ["foo.sh"],
)

sh_test(
    name = "foo_test",
    srcs = ["foo_test.sh"],
    deps = [":foo_lib"],
)

이 프로젝트에서 bazel test ...를 실행하면 생성된 빌드 이벤트의 빌드 그래프가 아래 그래프와 유사합니다. 화살표는 앞서 언급한 상위 및 하위 관계를 나타냅니다. 간결성을 위해 일부 빌드 이벤트와 대부분의 필드는 생략했습니다.

BEP-그래프

그림 1. BEP 그래프

처음에는 BuildStarted 이벤트가 게시됩니다. 이 이벤트는 빌드가 bazel test 명령어를 통해 호출되었음을 알리고 하위 이벤트를 알립니다.

  • OptionsParsed
  • WorkspaceStatus
  • CommandLine
  • UnstructuredCommandLine
  • BuildMetadata
  • BuildFinished
  • PatternExpanded
  • Progress

처음 세 개의 이벤트는 Bazel이 호출된 방법에 관한 정보를 제공합니다.

PatternExpanded 빌드 이벤트는 ... 패턴이 //foo:foo_lib//foo:foo_test로 확장된 특정 타겟에 관한 통계를 제공합니다. 이렇게 하려면 TargetConfigured 이벤트 두 개를 하위 요소로 선언합니다. TargetConfigured 이벤트는 ConfigurationTargetConfigured 이벤트 전에 게시되었더라도 Configuration 이벤트를 하위 이벤트로 선언합니다.

상위 및 하위 관계 외에도 이벤트는 빌드 이벤트 식별자를 사용하여 서로를 참조할 수도 있습니다. 예를 들어 위 그래프에서 TargetComplete 이벤트는 fileSets 필드의 NamedSetOfFiles 이벤트를 참조합니다.

파일을 참조하는 빌드 이벤트는 일반적으로 이벤트에 파일 이름과 경로를 삽입하지 않습니다. 대신 NamedSetOfFiles 이벤트의 빌드 이벤트 식별자를 포함하며, 이 식별자에는 실제 파일 이름과 경로가 포함됩니다. NamedSetOfFiles 이벤트를 사용하면 파일 집합을 한 번 보고하고 여러 타겟에서 참조할 수 있습니다. 이 구조가 필요합니다. 그러지 않으면 빌드 이벤트 프로토콜 출력 크기가 파일 수에 따라 2배로 늘어나기 때문입니다. NamedSetOfFiles 이벤트에 일부 파일이 삽입되지 않을 수도 있지만 대신 빌드 이벤트 식별자를 통해 다른 NamedSetOfFiles 이벤트를 참조할 수 있습니다.

아래는 위 그래프의 //foo:foo_lib 타겟에 관한 TargetComplete 이벤트 인스턴스로, 프로토콜 버퍼의 JSON 표현으로 출력됩니다. 빌드 이벤트 식별자는 타겟을 불투명 문자열로 포함하며 빌드 이벤트 식별자를 사용하여 Configuration 이벤트를 참조합니다. 이벤트는 어떠한 하위 이벤트도 발표하지 않습니다. 페이로드에는 대상이 성공적으로 빌드되었는지 여부, 출력 파일 집합, 빌드된 대상 종류에 대한 정보가 포함됩니다.

{
  "id": {
    "targetCompleted": {
      "label": "//foo:foo_lib",
      "configuration": {
        "id": "544e39a7f0abdb3efdd29d675a48bc6a"
      }
    }
  },
  "completed": {
    "success": true,
    "outputGroup": [{
      "name": "default",
      "fileSets": [{
        "id": "0"
      }]
    }],
    "targetKind": "sh_library rule"
  }
}

BEP의 관점 결과

일반 빌드는 (target, configuration) 쌍과 연결된 작업을 평가합니다. 가로세로를 사용 설정한 상태로 빌드할 때 Bazel은 사용 설정된 특정 측면의 영향을 받는 각 대상에 대해 (target, configuration, aspect) 삼중과 연결된 대상을 추가로 평가합니다.

관점별 이벤트 유형이 없어도 BEP에서 관점에 대한 평가 결과를 확인할 수 있습니다. 적용 가능한 측면이 있는 각 (target, configuration) 쌍에 대해 Bazel은 해당 측면을 대상에 적용한 결과가 포함된 TargetConfiguredTargetComplete 이벤트를 추가로 게시합니다. 예를 들어 //:foo_lib--aspects=aspects/myaspect.bzl%custom_aspect로 빌드된 경우 이 이벤트는 BEP에도 표시됩니다.

{
  "id": {
    "targetCompleted": {
      "label": "//foo:foo_lib",
      "configuration": {
        "id": "544e39a7f0abdb3efdd29d675a48bc6a"
      },
      "aspect": "aspects/myaspect.bzl%custom_aspect"
    }
  },
  "completed": {
    "success": true,
    "outputGroup": [{
      "name": "default",
      "fileSets": [{
        "id": "1"
      }]
    }]
  }
}

NamedSetOfFiles 사용 중

특정 타겟 (또는 관점)에서 생성되는 아티팩트를 결정하는 것은 약간의 준비로 효율적으로 실행할 수 있는 일반적인 BP 사용 사례입니다. 이 섹션에서는 Starlark Depset의 구조와 일치하는 NamedSetOfFiles 이벤트가 제공하는 재귀 공유 구조를 설명합니다.

소비자는 NamedSetOfFiles 이벤트를 처리할 때 이차 알고리즘을 피하도록 주의해야 합니다. 대규모 빌드에는 이러한 이벤트가 수만 개 포함되어 있을 수 있고 이차 복잡성을 갖는 순회 작업에 수억 개의 작업이 필요할 수 있기 때문입니다.

이름이 지정된 setoffiles-bep-graph

그림 2. NamedSetOfFiles BEP 그래프

NamedSetOfFiles 이벤트는 항상 BEP 스트림에서 이를 참조하는 TargetComplete 또는 NamedSetOfFiles 이벤트 앞에 표시됩니다. 이는 '상위-하위' 이벤트 관계의 역입니다. 여기서는 첫 번째 이벤트를 제외한 모든 이벤트가 이벤트를 알리는 하나 이상의 이벤트 후에 표시됩니다. NamedSetOfFiles 이벤트는 시맨틱이 없는 Progress 이벤트에 의해 발표됩니다.

이러한 정렬 및 공유 제약 조건을 감안할 때 일반적인 소비자는 BEP 스트림이 소진될 때까지 모든 NamedSetOfFiles 이벤트를 버퍼링해야 합니다. 다음 JSON 이벤트 스트림 및 Python 코드는 대상/가로세로 맵을 '기본' 출력 그룹의 빌드된 아티팩트로 채우는 방법과 빌드된 대상/가상의 하위 집합의 출력을 처리하는 방법을 보여줍니다.

named_sets = {}  # type: dict[str, NamedSetOfFiles]
outputs = {}     # type: dict[str, dict[str, set[str]]]

for event in stream:
  kind = event.id.WhichOneof("id")
  if kind == "named_set":
    named_sets[event.id.named_set.id] = event.named_set_of_files
  elif kind == "target_completed":
    tc = event.id.target_completed
    target_id = (tc.label, tc.configuration.id, tc.aspect)
    outputs[target_id] = {}
    for group in event.completed.output_group:
      outputs[target_id][group.name] = {fs.id for fs in group.file_sets}

for result_id in relevant_subset(outputs.keys()):
  visit = outputs[result_id].get("default", [])
  seen_sets = set(visit)
  while visit:
    set_name = visit.pop()
    s = named_sets[set_name]
    for f in s.files:
      process_file(result_id, f)
    for fs in s.file_sets:
      if fs.id not in seen_sets:
        visit.add(fs.id)
        seen_sets.add(fs.id)