영구 작업자 만들기

문제 신고하기 소스 보기

지속 작업자를 사용하면 빌드 속도를 높일 수 있습니다. 빌드에 시작 비용이 높거나 교차 작업 캐싱의 이점을 누릴 수 있는 반복 작업이 있는 경우 자체 영구 작업자를 구현하여 이러한 작업을 실행할 수 있습니다.

Bazel 서버는 stdin/stdout를 사용하여 작업자와 통신하며 프로토콜 버퍼나 JSON 문자열 사용을 지원합니다.

worker 구현은 다음 두 부분으로 구성됩니다.

작업자 생성

영구 작업자는 다음과 같은 몇 가지 요구사항을 충족합니다.

  • stdin에서 WorkRequests를 읽습니다.
  • 이 스크립트는 stdoutWorkResponses(WorkResponse만 있음)를 씁니다.
  • --persistent_worker 플래그를 허용합니다. 래퍼는 --persistent_worker 명령줄 플래그를 인식해야 하며 이 플래그가 전달되는 경우에만 자체적으로 지속되어야 합니다. 그러지 않으면 원샷 컴파일을 실행하고 종료해야 합니다.

프로그램이 이러한 요구사항을 충족하면 영구 작업자로 사용할 수 있습니다.

작업 요청

WorkRequest에는 작업자에 대한 인수 목록, 작업자가 액세스할 수 있는 입력을 나타내는 경로-다이제스트 쌍 목록(강제되지는 않지만 이 정보를 캐싱에 사용할 수 있음), 요청 ID(singleplex 작업자의 경우 0)가 포함됩니다.

참고: 프로토콜 버퍼 사양에서는 '스네이크 표기법' (request_id)을 사용하지만 JSON 프로토콜은 '카멜 표기법' (requestId)을 사용합니다. 이 문서는 JSON 예시에서 카멜 표기법을 사용하지만 프로토콜과 상관없이 필드에 대해 설명할 때는 스네이크 표기법을 사용합니다.

{
  "arguments" : ["--some_argument"],
  "inputs" : [
    { "path": "/path/to/my/file/1", "digest": "fdk3e2ml23d"},
    { "path": "/path/to/my/file/2", "digest": "1fwqd4qdd" }
 ],
  "requestId" : 12
}

선택사항인 verbosity 필드는 작업자에 추가 디버깅 출력을 요청하는 데 사용할 수 있습니다. 무엇을 어떻게 출력할지는 전적으로 작업자가 결정합니다. 값이 클수록 출력이 더 상세함을 나타냅니다. --worker_verbose 플래그를 Bazel에 전달하면 verbosity 필드가 10으로 설정되지만 출력의 양에 따라 더 작거나 큰 값을 수동으로 사용할 수 있습니다.

선택사항인 sandbox_dir 필드는 멀티플렉스 샌드박스를 지원하는 작업자만 사용합니다.

작업 응답

WorkResponse에는 요청 ID, 0 또는 0이 아닌 종료 코드, 요청을 처리하거나 실행할 때 발생하는 오류를 설명하는 출력 문자열이 포함됩니다. output 필드에는 간단한 설명이 포함됩니다. 전체 로그가 작업자의 stderr에 기록될 수 있습니다. 작업자는 WorkResponsesstdout에만 쓸 수 있으므로 작업자는 일반적으로 사용하는 도구의 stdoutstderr로 리디렉션합니다.

{
  "exitCode" : 1,
  "output" : "Action failed with the following message:\nCould not find input
    file \"/path/to/my/file/1\"",
  "requestId" : 12
}

protobuf의 표준에 따라 모든 필드는 선택사항입니다. 그러나 Bazel을 사용하려면 WorkRequest 및 해당 WorkResponse의 요청 ID가 동일해야 하므로 요청 ID가 0이 아닌 경우 지정해야 합니다. 유효한 WorkResponse입니다.

{
  "requestId" : 12,
}

request_id가 0이면 이 요청을 다른 요청과 동시에 처리할 수 없을 때 사용되는 'singleplex' 요청을 나타냅니다. 서버는 지정된 작업자가 request_id 0 또는 0보다 큰 request_id만 포함하는 요청을 수신하도록 보장합니다. Singleplex 요청은 순차적으로 전송됩니다. 예를 들어 서버가 응답을 받을 때까지 다른 요청을 전송하지 않는 경우입니다 (취소 요청은 예외 참고).

Notes

  • 각 프로토콜 버퍼는 varint 형식의 길이 앞에 옵니다 (MessageLite.writeDelimitedTo() 참고).
  • JSON 요청 및 응답 앞에는 크기 표시기가 표시되지 않습니다.
  • JSON 요청은 protobuf와 동일한 구조를 유지하지만 모든 필드 이름에는 표준 JSON을 사용하고 카멜 표기법을 사용합니다.
  • protobuf와 동일한 하위 및 향후 호환성 속성을 유지하려면 JSON 작업자가 이러한 메시지의 알 수 없는 필드를 허용하고 누락된 값에 protobuf 기본값을 사용해야 합니다.
  • Bazel은 요청을 protobuf로 저장하고 protobuf의 JSON 형식을 사용하여 JSON으로 변환합니다.

취소

작업자는 작업 요청이 완료되기 전에 취소되도록 선택적으로 허용할 수 있습니다. 이는 로컬 실행이 더 빠른 원격 실행으로 인해 정기적으로 중단될 수 있는 동적 실행과 관련하여 특히 유용합니다. 취소를 허용하려면 execution-requirements 필드 (아래 참고)에 supports-worker-cancellation: 1를 추가하고 --experimental_worker_cancellation 플래그를 설정합니다.

취소 요청cancel 필드가 설정된 WorkRequest입니다. 마찬가지로 취소 응답was_cancelled 필드가 설정된 WorkResponse입니다. 취소 요청 또는 취소 응답에 있어야 하는 다른 유일한 필드는 취소할 요청을 나타내는 request_id입니다. request_id 필드는 단일플렉스 작업자의 경우 0이고, 멀티플렉스 작업자의 경우 이전에 전송된 WorkRequest의 0이 아닌 request_id입니다. 서버는 작업자가 이미 응답한 요청에 대해 취소 요청을 보낼 수 있으며, 이 경우 취소 요청을 무시해야 합니다.

취소되지 않은 각 WorkRequest 메시지는 취소 여부와 관계없이 정확히 한 번만 응답해야 합니다. 서버가 취소 요청을 보내면 작업자는 request_id가 설정되고 was_cancelled 필드가 true로 설정된 WorkResponse로 응답할 수 있습니다. 일반 WorkResponse 전송도 허용되지만 outputexit_code 필드는 무시됩니다.

WorkRequest에 대한 응답이 전송되면 작업자는 작업 디렉터리의 파일을 터치해서는 안 됩니다. 서버에서 임시 파일을 포함하여 파일을 자유롭게 정리할 수 있습니다.

작업자를 사용하는 규칙 만들기

또한 작업자가 수행할 작업을 생성하는 규칙도 만들어야 합니다. 작업자를 사용하는 Starlark 규칙을 만드는 것은 다른 규칙을 만드는 것과 같습니다.

또한 규칙에는 작업자 자체에 대한 참조가 포함되어야 하며 규칙에서 생성되는 작업에는 몇 가지 요구사항이 있습니다.

worker 참조

작업자를 사용하는 규칙에는 작업자 자체를 참조하는 필드가 포함되어야 하므로 \*\_binary 규칙의 인스턴스를 만들어 작업자를 정의해야 합니다. 작업자가 MyWorker.Java라고 하는 경우 이는 연결된 규칙일 수 있습니다.

java_binary(
    name = "worker",
    srcs = ["MyWorker.Java"],
)

이렇게 하면 작업자 바이너리를 참조하는 '작업자' 라벨이 생성됩니다. 그런 다음 작업자를 사용하는 규칙을 정의합니다. 이 규칙은 작업자 바이너리를 참조하는 속성을 정의해야 합니다.

빌드한 작업자 바이너리가 빌드의 최상위 수준에 있는 'work'라는 패키지에 있는 경우 속성 정의는 다음과 같습니다.

"worker": attr.label(
    default = Label("//work:worker"),
    executable = True,
    cfg = "exec",
)

cfg = "exec"는 타겟 플랫폼이 아닌 실행 플랫폼에서 실행되도록 worker를 빌드해야 함을 나타냅니다. 즉, worker는 빌드 중에 도구로 사용됩니다.

업무 요구사항

작업자를 사용하는 규칙은 작업자가 수행할 작업을 만듭니다. 이러한 작업에는 몇 가지 요구사항이 있습니다.

  • "arguments" 필드 이 메서드는 문자열 목록을 가져옵니다. 문자열 목록 중 마지막을 제외한 나머지는 시작 시 작업자에 전달되는 인수입니다. '인수' 목록의 마지막 요소는 flag-file (@-preceded) 인수입니다. 작업자는 WorkRequest별로 지정된 플래그 파일에서 인수를 읽습니다. 규칙은 이 플래그 파일에 작업자의 시작이 아닌 인수를 쓸 수 있습니다.

  • "supports-workers" : "1", "supports-multiplex-workers" : "1" 또는 둘 다를 포함하는 사전을 가져오는 "execution-requirements" 필드

    '인수' 및 '실행 요구사항' 필드는 작업자에게 전송되는 모든 작업에 필요합니다. 또한 JSON 작업자가 실행해야 하는 작업은 실행 요구사항 필드에 "requires-worker-protocol" : "json"를 포함해야 합니다. "requires-worker-protocol" : "proto"도 유효한 실행 요구사항이지만 proto 작업자의 경우에는 기본값이므로 필수는 아닙니다.

    실행 요구사항에서 worker-key-mnemonic를 설정할 수도 있습니다. 여러 작업 유형에 실행 파일을 재사용하고 이 작업자로 작업을 구분하려는 경우 유용할 수 있습니다.

  • 작업 과정에서 생성된 임시 파일은 작업자 디렉터리에 저장해야 합니다. 그러면 샌드박스가 사용 설정됩니다.

위에서 설명한 'worker' 속성이 있는 규칙 정의에서 입력을 나타내는 'srcs' 속성, 출력을 나타내는 'output' 속성, 작업자 시작 인수를 나타내는 'args' 속성 외에도 ctx.actions.run에 대한 호출은 다음과 같을 수 있습니다.

ctx.actions.run(
  inputs=ctx.files.srcs,
  outputs=[ctx.outputs.output],
  executable=ctx.executable.worker,
  mnemonic="someMnemonic",
  execution_requirements={
    "supports-workers" : "1",
    "requires-worker-protocol" : "json"},
  arguments=ctx.attr.args + ["@flagfile"]
 )

다른 예는 영구 작업자 구현을 참조하세요.

Bazel 코드베이스는 통합 테스트에 사용되는 JSON 작업자 예시 외에도 자바 컴파일러 작업자를 사용합니다.

올바른 콜백을 전달하여 모든 Java 기반 도구를 작업자로 만들려면 스캐폴딩을 사용하면 됩니다.

작업자를 사용하는 규칙의 예는 Bazel의 작업자 통합 테스트를 참조하세요.

외부 참여자는 다양한 언어로 worker를 구현했습니다. Bazel 영구 작업자의 Polyglot 구현을 살펴보세요. GitHub에서 더 많은 예를 찾을 수 있습니다.