ผู้ปฏิบัติงานถาวร

Nightly · 9.0 · 8.5 · 8.4 · 8.3 · 8.2 · 7.7

หน้านี้จะอธิบายวิธีใช้ Worker แบบถาวร ประโยชน์ ข้อกำหนด และ วิธีที่ Worker ส่งผลต่อการแซนด์บ็อกซ์

Worker แบบถาวรคือกระบวนการที่ทำงานเป็นเวลานานซึ่งเซิร์ฟเวอร์ Bazel เริ่มต้น โดยจะทำหน้าที่เป็นWrapper รอบเครื่องมือจริง (โดยปกติคือคอมไพเลอร์) หรือเป็นเครื่องมือเอง หากต้องการใช้ประโยชน์จาก Worker แบบถาวร เครื่องมือต้อง รองรับการคอมไพล์ตามลำดับ และ Wrapper ต้องแปล ระหว่าง API ของเครื่องมือกับรูปแบบคำขอ/คำตอบที่อธิบายไว้ด้านล่าง Worker เดียวกันอาจเรียกใช้โดยมีและไม่มีแฟล็ก --persistent_worker ในบิลด์เดียวกัน และมีหน้าที่รับผิดชอบในการเริ่มต้นและพูดคุยกับเครื่องมืออย่างเหมาะสม รวมถึงปิด Worker เมื่อออก ระบบจะกำหนดไดเรกทอรีการทำงานแยกต่างหากภายใต้ <outputBase>/bazel-workers ให้กับอินสแตนซ์ของ Worker แต่ละรายการ (แต่ไม่ได้ chroot ไปยังไดเรกทอรีดังกล่าว)

การใช้ Worker แบบถาวรเป็นกลยุทธ์การดำเนินการที่ช่วยลดค่าใช้จ่ายในการเริ่มต้น ช่วยให้คอมไพล์ JIT ได้มากขึ้น และเปิดใช้การแคช เช่น Abstract Syntax Tree ในการดำเนินการ กลยุทธ์นี้ ช่วยให้การปรับปรุงเหล่านี้เกิดขึ้นได้โดยการส่งคำขอหลายรายการไปยังกระบวนการที่ทำงานเป็นเวลานาน

มีการใช้งาน Worker แบบถาวรสำหรับหลายภาษา ซึ่งรวมถึง Java Scala Kotlin และอื่นๆ

โปรแกรมที่ใช้รันไทม์ NodeJS สามารถใช้ไลบรารีตัวช่วย @bazel/worker เพื่อ ใช้โปรโตคอล Worker ได้

การใช้ Worker แบบถาวร

Bazel 0.27 ขึ้นไป ใช้ Worker แบบถาวรโดยค่าเริ่มต้นเมื่อเรียกใช้บิลด์ แม้ว่าการดำเนินการจากระยะไกล จะมีความสำคัญเหนือกว่า สำหรับดำเนินการที่ไม่รองรับ Worker แบบถาวร Bazel จะกลับไปเริ่มต้นอินสแตนซ์เครื่องมือสำหรับการดำเนินการแต่ละอย่าง คุณสามารถ ตั้งค่าบิวด์ให้ใช้ Worker แบบถาวรได้อย่างชัดเจนโดยการตั้งค่าworker กลยุทธ์สำหรับตัวช่วยจำเครื่องมือที่เกี่ยวข้อง แนวทางปฏิบัติแนะนำคือตัวอย่างนี้รวมถึงการระบุ local เป็นกลยุทธ์workerสำรอง

bazel build //my:target --strategy=Javac=worker,local

การใช้กลยุทธ์ Worker แทนกลยุทธ์ในเครื่องจะช่วยเพิ่มความเร็วในการคอมไพล์ได้อย่างมาก ทั้งนี้ขึ้นอยู่กับการติดตั้งใช้งาน สำหรับ Java การบิลด์จะเร็วขึ้น 2-4 เท่า และบางครั้งอาจเร็วกว่านี้สำหรับการคอมไพล์แบบเพิ่ม การคอมไพล์ Bazel จะเร็วขึ้นประมาณ 2.5 เท่าเมื่อใช้ Worker ดูรายละเอียดเพิ่มเติมได้ที่ส่วน "การเลือกจำนวน Worker"

หากคุณมีสภาพแวดล้อมการสร้างระยะไกลที่ตรงกับสภาพแวดล้อมการสร้างในเครื่อง คุณสามารถใช้กลยุทธ์แบบไดนามิกเวอร์ชันทดลอง ซึ่งจะแข่งกันระหว่างการดำเนินการระยะไกลและการดำเนินการของ Worker หากต้องการเปิดใช้กลยุทธ์แบบไดนามิก ให้ส่ง Flag --experimental_spawn_scheduler กลยุทธ์นี้จะเปิดใช้ Worker โดยอัตโนมัติ คุณจึงไม่จำเป็นต้อง ระบุกลยุทธ์ worker แต่ยังคงใช้ local หรือ sandboxed เป็น การสำรองได้

การเลือกจำนวนผู้ปฏิบัติงาน

จำนวนอินสแตนซ์ของ Worker ต่อ Mnemonic จะเป็น 4 โดยค่าเริ่มต้น แต่สามารถปรับได้ด้วยแฟล็ก worker_max_instances การใช้ CPU ที่มีอยู่ให้เกิดประโยชน์สูงสุดและการ คอมไพล์ JIT และแคชฮิตที่คุณได้รับนั้นมีข้อแลกเปลี่ยนกัน เมื่อมี Worker มากขึ้น เป้าหมายจำนวนมากขึ้นจะชำระค่าใช้จ่ายเริ่มต้นของการเรียกใช้โค้ดที่ไม่ได้ JIT และการเข้าถึงแคชเย็น หากมีเป้าหมายจำนวนน้อยที่ต้องสร้าง Worker เดียวอาจให้ การแลกเปลี่ยนที่ดีที่สุดระหว่างความเร็วในการคอมไพล์และการใช้ทรัพยากร (เช่น ดูปัญหา #8586) แฟล็ก worker_max_instances จะตั้งค่าจำนวนอินสแตนซ์ของ Worker สูงสุดต่อ นิโมนิกและชุดแฟล็ก (ดูด้านล่าง) ดังนั้นในระบบแบบผสม คุณอาจใช้ หน่วยความจำค่อนข้างมากหากใช้ค่าเริ่มต้น สำหรับการสร้างที่เพิ่มขึ้น ประโยชน์ของอินสแตนซ์ของ Worker หลายรายการจะยิ่งน้อยลง

กราฟนี้แสดงเวลาในการคอมไพล์ตั้งแต่ต้นสำหรับ Bazel (เป้าหมาย //src:bazel) ในเวิร์กสเตชัน Linux ที่มี Intel Xeon 3.5 GHz แบบไฮเปอร์เธรด 6 คอร์ พร้อม RAM 64 GB สำหรับการกำหนดค่าผู้ปฏิบัติงานแต่ละรายการ ระบบจะเรียกใช้การสร้างที่สะอาด 5 รายการและใช้ค่าเฉลี่ยของ 4 รายการสุดท้าย

กราฟการปรับปรุงประสิทธิภาพของบิลด์เปล่า

รูปที่ 1 กราฟการปรับปรุงประสิทธิภาพของบิลด์เปล่า

สำหรับการกำหนดค่านี้ ผู้ปฏิบัติงาน 2 คนจะให้การคอมไพล์ที่เร็วที่สุด แม้ว่าจะมีการปรับปรุงเพียง 14% เมื่อเทียบกับผู้ปฏิบัติงาน 1 คนก็ตาม Worker 1 ตัวเป็นตัวเลือกที่ดีหากคุณต้องการ ใช้หน่วยความจำน้อยลง

โดยทั่วไปแล้วการคอมไพล์แบบเพิ่มจะให้ประโยชน์มากยิ่งขึ้น การบิลด์แบบคลีนนั้น ค่อนข้างเกิดขึ้นได้ยาก แต่การเปลี่ยนแปลงไฟล์เดียวระหว่างการคอมไพล์นั้นเป็นเรื่องปกติ โดยเฉพาะอย่างยิ่งในการพัฒนาที่ขับเคลื่อนด้วยการทดสอบ ตัวอย่างข้างต้นยังมีการดำเนินการที่ไม่ใช่ Java ในการแพ็กเกจด้วย ซึ่งอาจบดบังเวลาในการคอมไพล์ที่เพิ่มขึ้น

การคอมไพล์แหล่งที่มาของ Java อีกครั้งเท่านั้น (//src/main/java/com/google/devtools/build/lib/bazel:BazelServer_deploy.jar) หลังจากเปลี่ยนค่าคงที่สตริงภายในใน AbstractContainerizingSandboxedSpawn.java ช่วยเพิ่มความเร็วได้ 3 เท่า (ค่าเฉลี่ยของการบิลด์แบบเพิ่มทีละรายการ 20 รายการโดยทิ้งการบิลด์วอร์มอัพ 1 รายการ)

กราฟการปรับปรุงประสิทธิภาพของการสร้างแบบเพิ่ม

รูปที่ 2 กราฟการปรับปรุงประสิทธิภาพของการสร้างแบบเพิ่ม

การเร่งความเร็วจะขึ้นอยู่กับการเปลี่ยนแปลงที่ดำเนินการ การเพิ่มความเร็วขึ้น 6 เท่า วัดได้ในสถานการณ์ข้างต้นเมื่อมีการเปลี่ยนแปลงค่าคงที่ที่ใช้กันทั่วไป

การแก้ไขผู้ปฏิบัติงานแบบถาวร

คุณสามารถส่งแฟล็ก --worker_extra_flag เพื่อระบุแฟล็กเริ่มต้นไปยัง Worker โดยใช้ Mnemonic เป็นคีย์ เช่น การส่ง --worker_extra_flag=javac=--debug จะเปิดการแก้ไขข้อบกพร่องสำหรับ Javac เท่านั้น ตั้งค่า Flag ของ Worker ได้เพียง 1 รายการต่อการใช้ Flag นี้ และใช้ได้กับ Mnemonic เพียงรายการเดียว ระบบไม่ได้สร้าง Worker แยกกันสำหรับแต่ละ Mnemonic เท่านั้น แต่ยังสร้างสำหรับ รูปแบบต่างๆ ในแฟล็กการเริ่มต้นด้วย ระบบจะรวมชุดค่าผสมของ Mnemonic และแฟล็กการเริ่มต้นเข้าด้วยกันเป็น WorkerKey และสำหรับ WorkerKey แต่ละรายการจะสร้าง Worker ได้สูงสุด worker_max_instances ราย ดูส่วนถัดไปเกี่ยวกับวิธีที่ การกําหนดค่าการกระทํายังระบุแฟล็กการตั้งค่าได้ด้วย

การส่งแฟล็ก --worker_sandboxing จะทำให้คำขอของ Worker แต่ละรายการใช้ไดเรกทอรีแซนด์บ็อกซ์แยกต่างหากสำหรับอินพุตทั้งหมด การตั้งค่าแซนด์บ็อกซ์ต้องใช้เวลาเพิ่มขึ้นเล็กน้อย โดยเฉพาะใน macOS แต่จะช่วยให้มั่นใจได้ถึงความถูกต้องที่ดียิ่งขึ้น

โดย --worker_quit_after_build แฟล็กมีประโยชน์หลักๆ ในการแก้ไขข้อบกพร่องและการสร้างโปรไฟล์ แฟล็กนี้จะบังคับให้ Worker ทั้งหมด ออกจากระบบเมื่อบิลด์เสร็จสมบูรณ์ นอกจากนี้ คุณยังส่ง --worker_verbose ไปยัง เพื่อรับเอาต์พุตเพิ่มเติมเกี่ยวกับสิ่งที่คนงานกำลังทำได้ด้วย โดยแฟล็กนี้จะแสดงในฟิลด์ verbosity ใน WorkRequest ซึ่งจะช่วยให้การใช้งาน Worker มี รายละเอียดมากขึ้นด้วย

ผู้ปฏิบัติงานจะจัดเก็บบันทึกไว้ในไดเรกทอรี <outputBase>/bazel-workers เช่น /tmp/_bazel_larsrc/191013354bebe14fdddae77f2679c3ef/bazel-workers/worker-1-Javac.log ชื่อไฟล์มีรหัสผู้ปฏิบัติงานและ Mnemonic เนื่องจากมี WorkerKey ได้มากกว่า 1 รายการต่อมnemonic คุณจึงอาจเห็นไฟล์บันทึกมากกว่า worker_max_instances รายการสำหรับ mnemonic ที่กำหนด

สําหรับการสร้าง Android โปรดดูรายละเอียดที่หน้าประสิทธิภาพการสร้าง Android

การใช้งานผู้ปฏิบัติงานแบบถาวร

ดูข้อมูลเพิ่มเติมเกี่ยวกับวิธีสร้าง Worker ได้ที่หน้าการสร้าง Worker แบบถาวร

ตัวอย่างนี้แสดงการกำหนดค่า Starlark สำหรับ Worker ที่ใช้ JSON

args_file = ctx.actions.declare_file(ctx.label.name + "_args_file")
ctx.actions.write(
    output = args_file,
    content = "\n".join(["-g", "-source", "1.5"] + ctx.files.srcs),
)
ctx.actions.run(
    mnemonic = "SomeCompiler",
    executable = "bin/some_compiler_wrapper",
    inputs = inputs,
    outputs = outputs,
    arguments = [ "-max_mem=4G",  "@%s" % args_file.path],
    execution_requirements = {
        "supports-workers" : "1", "requires-worker-protocol" : "json" }
)

เมื่อกำหนดค่าเช่นนี้ การใช้การดำเนินการนี้ครั้งแรกจะเริ่มต้นด้วยการเรียกใช้บรรทัดคำสั่ง /bin/some_compiler -max_mem=4G --persistent_worker คำขอ เพื่อคอมไพล์ Foo.java จะมีลักษณะดังนี้

หมายเหตุ: แม้ว่าข้อกำหนดของบัฟเฟอร์โปรโตคอลจะใช้ "snake case" (request_id) แต่โปรโตคอล JSON จะใช้ "camel case" (requestId) ในเอกสารนี้ เราจะใช้ camel case ในตัวอย่าง JSON แต่จะใช้ snake case เมื่อพูดถึงฟิลด์ โดยไม่คำนึงถึงโปรโตคอล

{
  "arguments": [ "-g", "-source", "1.5", "Foo.java" ]
  "inputs": [
    { "path": "symlinkfarm/input1", "digest": "d49a..." },
    { "path": "symlinkfarm/input2", "digest": "093d..." },
  ],
}

Worker จะได้รับข้อมูลนี้ใน stdin ในรูปแบบ JSON ที่คั่นด้วยการขึ้นบรรทัดใหม่ (เนื่องจากตั้งค่า requires-worker-protocol เป็น JSON) จากนั้น Worker จะดำเนินการ และส่ง WorkResponse ในรูปแบบ JSON ไปยัง Bazel ใน stdout จากนั้น Bazel จะ แยกวิเคราะห์การตอบกลับนี้และแปลงเป็น WorkResponse Proto ด้วยตนเอง หากต้องการสื่อสารกับ Worker ที่เชื่อมโยงโดยใช้ Protobuf ที่เข้ารหัสแบบไบนารีแทน JSON ให้ตั้งค่า requires-worker-protocol เป็น proto ดังนี้

  execution_requirements = {
    "supports-workers" : "1" ,
    "requires-worker-protocol" : "proto"
  }

การตั้งค่า requires-worker-protocol ยังช่วยให้มั่นใจได้ว่าระบบจะส่งต่อโปรโตคอลที่เลือกไปยังเซิร์ฟเวอร์การดำเนินการระยะไกลผ่านพร็อพเพอร์ตี้แพลตฟอร์ม persistentWorkerProtocol หากคุณไม่ระบุ requires-worker-protocol ใน ข้อกำหนดในการดำเนินการ Bazel จะตั้งค่าเริ่มต้นให้การสื่อสารของ Worker ใช้ protobuf

Bazel จะได้ WorkerKey จาก Mnemonic และ Flag ที่แชร์ ดังนั้นหากการกำหนดค่านี้อนุญาตให้เปลี่ยนพารามิเตอร์ max_mem ระบบจะสร้าง Worker แยกต่างหากสำหรับแต่ละค่าที่ใช้ ซึ่งอาจทำให้ใช้หน่วยความจำมากเกินไปหากใช้ตัวแปรมากเกินไป

ปัจจุบันผู้ปฏิบัติงานแต่ละคนจะประมวลผลคำขอได้ครั้งละ 1 รายการเท่านั้น ฟีเจอร์Multiplex Worker เวอร์ชันทดลองช่วยให้ใช้หลายเธรดได้ หากเครื่องมือพื้นฐานเป็นแบบหลายเธรดและตั้งค่า Wrapper ให้เข้าใจเรื่องนี้

ในที่เก็บ GitHub นี้ คุณจะเห็น Wrapper ของ Worker ตัวอย่างที่เขียนด้วย Java และ Python หากคุณทำงานใน JavaScript หรือ TypeScript แพ็กเกจ@bazel/worker และตัวอย่าง Worker ของ Node.js อาจมีประโยชน์

Worker ส่งผลต่อแซนด์บ็อกซ์อย่างไร

การใช้กลยุทธ์ worker โดยค่าเริ่มต้นจะไม่เรียกใช้การดำเนินการในแซนด์บ็อกซ์ เช่นเดียวกับกลยุทธ์ local คุณสามารถตั้งค่า --worker_sandboxing เพื่อให้ Worker ทั้งหมดทำงานภายในแซนด์บ็อกซ์ได้ เพื่อให้มั่นใจว่าการ เรียกใช้เครื่องมือแต่ละครั้งจะเห็นเฉพาะไฟล์อินพุตที่ควรมี เครื่องมือ อาจยังคงรั่วไหลข้อมูลระหว่างคำขอภายใน เช่น ผ่านแคช การใช้dynamicกลยุทธ์ กำหนดให้ต้องมีการแซนด์บ็อกซ์คนงาน

หากต้องการอนุญาตให้ใช้แคชคอมไพเลอร์กับ Worker อย่างถูกต้อง ระบบจะส่งค่าแฮชพร้อมกับไฟล์อินพุตแต่ละไฟล์ คอมไพเลอร์หรือ Wrapper จึงตรวจสอบได้ว่าอินพุตยังคงถูกต้องหรือไม่โดยไม่ต้องอ่านไฟล์

แม้จะใช้ข้อมูลสรุปของอินพุตเพื่อป้องกันการแคชที่ไม่ต้องการ แต่ Sandboxed Worker ก็มีการแซนด์บ็อกซ์ที่เข้มงวดน้อยกว่าแซนด์บ็อกซ์แบบเพียว เนื่องจากเครื่องมืออาจ เก็บสถานะภายในอื่นๆ ที่ได้รับผลกระทบจากคำขอก่อนหน้า

Multiplex Worker จะอยู่ในแซนด์บ็อกซ์ได้ก็ต่อเมื่อการใช้งาน Worker รองรับ และต้องเปิดใช้แซนด์บ็อกซ์นี้แยกต่างหากด้วย --experimental_worker_multiplex_sandboxing แฟล็ก ดูรายละเอียดเพิ่มเติมได้ใน เอกสารการออกแบบ)

อ่านเพิ่มเติม

ดูข้อมูลเพิ่มเติมเกี่ยวกับ Persistent Worker ได้ที่