Build Foundation เริ่มรับสมัครสมาชิกผู้ก่อตั้งแล้ว เข้าร่วมรายชื่ออีเมล อ่านข้อตกลงในการเข้าร่วม และลงทะเบียน

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

แจกแจงประสิทธิภาพของบิลด์

Nightly · 9.1 · 9.0 · 8.7 · 8.6 · 8.5 · 8.4 · 8.3 · 8.2 · 8.1

Bazel มีความซับซ้อนและทำสิ่งต่างๆ มากมายในระหว่างการบิลด์ ซึ่งบางอย่างอาจส่งผลต่อประสิทธิภาพการบิลด์ หน้านี้พยายามเชื่อมโยงแนวคิด Bazel บางอย่างเหล่านี้กับผลกระทบต่อประสิทธิภาพการสร้าง แม้ว่าเราจะไม่ได้อธิบายอย่างละเอียด แต่เราได้รวมตัวอย่างวิธีตรวจหาปัญหาด้านประสิทธิภาพการบิลด์ ผ่านการดึงข้อมูลเมตริก และสิ่งที่คุณทำได้เพื่อแก้ไขปัญหา เราหวังว่าคุณจะนำแนวคิดเหล่านี้ไปใช้ได้ เมื่อตรวจสอบการถดถอยของประสิทธิภาพบิลด์

บิลด์เปล่าเทียบกับบิลด์แบบเพิ่ม

บิลด์เปล่าคือบิลด์ที่สร้างทุกอย่างตั้งแต่ต้น ส่วนบิลด์แบบเพิ่มจะนำงานที่เสร็จแล้วบางส่วนมาใช้ซ้ำ

เราขอแนะนำให้ดูการสร้างแบบคลีนและการสร้างแบบเพิ่มทีละรายการแยกกัน โดยเฉพาะเมื่อคุณรวบรวม / รวมเมตริกที่ขึ้นอยู่กับสถานะของแคชของ Bazel (เช่น เมตริกขนาดคำขอสร้าง) นอกจากนี้ยังแสดงถึงประสบการณ์ของผู้ใช้ 2 แบบที่แตกต่างกันด้วย เมื่อเทียบกับการเริ่มต้นสร้างใหม่ตั้งแต่ต้น (ซึ่งใช้เวลานานกว่าเนื่องจากแคชเย็น) การสร้างแบบเพิ่มจะเกิดขึ้นบ่อยกว่ามากเมื่อนักพัฒนาซอฟต์แวร์ทำซ้ำในโค้ด (โดยปกติจะเร็วกว่าเนื่องจากแคชมักจะพร้อมใช้งานอยู่แล้ว)

คุณใช้ฟิลด์ CumulativeMetrics.num_analyses ใน BEP เพื่อจัดประเภทบิลด์ได้ หากเป็น num_analyses <= 1 แสดงว่าเป็นบิลด์ที่สะอาด แต่หากไม่ใช่ เราสามารถจัดหมวดหมู่ได้กว้างๆ ว่าน่าจะเป็นบิลด์ที่เพิ่มขึ้น ผู้ใช้อาจเปลี่ยนไปใช้ฟีเจอร์หรือเป้าหมายอื่น ซึ่งทำให้เกิดบิลด์ที่สะอาดอย่างมีประสิทธิภาพ คำจำกัดความที่เข้มงวดมากขึ้นเกี่ยวกับส่วนเพิ่มอาจต้องอยู่ในรูปแบบของฮิวริสติก เช่น การดูจำนวนแพ็กเกจที่โหลด (PackageMetrics.packages_loaded)

เมตริกบิลด์เชิงกำหนดเป็นตัวแทนของประสิทธิภาพบิลด์

การวัดประสิทธิภาพบิลด์อาจเป็นเรื่องยากเนื่องจากลักษณะที่ไม่แน่นอนของเมตริกบางอย่าง (เช่น เวลา CPU ของ Bazel หรือเวลาในคิวในคลัสเตอร์ระยะไกล) ดังนั้น การใช้เมตริกเชิงกำหนดเป็นตัวแทนสำหรับปริมาณงานที่ Bazel ทำ ซึ่งจะส่งผลต่อประสิทธิภาพของ Bazel จึงมีประโยชน์

ขนาดของคำขอสร้างอาจส่งผลต่อประสิทธิภาพการสร้างอย่างมาก บิลด์ขนาดใหญ่อาจหมายถึงงานที่มากขึ้นในการวิเคราะห์และ สร้างกราฟบิลด์ การเติบโตของบิลด์โดยธรรมชาติจะมาพร้อมกับการพัฒนา เนื่องจากมีการเพิ่ม/สร้างการพึ่งพามากขึ้น จึงมีความซับซ้อนมากขึ้น และมีค่าใช้จ่ายในการสร้างสูงขึ้น

เราสามารถแบ่งปัญหานี้ออกเป็นระยะการสร้างต่างๆ และใช้เมตริกต่อไปนี้เป็นเมตริกพร็อกซีสำหรับงานที่ทำในแต่ละระยะ

PackageMetrics.packages_loaded: จำนวนแพ็กเกจที่โหลดสำเร็จ การถดถอยในที่นี้หมายถึงงานเพิ่มเติมที่ต้องทำเพื่ออ่านและแยกวิเคราะห์ไฟล์ BUILD เพิ่มเติมแต่ละไฟล์ในระยะการโหลด
- ซึ่งมักเกิดจากการเพิ่มการอ้างอิงและต้องโหลดการปิดทรานซิทีฟ
- ใช้ query / cquery เพื่อค้นหา ตำแหน่งที่อาจมีการเพิ่มการอ้างอิงใหม่
TargetMetrics.targets_configured: แสดงจำนวนเป้าหมายและ แง่มุมที่กำหนดค่าในการสร้าง การเกิดปัญหาซ้ำแสดงถึงการทำงานที่มากขึ้นในการสร้างและข้ามผ่านกราฟเป้าหมายที่กำหนดค่าไว้
- ซึ่งมักเกิดจากการเพิ่มการอ้างอิงและการสร้างกราฟของการปิดทรานซิทีฟ
- ใช้ cquery เพื่อดูว่ามีการเพิ่ม การอ้างอิงใหม่ที่ใด
ActionSummary.actions_created: แสดงถึงการดำเนินการที่สร้างขึ้นในบิลด์ และการเกิดปัญหาซ้ำแสดงถึงงานเพิ่มเติมในการสร้างกราฟการดำเนินการ โปรดทราบ ว่าการดำเนินการนี้รวมถึงการดำเนินการที่ไม่ได้ใช้ซึ่งอาจไม่ได้ดำเนินการด้วย
- ใช้ aquery เพื่อแก้ไขข้อบกพร่องของการถดถอย เราขอแนะนำให้เริ่มต้นด้วย --output=summary ก่อนที่จะเจาะลึกลงไปอีกด้วย --skyframe_state
ActionSummary.actions_executed: จำนวนการดำเนินการที่ดำเนินการ การเกิดปัญหาซ้ำแสดงถึงงานที่มากขึ้นในการดำเนินการเหล่านี้โดยตรง
- BEP จะเขียนสถิติการดำเนินการ ActionData ซึ่งแสดงประเภทการดำเนินการที่ดำเนินการมากที่สุด โดยค่าเริ่มต้น ระบบจะรวบรวมประเภทการกระทํา 20 อันดับแรก แต่คุณสามารถส่ง --experimental_record_metrics_for_all_mnemonics เพื่อรวบรวมข้อมูลนี้สําหรับการกระทําทุกประเภทที่ดําเนินการ
- ซึ่งจะช่วยให้คุณทราบว่ามีการดำเนินการประเภทใดบ้าง (เพิ่มเติม)
BuildGraphSummary.outputArtifactCount: จำนวนอาร์ติแฟกต์ที่สร้างขึ้นโดย การดำเนินการที่ดำเนินการ
- หากจำนวนการดำเนินการที่ดำเนินการไม่เพิ่มขึ้น แสดงว่าน่าจะมีการเปลี่ยนแปลงการใช้งานกฎ

เมตริกเหล่านี้ทั้งหมดได้รับผลกระทบจากสถานะของแคชในเครื่อง ดังนั้นคุณจึงควรตรวจสอบว่าบิลด์ที่คุณดึงเมตริกเหล่านี้ออกมาเป็นบิลด์ที่สะอาด

เราสังเกตว่าการถดถอยของเมตริกเหล่านี้อาจมาพร้อมกับการถดถอยของเวลาจริง เวลา CPU และการใช้งานหน่วยความจำ

การใช้ทรัพยากรในพื้นที่

Bazel ใช้ทรัพยากรต่างๆ ในเครื่องของคุณ (ทั้งสำหรับการวิเคราะห์กราฟการสร้างและการขับเคลื่อนการดำเนินการ รวมถึงการเรียกใช้การกระทำในเครื่อง) ซึ่งอาจส่งผลต่อประสิทธิภาพ / ความพร้อมใช้งานของเครื่องในการสร้างและงานอื่นๆ

เวลาที่ใช้

เมตริกที่อาจได้รับผลกระทบจากสัญญาณรบกวนมากที่สุด (และอาจแตกต่างกันอย่างมากในแต่ละบิลด์) คือเวลา โดยเฉพาะเวลาจริง เวลา CPU และเวลาของระบบ คุณสามารถใช้ bazel-bench เพื่อรับเกณฑ์มาตรฐานสำหรับเมตริกเหล่านี้ และหากมี--runsจำนวนมากพอ คุณจะเพิ่มนัยสำคัญทางสถิติของการวัดผลได้

เวลาจริงคือเวลาที่ผ่านไปในโลกแห่งความเป็นจริง
- หากเวลาจริงเท่านั้นที่ถดถอย เราขอแนะนำให้รวบรวมโปรไฟล์การติดตาม JSON และดูความแตกต่าง ไม่เช่นนั้น การตรวจสอบเมตริกอื่นๆ ที่ถดถอยอาจมีประสิทธิภาพมากกว่า เนื่องจากอาจส่งผลต่อเวลาที่ใช้จริง
เวลา CPU คือเวลาที่ CPU ใช้ในการดำเนินการโค้ดของผู้ใช้
- หากเวลา CPU ลดลงในการคอมมิตโปรเจ็กต์ 2 รายการ เราขอแนะนำให้รวบรวม โปรไฟล์ CPU ของ Starlark นอกจากนี้ คุณควรใช้ --nobuild เพื่อ จำกัดบิลด์ไว้ที่ระยะการวิเคราะห์ เนื่องจากเป็นระยะที่มีการทำงานที่ใช้ CPU หนักมากที่สุด
เวลาของระบบคือเวลาที่ CPU ใช้ในเคอร์เนล
- หากเวลาของระบบถดถอยลง มักจะมีความสัมพันธ์กับ I/O เมื่อ Bazel อ่านไฟล์จากระบบไฟล์

การสร้างโปรไฟล์การโหลดทั่วทั้งระบบ

เมื่อใช้แฟล็ก --experimental_collect_load_average_in_profiler ที่เปิดตัวใน Bazel 6.0 โปรไฟล์เลอร์การติดตาม JSON จะรวบรวมค่าเฉลี่ยของภาระงานของระบบระหว่างการเรียกใช้

รูปที่ 1 โปรไฟล์ที่มีค่าเฉลี่ยของโหลดระบบ

การโหลดสูงระหว่างการเรียกใช้ Bazel อาจบ่งชี้ว่า Bazel กำหนดเวลาการดำเนินการในเครื่องมากเกินไปพร้อมกันสำหรับเครื่องของคุณ คุณอาจต้องพิจารณา ปรับ --local_cpu_resources และ --local_ram_resources โดยเฉพาะในสภาพแวดล้อมคอนเทนเนอร์ (อย่างน้อยจนกว่าจะผสานรวม#16512)

การตรวจสอบการใช้งานหน่วยความจำของ Bazel

แหล่งที่มาหลัก 2 แหล่งในการดูการใช้งานหน่วยความจำของ Bazel คือ Bazel info และ BEP

bazel info used-heap-size-after-gc: ปริมาณหน่วยความจำที่ใช้ในหน่วยไบต์หลังจาก การเรียกใช้ System.gc()
- Bazel bench ยังให้การเปรียบเทียบสำหรับเมตริกนี้ด้วย
- นอกจากนี้ ยังมี peak-heap-size, max-heap-size, used-heap-size และ committed-heap-size (ดูเอกสารประกอบ) แต่มีความเกี่ยวข้องน้อยกว่า
BEP MemoryMetrics.peak_post_gc_heap_size: ขนาดของฮีป JVM สูงสุดใน ไบต์หลัง GC (ต้องตั้งค่า --memory_profile ที่พยายามบังคับให้ทำ GC แบบเต็ม)

โดยปกติแล้ว การถดถอยในการใช้หน่วยความจำมักเป็นผลมาจากการถดถอยในเมตริกขนาดคำขอสร้าง ซึ่งมักเกิดจากการเพิ่มการอ้างอิงหรือการเปลี่ยนแปลงการใช้งานกฎ

หากต้องการวิเคราะห์หน่วยความจำที่ใช้ของ Bazel ในระดับที่ละเอียดยิ่งขึ้น เราขอแนะนำให้ใช้เครื่องมือสร้างโปรไฟล์หน่วยความจำในตัว สำหรับกฎ

การสร้างโปรไฟล์หน่วยความจำของ Worker ที่ทำงานอย่างต่อเนื่อง

แม้ว่าWorker ที่ทำงานอย่างต่อเนื่องจะช่วยเร่งความเร็วในการสร้างได้อย่างมาก (โดยเฉพาะภาษาที่แปลโดยอินเทอร์พรีเตอร์) แต่หน่วยความจำที่ใช้อาจเป็นปัญหาได้ Bazel จะรวบรวมเมตริกเกี่ยวกับ Worker โดยเฉพาะอย่างยิ่งฟิลด์ WorkerMetrics.WorkerStats.worker_memory_in_kb จะบอกว่า Worker ใช้หน่วยความจำมากน้อยเพียงใด (ตามชื่อช่วยจำ)

โปรไฟล์เลอร์การติดตาม JSON ยังรวบรวมการใช้งานหน่วยความจำของ Worker แบบถาวรระหว่างการเรียกใช้โดยส่งแฟล็ก --experimental_collect_system_network_usage (ใหม่ใน Bazel 6.0)

รูปที่ 2 โปรไฟล์ที่มีการใช้งานหน่วยความจำของ Worker

การลดค่าของ --worker_max_instances (ค่าเริ่มต้นคือ 4) อาจช่วยลด ปริมาณหน่วยความจำที่ใช้โดย Worker แบบถาวร เรากำลังดำเนินการอย่างเต็มที่เพื่อทำให้เครื่องมือจัดการทรัพยากรและเครื่องจัดตารางเวลาของ Bazel ฉลาดขึ้น เพื่อให้การปรับแต่งดังกล่าวจำเป็นน้อยลงในอนาคต

การตรวจสอบการจราจรของข้อมูลในเครือข่ายสำหรับการสร้างจากระยะไกล

ในการดำเนินการจากระยะไกล Bazel จะดาวน์โหลดอาร์ติแฟกต์ที่สร้างขึ้นเป็นผลมาจากการ ดำเนินการ ดังนั้น แบนด์วิดท์ของเครือข่ายจึงอาจส่งผลต่อประสิทธิภาพ ของการสร้าง

หากใช้การดำเนินการจากระยะไกลสำหรับการสร้าง คุณอาจต้องพิจารณาการตรวจสอบการจราจรของข้อมูลในเครือข่ายระหว่างการเรียกใช้โดยใช้NetworkMetrics.SystemNetworkStats proto จาก BEP(ต้องส่ง --experimental_collect_system_network_usage)

นอกจากนี้ โปรไฟล์การติดตาม JSON ยังช่วยให้คุณดูการใช้งานเครือข่ายทั่วทั้งระบบตลอดระยะเวลาของบิลด์ได้ โดยส่งแฟล็ก --experimental_collect_system_network_usage (ใหม่ใน Bazel 6.0)

รูปที่ 3 โปรไฟล์ที่มีการใช้งานเครือข่ายทั้งระบบ

การใช้งานเครือข่ายสูงแต่ค่อนข้างคงที่เมื่อใช้การดำเนินการจากระยะไกลอาจบ่งชี้ว่า เครือข่ายเป็นจุดคอขวดในการบิลด์ หากคุณยังไม่ได้ใช้ ให้ลองเปิดใช้การบิลด์โดยไม่มีไบต์โดยส่ง --remote_download_minimal ซึ่งจะช่วยเร่งความเร็วการสร้างโดยหลีกเลี่ยงการดาวน์โหลดอาร์ติแฟกต์ระดับกลางที่ไม่จำเป็น

อีกตัวเลือกหนึ่งคือการกำหนดค่าแคชดิสก์ในเครื่องเพื่อประหยัด แบนด์วิดท์ในการดาวน์โหลด