การแก้ไขข้อบกพร่องของ Hit แคชระยะไกลสำหรับการดำเนินการระยะไกล

ต่อคืน · 9.0 · 8.6 · 8.5 · 8.4 · 8.3 · 8.2 · 7.7

หน้านี้อธิบายวิธีตรวจสอบอัตราการเข้าชมแคชและวิธีตรวจสอบ แคชที่ไม่พบในบริบทของการดำเนินการจากระยะไกล

หน้านี้ถือว่าคุณมีบิลด์และ/หรือการทดสอบที่ใช้การดำเนินการจากระยะไกลได้สำเร็จ และคุณต้องการตรวจสอบว่าคุณใช้แคชระยะไกลอย่างมีประสิทธิภาพ

การตรวจสอบอัตราการเข้าชมแคช

ในเอาต์พุตมาตรฐานของการเรียกใช้ Bazel ให้ดูบรรทัด INFO ที่แสดงรายการ กระบวนการ ซึ่งสอดคล้องกับการดำเนินการของ Bazel โดยประมาณ บรรทัดนั้นจะแสดงรายละเอียด ตำแหน่งที่เรียกใช้การดำเนินการ มองหาป้ายกำกับ remote ซึ่งระบุการดำเนินการ ที่ดำเนินการจากระยะไกล linux-sandbox สำหรับการดำเนินการที่ดำเนินการในแซนด์บ็อกซ์ในเครื่อง และค่าอื่นๆ สำหรับกลยุทธ์การดำเนินการอื่นๆ การดำเนินการที่มีผลลัพธ์มาจากแคชระยะไกลจะแสดงเป็น remote cache hit

เช่น

INFO: 11 processes: 6 remote cache hit, 3 internal, 2 remote.

ในตัวอย่างนี้ มีการเข้าชมแคชระยะไกล 6 ครั้ง และการดำเนินการ 2 รายการไม่มี การเข้าชมแคชและดำเนินการจากระยะไกล คุณไม่ต้องสนใจส่วนที่ 3 ภายใน โดยปกติแล้วจะเป็นการดำเนินการภายในเล็กๆ น้อยๆ เช่น การสร้างลิงก์สัญลักษณ์ การเข้าชมแคชในเครื่องจะไม่รวมอยู่ในสรุปนี้ หากคุณได้รับ 0 processes (หรือตัวเลขต่ำกว่าที่คาดไว้) ให้เรียกใช้ bazel clean ตามด้วยคำสั่งบิลด์/ทดสอบ

การแก้ปัญหาการเข้าชมแคช

หากอัตราการเข้าชมแคชไม่เป็นไปตามที่คาดไว้ ให้ทำดังนี้

ตรวจสอบว่าการเรียกใช้คำสั่งบิลด์/ทดสอบเดียวกันอีกครั้งจะทำให้เกิดแคชฮิต

เรียกใช้บิลด์และ/หรือการทดสอบที่คุณคาดว่าจะสร้างแคช ครั้งแรกที่เรียกใช้บิลด์ใหม่ในสแต็กหนึ่งๆ คุณจะเห็นว่าไม่มีการ แคชระยะไกล ผลลัพธ์ของการดำเนินการจะจัดเก็บไว้ในแคชและควรมีการเรียกใช้ในภายหลัง
เรียกใช้ bazel clean คำสั่งนี้จะล้างแคชในเครื่อง ซึ่งช่วยให้คุณตรวจสอบการเข้าชมแคชระยะไกลได้โดยไม่ต้องให้ผลลัพธ์ถูกปิดบังด้วยการเข้าชมแคชในเครื่อง
เรียกใช้บิลด์และการทดสอบที่คุณกำลังตรวจสอบอีกครั้ง (ในเครื่องเดียวกัน)
ตรวจสอบบรรทัด INFO สำหรับอัตราการเข้าชมแคช หากไม่เห็นกระบวนการใดๆ ยกเว้น remote cache hit และ internal แสดงว่าระบบกำลังป้อนข้อมูลและเข้าถึงแคชอย่างถูกต้อง ในกรณีนี้ ให้ข้ามไปยังส่วนถัดไป
แหล่งที่มาของความคลาดเคลื่อนที่อาจเป็นไปได้คือสิ่งที่ไม่ใช่แบบปิดในบิลด์ ซึ่งทำให้การดำเนินการได้รับคีย์การดำเนินการที่แตกต่างกันในการเรียกใช้ 2 ครั้ง หากต้องการค้นหาการดำเนินการเหล่านั้น ให้ทำดังนี้

ก. เรียกใช้บิลด์หรือการทดสอบที่เป็นปัญหาอีกครั้งเพื่อรับบันทึกการดำเนินการ
```
  bazel clean
  bazel --optional-flags build //your:target --execution_log_compact_file=/tmp/exec1.log
```
ข. เปรียบเทียบบันทึกการดำเนินการระหว่างการเรียกใช้ 2 ครั้ง ตรวจสอบว่าการดำเนินการเหมือนกันในไฟล์บันทึกทั้ง 2 ไฟล์ ความคลาดเคลื่อนจะให้ข้อมูลเบาะแสเกี่ยวกับการเปลี่ยนแปลงที่เกิดขึ้นระหว่างการเรียกใช้ อัปเดตบิลด์เพื่อขจัดความคลาดเคลื่อนเหล่านั้น

หากแก้ปัญหาการแคชได้แล้วและตอนนี้การเรียกใช้ซ้ำ ทำให้เกิดการเข้าชมแคชทั้งหมด ให้ข้ามไปที่ส่วนถัดไป

หากรหัสการกระทำเหมือนกัน แต่ไม่มีการเข้าชมที่แคช แสดงว่ามีบางอย่าง ในการกำหนดค่าที่ป้องกันไม่ให้แคช ดำเนินการต่อในส่วนนี้เพื่อ ตรวจสอบปัญหาที่พบบ่อย
ตรวจสอบว่าการดำเนินการทั้งหมดในบันทึกการดำเนินการมี cacheable ตั้งค่าเป็น "จริง" หาก cacheable ไม่ปรากฏในบันทึกการดำเนินการสำหรับการดำเนินการที่กำหนด แสดงว่ากฎที่เกี่ยวข้องอาจมีแท็ก no-cache ในคำจำกัดความในไฟล์ BUILD ดูฟิลด์ mnemonic และ target_label ในบันทึกการดำเนินการเพื่อช่วยพิจารณาว่าการดำเนินการมาจากที่ใด
หากการดำเนินการเหมือนกันและ cacheable แต่ไม่มีแคชฮิต แสดงว่าบรรทัดคำสั่งอาจมี --noremote_accept_cached ซึ่งจะปิดใช้การค้นหาแคชสำหรับการสร้าง

หากไม่แน่ใจว่าบรรทัดคำสั่งที่ถูกต้องคืออะไร ให้ใช้บรรทัดคำสั่งที่ถูกต้องจากโปรโตคอลเหตุการณ์บิลด์ ดังนี้

ก. เพิ่ม --build_event_text_file=/tmp/bep.txt ลงในคำสั่ง Bazel เพื่อรับ บันทึกเวอร์ชันข้อความ

ข. เปิดบันทึกเวอร์ชันข้อความแล้วค้นหาstructured_command_lineข้อความที่มี command_line_label: "canonical" โดยจะแสดงตัวเลือกทั้งหมดหลังจากขยาย

ค. ค้นหา remote_accept_cached และตรวจสอบว่าตั้งค่าเป็น false หรือไม่

ง. หาก remote_accept_cached เป็น false ให้พิจารณาว่ามีการตั้งค่าเป็น false ที่ใด ไม่ว่าจะในบรรทัดคำสั่งหรือในไฟล์ bazelrc

ตรวจสอบว่ามีการแคชในเครื่องต่างๆ

หลังจากที่แคชฮิตเกิดขึ้นตามที่คาดไว้ในเครื่องเดียวกันแล้ว ให้เรียกใช้ บิลด์/การทดสอบเดียวกันในเครื่องอื่น หากสงสัยว่าการแคช ไม่เกิดขึ้นในเครื่องต่างๆ ให้ทำดังนี้

แก้ไขบิลด์เล็กน้อยเพื่อหลีกเลี่ยงการเข้าถึงแคชที่มีอยู่

เรียกใช้บิลด์ในเครื่องแรก

 bazel clean
 bazel ... build ... --execution_log_compact_file=/tmp/exec1.log

เรียกใช้บิลด์ในเครื่องที่ 2 โดยตรวจสอบว่ามีการรวมการแก้ไขจากขั้นตอนที่ 1
```
 bazel clean
 bazel ... build ... --execution_log_compact_file=/tmp/exec2.log
```
เปรียบเทียบบันทึกการดำเนินการของการเรียกใช้ทั้ง 2 รายการ หากบันทึกไม่เหมือนกัน ให้ตรวจสอบการกำหนดค่าบิลด์เพื่อหาความคลาดเคลื่อน รวมถึงพร็อพเพอร์ตี้จากสภาพแวดล้อมโฮสต์ที่รั่วไหลไปยังบิลด์ใดบิลด์หนึ่ง

การเปรียบเทียบบันทึกการดำเนินการ

บันทึกการดำเนินการประกอบด้วยบันทึกการดำเนินการที่ดำเนินการในระหว่างการสร้าง แต่ละบันทึกจะอธิบายทั้งอินพุต (ไม่เพียงแต่ไฟล์ แต่ยังรวมถึงอาร์กิวเมนต์บรรทัดคำสั่ง ตัวแปรสภาพแวดล้อม ฯลฯ) และเอาต์พุตของการดำเนินการ ดังนั้น การตรวจสอบบันทึกจึงสามารถแสดงให้เห็นว่าเหตุใดจึงมีการดำเนินการซ้ำ

คุณสร้างบันทึกการดำเนินการได้ใน 3 รูปแบบ ได้แก่ กะทัดรัด (--execution_log_compact_file) ไบนารี (--execution_log_binary_file) หรือ JSON (--execution_log_json_file) เราขอแนะนำให้ใช้รูปแบบกะทัดรัด เนื่องจากจะสร้างไฟล์ที่มีขนาดเล็กกว่ามากและมีค่าใช้จ่ายในการรันไทม์น้อยมาก วิธีการต่อไปนี้ใช้ได้กับทุกรูปแบบ นอกจากนี้ คุณยังแปลงระหว่างหน่วยต่างๆ ได้โดยใช้เครื่องมือ //src/tools/execlog:converter

หากต้องการเปรียบเทียบบันทึกของ 2 บิลด์ที่ไม่ได้แชร์แคชฮิตตามที่คาดไว้ ให้ทำดังนี้

รับบันทึกการดำเนินการจากแต่ละบิลด์และจัดเก็บเป็น /tmp/exec1.log และ /tmp/exec2.log
ดาวน์โหลดซอร์สโค้ด Bazel แล้วสร้าง//src/tools/execlog:parser เครื่องมือ:

git clone https://github.com/bazelbuild/bazel.git cd bazel bazel build //src/tools/execlog:parser
ใช้เครื่องมือ //src/tools/execlog:parser เพื่อแปลงบันทึกเป็น รูปแบบข้อความที่มนุษย์อ่านได้ ในรูปแบบนี้ การดำเนินการในบันทึกที่ 2 จะได้รับการ จัดเรียงให้ตรงกับลำดับในบันทึกแรก ซึ่งจะช่วยให้เปรียบเทียบได้ง่ายขึ้น
```
bazel-bin/src/tools/execlog/parser \
  --log_path=/tmp/exec1.log \
  --log_path=/tmp/exec2.log \
  --output_path=/tmp/exec1.log.txt \
  --output_path=/tmp/exec2.log.txt
```
ใช้เครื่องมือเปรียบเทียบข้อความที่คุณชื่นชอบเพื่อเปรียบเทียบ /tmp/exec1.log.txt และ /tmp/exec2.log.txt