กู้คืนจากโหนดที่ล้มเหลว

หากโหนดเซิร์ฟเวอร์ของคุณมีปัญหา และคุณมีกระบวนการที่ซ้ำซ้อนบนโหนดอื่นๆ ของคุณ Tableau Server สามารถทำงานต่อไปได้ ผู้ใช้ของคุณสามารถเข้าสู่ระบบและดูและใช้เนื้อหาของตนต่อไปได้หลังจากที่โหนดล้มเหลว แต่อาจประสบปัญหาประสิทธิภาพการทำงานลดลงอันเป็นผลมาจากโหนดที่ล้มเหลว นอกจากนี้ เซิร์ฟเวอร์ของคุณจะมีความเสี่ยงที่จะเกิดความล้มเหลวที่รุนแรงมากขึ้น หากโหนดที่เสียหายกำลังเรียกใช้กระบวนการที่ไม่ซ้ำกันอีกต่อไป ซึ่งหมายความว่าคุณควรลบโหนดที่เสียหายและแทนที่โดยเร็วที่สุด หากโหนดของคุณล้มเหลวด้วยเหตุผลที่สามารถกู้คืนได้ในระยะเวลาอันสั้น (เช่น การล้มเหลวของฮาร์ดแวร์ที่คุณสามารถแก้ไขได้) คุณควรพยายามนำโหนดกลับมาใช้ใหม่โดยไม่ทำตามขั้นตอนด้านล่าง

หมายเหตุ: หากโหนดที่ล้มเหลวเป็นโหนดเริ่มต้นของคุณ การติดตั้ง Tableau Server ของคุณจะมีผลกระทบมากขึ้น สำหรับรายละเอียดเกี่ยวกับวิธีการกู้คืนจากความล้มเหลวของโหนดเริ่มต้น โปรดดูกู้คืนจากโหนดเริ่มต้นที่ล้มเหลว

ข้อกำหนดทั่วไป

เวอร์ชัน 2020.1 ของ Tableau Server ได้รับการอัปเดตแล้ว พร้อมฟังก์ชันการกู้คืนที่ปรับปรุงดีขึ้น ขั้นตอนในหัวข้อนี้ได้จัดทำขึ้นสำหรับ Tableau Server 2020.1

หากคุณกำลังพยายามกู้คืนโหนดที่ล้มเหลวจาก Tableau Server เวอร์ชันก่อนหน้านี้ คุณจะต้องปฏิบัติตามขั้นตอนของเวอร์ชันดังกล่าว หากต้องการดูเวอร์ชันที่เก็บถาวรของความช่วยเหลือจาก Tableau โปรดดูที่ ความช่วยเหลือจาก Tableau(ลิงก์จะเปิดในหน้าต่างใหม่)

  • มีโหนดที่ทำงานอยู่อย่างน้อยหนึ่งโหนดที่มีอินสแตนซ์ของที่จัดเก็บไฟล์อยู่
  • มีโหนดที่ทำงานอยู่อย่างน้อยหนึ่งโหนดที่มีที่เก็บอยู่
  • มีโหนดที่ทำงานอยู่อย่างน้อยหนึ่งโหนดที่มีบริการไฟล์ไคลเอ็นต์ (CFS) อยู่บนนั้น

หมายเหตุ: การดำเนินการนี้รวมขั้นตอนที่คุณอาจต้องดำเนินการโดยใช้บรรทัดคำสั่ง TSM หากต้องการใช้ TSM CLI คุณต้องมีการเข้าถึงสำหรับผู้ดูแลระบบเพื่อไปยังบรรทัดคำสั่งบนโหนดใดโหนดหนึ่งในการติดตั้งของคุณและต้องมีการเข้ารหัสของผู้ดูแลระบบ TSM เพื่อเรียกใช้คำสั่ง TSM

การลบโหนดที่ล้มเหลว

หากต้องการลบโหนดที่ล้มเหลวออกจากคลัสเตอร์ Tableau Server

  1. ระบุโหนดที่ล้มเหลว

    tsm status -v

    โหนดที่ล้มเหลวจะมีสถานะ "ข้อผิดพลาด" และกระบวนการจะแสดงเป็นไม่พร้อมใช้งาน ID โหนดจะแสดงเป็น "node<n>" โดยมีชื่อเครื่องต่อท้าย ตัวอย่าง node3:

    node3: WIN-OO915SFASVH
    						Status: ERROR
    					'Tableau Server Gateway 0' status is unavailable.
  2. หยุดการทำงาน Tableau Server

    ส่วนที่เหลือของกระบวนการนี้รวมคำสั่งบางอย่างไว้ในตัวเลือก --ignore-node-status เมื่อเรียกใช้คำสั่งกับตัวเลือก --ignore-node-status คำสั่งดังกล่าวจะทำงานโดยไม่คำนึงถึงสถานะของโหนดที่ระบุ หากต้องการใช้ --ignore-node-status ให้ระบุโหนดที่ล้มเหลวดังนี้

    tsm stop --ignore-node-status <nodeID>

    ตัวอย่างเช่น หากโหนด 3 ล้มเหลว ให้เรียกใช้คำสั่งต่อไปนี้

    tsm stop --ignore-node-status node3
  3. กำหนดกระบวนการหลักที่เรียกใช้อยู่บนโหนด

    • หากโหนดที่ล้มเหลวกำลังเรียกใช้บริการส่งข้อความ คุณต้องลบบริการออกจากโหนดที่ล้มเหลวและเพิ่มไปยังโหนดที่ใช้งานได้

      ลบออกจากโหนดที่ล้มเหลว

      tsm topology set-process -pr activemqserver -n <nodeID> -c 0
      

      เพิ่มไปยังโหนดที่ใช้งานได้

      tsm topology set-process -pr activemqserver -n <nodeID> -c 1
    • หากโหนดที่ล้มเหลวกำลังเรียกใช้บริการรวม คุณต้องปรับใช้ชุดใหม่ก่อนจึงจะสามารถลบโหนดได้

      tsm topology deploy-coordination-service -n <good_nodeID> --ignore-node-status <failed_nodeID>
      
    • หากโหนดที่ล้มเหลวกำลังเรียกใช้อินสแตนซ์เดียวของบริการไฟล์ไคลเอ็นต์ (CFS) คุณต้องกำหนดค่าอินสแตนซ์ใหม่ของ CFS บนโหนดที่ใช้งานได้ เราขอแนะนำให้คุณกำหนดค่า CFS บนทุกโหนดที่กำลังเรียกใช้บริการรวม สำหรับขั้นตอนโดยละเอียด โปรดดูกำหนดค่าบริการไฟล์ไคลเอ็นต์

    • หากโหนดที่ล้มเหลวกำลังเรียกใช้ที่จัดเก็บไฟล์ คุณต้องบังคับให้เลิกใช้ที่จัดเก็บไฟล์และลบออกก่อนจึงจะสามารถลบโหนดได้

      tsm topology filestore decommission -n <nodeID> --delete-filestore

      ใช้การเปลี่ยนแปลงที่รอดำเนินการ (ใช้ตัวเลือก --ignore-warnings หากคุณมีโหนดคลัสเตอร์สามโหนดและอินสแตนซ์ของบริการรวมเดียว)

      tsm pending-changes apply --ignore-warnings --ignore-node-status <nodeID>
  4. หากคลัสเตอร์เป็นคลัสเตอร์สามโหนดและมีที่เก็บบนโหนดที่ทำงานอยู่ที่เหลืออยู่ คุณต้องลบที่เก็บหนึ่งที่เก็บ หรือเพิ่มโหนดใหม่ เนื่องจากคุณถูกจำกัดไว้เพียงอินสแตนซ์เดียวของที่เก็บ เมื่อคุณมีโหนดน้อยกว่าสามโหนด

    หากต้องการลบที่เก็บหนึ่งรายการ

    tsm topology set-process -n <nodeID> -pr pgsql -c 0
  5. เรียกใช้คำสั่งเพื่อลบโหนดที่ล้มเหลว สิ่งนี้จะเพิ่มการเปลี่ยนแปลงในรายการการเปลี่ยนแปลงที่รอดำเนินการ

    tsm topology remove-nodes -n <nodeID>
  6. ตรวจสอบว่ามีการรอการนำโหนดออก

    tsm pending-changes list
  7. ใช้การเปลี่ยนแปลงที่รอดำเนินการเพื่อลบโหนด

    tsm pending-changes apply 
  8. เริ่มต้น Tableau Server:

    tsm start
  9. ติดตั้ง Tableau Server บนโหนดใหม่และกำหนดค่าโหนดด้วยกระบวนการที่โหนดเก่าที่ล้มเหลวทำงานอยู่

  10. ในคอมพิวเตอร์เครื่องใหม่หรือในคอมพิวเตอร์เครื่องเดิมหลังจากลบ Tableau ออกแล้ว ให้ติดตั้ง Tableau โดยใช้โปรแกรมติดตั้งเดิมและไฟล์ Bootstrap ที่สร้างจากโหนดเริ่มต้น สำหรับรายละเอียดเกี่ยวกับวิธีการทำเช่นนี้ โปรดดูติดตั้งและกำหนดค่าโหนดเพิ่มเติม

    แนวทางปฏิบัติที่ดีที่สุดคือการกำหนดค่ากระบวนการที่คุณสูญเสียไปเมื่อโหนดดั้งเดิมล้มเหลว เพื่อให้แน่ใจว่าคลัสเตอร์ของคุณมีอยู่มากมายเต็มเปี่ยม

  11. นอกจากนี้คุณยังควรปรับใช้ชุดบริการรวมใหม่อีกครั้ง เมื่อมีโหนดที่ทำงานในแบบที่คุณต้องการ ดูรายละเอียดที่หัวข้อปรับใช้ชุดบริการรวม

  12. สุดท้ายนี้ หากคุณยังไม่ได้ดำเนินการ ให้เพิ่มอินสแตนซ์ของ CFS ไปยังทุกโหนดที่เรียกใช้บริการรวม หากต้องการข้อมูลเพิ่มเติม โปรดดู กำหนดค่าบริการไฟล์ไคลเอ็นต์