กู้คืนจากโหนดเริ่มต้นที่ล้มเหลว

คอมพิวเตอร์เครื่องแรกที่ติดตั้ง Tableau บน “โหนดเริ่มต้น” มีลักษณะบางอย่างที่เป็นเอกลักษณ์ มีเพียงสามกระบวนการที่ทำงานเฉพาะบนโหนดเริ่มต้นเท่านั้นและไม่สามารถย้ายไปยังโหนดอื่นได้ยกเว้นในสถานการณ์ที่ล้มเหลว ได้แก่ บริการใบอนุญาต (เครื่องมือจัดการใบอนุญาต) บริการการเปิดใช้งาน และตัวควบคุม TSM (ตัวควบคุมการดูแลระบบ) Tableau Server มีสคริปต์ที่ทำให้การย้ายกระบวนการเหล่านี้ไปยังโหนดอื่นๆ ที่มีอยู่เป็นแบบอัตโนมัติ คุณจึงสามารถรับสิทธิ์เข้าถึงอย่างสมบูรณ์กลับไปยัง TSM และทำให้ Tableau Server ยังคงทำงานต่อไปได้

ในช่วงแรก กระบวนการอื่นอีกสองรายการจะรวมอยู่บนโหนดเริ่มต้น แต่สามารถเพิ่มหรือย้ายไปยังโหนดเพิ่มเติม, CFS (บริการไฟล์ไคลเอ็นต์) และบริการรวมได้ คุณอาจยังต้องทำตามขั้นตอนเพื่อปรับใช้กระบวนการเหล่านี้อีกครั้ง โดยขึ้นอยู่กับวิธีกำหนดค่าการติดตั้งด้วย CFS และบริการรวม

หากโหนดเริ่มต้นล้มเหลว

หากมีปัญหากับโหนดเริ่มต้นและคุณมีกระบวนการซ้ำซ้อนบนโหนดอื่นๆ เราไม่รับประกันว่า Tableau Server จะยังคงทำงานต่อ

  • Tableau Server สามารถทำงานต่อไปได้นานถึง 72 ชั่วโมงหลังจากที่โหนดเริ่มต้นหยุดทำงาน ก่อนที่บริการให้สิทธิ์อนุญาตจะส่งผลต่อกระบวนการอื่นๆ หากเป็นเช่นนั้น ผู้ใช้อาจดำเนินการเข้าสู่ระบบ ดู และใช้เนื้อหาต่อได้หลังจากที่โหนดเริ่มต้นล้มเหลว แต่คุณจะไม่สามารถกำหนดค่า Tableau Server อีกครั้งได้เนื่องจากคุณจะไม่มีสิทธิ์เข้าถึงตัวควบคุมการดูแลระบบ
  • หากคุณใช้ Tableau Server เวอร์ชัน 2021.4.2 (หรือเก่ากว่า) ที่กำหนดค่าสำหรับ ATR ปัญหาเกี่ยวกับโหนดเริ่มต้นจะทำให้ฟังก์ชันเซิร์ฟเวอร์ทั้งหมดใช้งานไม่ได้ สิ่งนี้เป็นจริงไม่ว่าโหนดจะมีปัญหาเองหรือคุณหยุดการทำงานของโหนดนั้นโดยตั้งใจ (เช่น การแพตช์ในระดับระบบ)

แม้ว่าจะมีการกำหนดค่ากระบวนการซ้ำซ้อนเอาไว้ แต่ก็เป็นไปได้ว่า Tableau Server อาจหยุดทำงานหลังจากที่โหนดเริ่มต้นหยุดทำงาน ซึ่งอาจเป็นไปได้แม้ว่าจะกำหนดค่าการติดตั้งให้มีความพร้อมใช้งานสูง จึงหมายความว่าคุณควรย้ายกระบวนการที่ไม่ซ้ำกันทั้งสองกระบวนการไปยังโหนดอื่นที่ทำงานอยู่โดยเร็วที่สุด หากโหนดเริ่มต้นของคุณหยุดทำงานด้วยเหตุผลที่สามารถกู้คืนได้ในระยะเวลาอันสั้น (เช่น การหยุดทำงานของฮาร์ดแวร์ที่คุณสามารถแก้ไขได้) คุณไม่ควรใช้ขั้นตอนด้านล่างนี้เพื่อทำให้โหนดกลับมาทำงานอีกครั้ง

หมายเหตุ: ขั้นตอนในบทความนี้กำหนดให้ต้องหยุดการทำงานของเซิร์ฟเวอร์ชั่วคราวซึ่งอาจสร้างผลกระทบได้ และควรใช้เฉพาะในกรณีที่โหนดเริ่มต้นล้มเหลวอย่างรุนแรงเท่านั้น หากคุณไม่สามารถทำให้โหนดเริ่มต้นกลับมาทำงานอีกครั้งได้ ให้ทำตามขั้นตอนเหล่านี้เพื่อย้ายการดำเนินการของ TSM หลักไปยังโหนดอื่นในคลัสเตอร์ของคุณ

ข้อกำหนดทั่วไป

เวอร์ชัน 2021.1 ของ Tableau Server ได้รับการอัปเดตแล้ว พร้อมฟังก์ชันการกู้คืนที่ปรับปรุงดีขึ้น ขั้นตอนในหัวข้อนี้ได้จัดทำขึ้นสำหรับ Tableau Server 2021.1

หากคุณกำลังพยายามกู้คืนโหนดที่ล้มเหลวจาก Tableau Server เวอร์ชันก่อนหน้านี้ คุณจะต้องปฏิบัติตามขั้นตอนของเวอร์ชันดังกล่าว หากต้องการดูเวอร์ชันที่เก็บถาวรของความช่วยเหลือจาก Tableau โปรดดูที่ ความช่วยเหลือจาก Tableau(ลิงก์จะเปิดในหน้าต่างใหม่)

  • ในการตั้งค่าการติดตั้ง Tableau Server ในหลายโหนด คุณควรปรับใช้ชุดบริการรวมเสียก่อน กระบวนการด้านล่างนี้จะถือว่าได้มีการปรับใช้บริการรวมไว้แล้วก่อนที่โหนดเริ่มต้นจะมีปัญหา หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับการปรับใช้ชุดบริการรวม โปรดดู ปรับใช้ชุดบริการรวม
  • กระบวนการนี้จะถือว่าคุณได้กำหนดค่าอินสแตนซ์ของ Client File Service (CFS) ไว้แล้วในทุกโหนดที่เรียกใช้บริการรวม หากคุณไม่ได้เพิ่มอินสแตนซ์ของ CFS เสริมเอาไว้ อินสแตนซ์เดียวที่คุณมีจะอยู่ในโหนดเริ่มต้น และคุณจะต้องเพิ่มอย่างน้อยหนึ่งอินสแตนซ์ของ CFS ไปยังโหนดอื่น คุณจะต้องสร้างไฟล์ CFS ซ้ำด้วยเช่นกัน Tableau Server กำหนดให้ต้องมีอินสแตนซ์ของ CFS อย่างน้อยหนึ่งอินสแตนซ์ หากต้องการข้อมูลเพิ่มเติม โปรดดู กำหนดค่าบริการไฟล์ไคลเอ็นต์ และ บริการไฟล์ไคลเอ็นต์ของ Tableau Server

หมายเหตุ: การดำเนินการนี้รวมขั้นตอนที่คุณอาจต้องดำเนินการโดยใช้บรรทัดคำสั่ง TSM หากต้องการใช้ TSM CLI คุณต้องมีการเข้าถึงสำหรับผู้ดูแลระบบเพื่อไปยังบรรทัดคำสั่งบนโหนดใดโหนดหนึ่งในการติดตั้งของคุณและต้องมีการเข้ารหัสของผู้ดูแลระบบ TSM เพื่อเรียกใช้คำสั่ง TSM

ย้ายตัวควบคุมการดูแลระบบ TSM, บริการใบอนุญาต และบริการเปิดใช้งานไปยังโหนดอื่น

หากมีปัญหาเกิดขึ้นกับโหนดเริ่มต้น คุณจะต้องเริ่มย้ายตัวควบคุมการดูแลระบบ TSM, บริการให้สิทธิ์อนุญาต และบริการเปิดใช้งานไปยังโหนดอื่น ทำตามขั้นตอนเหล่านี้เพื่อใช้สคริปต์ move-tsm-controller และทำให้ตัวควบคุมการดูแลระบบ TSM, บริการให้สิทธิ์อนุญาต และบริการเปิดใช้งานสามารถทำงานได้ในโหนดอื่น

  1. เรียกใช้สคริปต์การกู้คืนตัวควบคุมบนโหนดที่ยังคงทำงาน วิธีทำคือให้เปิดข้อความแจ้งคำสั่ง แล้วไปที่ไดเรกทอรีสคริปต์ Tableau Server (ตามค่าเริ่มต้น:C:\Program Files\Tableau\Tableau Server\packages\scripts.<version_code>\ ) จากนั้นพิมพ์คำสั่งต่อไปนี้:

    move-tsm-controller -n <nodeID>

    ในที่นี้ "nodeID" คือ ID สำหรับโหนดที่คุณต้องการย้ายตัวควบคุมการดูแลระบบ TSM เข้าไปทำงาน ตัวอย่าง:

    move-tsm-controller -n node2

  2. ปิดแล้วเปิดหน้าต่างคำสั่งอีกครั้ง จากนั้นยืนยันว่าตัวควบคุมการดูแลระบบกำลังทำงานอยู่บนโหนดด้วยการพิมพ์คำสั่งนี้:

    tsm status -v

  3. หยุด Tableau Server

    ส่วนที่เหลือของกระบวนการนี้รวมคำสั่งบางอย่างไว้ในตัวเลือก --ignore-node-status เมื่อเรียกใช้คำสั่งกับตัวเลือก --ignore-node-status คำสั่งดังกล่าวจะทำงานโดยไม่คำนึงถึงสถานะของโหนดที่ระบุ หากต้องการใช้ --ignore-node-status ให้ระบุโหนดที่ล้มเหลวดังนี้

    tsm stop --ignore-node-status <nodeID>

    ตัวอย่างเช่น หาก node1 ล้มเหลว ให้เรียกใช้คำสั่งต่อไปนี้

    tsm stop --ignore-node-status node1

  4. เพิ่มบริการใบอนุญาตไปยังโหนด:

    tsm topology set-process -pr licenseservice -n <nodeID> -c 1

  5. ลบบริการใบอนุญาตเก่าออกจากโหนดเดิม โดยในที่นี้ “nodeID” หมายถึงโหนดเริ่มต้นที่ล้มเหลว:

    tsm topology set-process -pr licenseservice -n <nodeID> -c 0

  6. หากคุณใช้เวอร์ชันใดเวอร์ชันหนึ่งต่อไปนี้

    • 2023.3.0 ขึ้นไป

    • 2023.1.3 ขึ้นไป

    • 2022.3.7 ขึ้นไป

    • 2022.1.15 ขึ้นไป

    หรือคุณใช้งานเวอร์ชันก่อนหน้าและใช้ ATR ให้เพิ่มบริการเปิดใช้งานไปยังโหนดใหม่:

    tsm topology set-process -pr activationservice -n <nodeID> -c 1

  7. หากคุณใช้เวอร์ชันใดเวอร์ชันหนึ่งต่อไปนี้หรือใหม่กว่า

    • 2023.3.0 ขึ้นไป

    • 2023.1.3 ขึ้นไป

    • 2022.3.7 ขึ้นไป

    • 2022.1.15 ขึ้นไป

    หรือหากคุณใช้เวอร์ชันก่อนหน้าและใช้ ATR ให้ลบบริการเปิดใช้งานเก่าออกจากโหนดเดิม โดยในที่นี้ “nodeID” หมายถึงโหนดเริ่มต้นที่ล้มเหลว:

    tsm topology set-process -pr activationservice -n <nodeID> -c 0

    สำคัญ: ในคลัสเตอร์ หากโหนดที่เรียกใช้อินสแตนซ์เดียวของ CFS ของคุณล้มเหลว ไฟล์ใดๆ ที่ได้รับการจัดการโดย CFS จะสูญหาย และคุณจะต้องสร้างไฟล์ CFS ซ้ำโดยการนำเข้าใบรับรองและภาพที่กำหนดเองอีกครั้ง และทำการเปลี่ยนแปลงการกำหนดค่าที่เกี่ยวข้องดูรายการไฟล์ที่จัดการโดย CFS ได้ที่ บริการไฟล์ไคลเอ็นต์ของ Tableau Server

  8. หากโหนดเริ่มต้นเรียกใช้บริการส่งข้อความ อยู่ ให้เพิ่มบริการส่งข้อความดังกล่าวไปยังโหนดนี้:

    tsm topology set-process -pr activemqserver -n node2 -c 1

  9. (ไม่บังคับ) นอกจากนี้คุณสามารถเพิ่มการดำเนินการอื่นๆ ที่ทำงานอยู่ในโหนดเริ่มต้นแต่ไม่ได้ทำงานอยู่ในโหนดนี้ได้อีกด้วย ตัวอย่างเช่น วิธีเพิ่มเซิร์ฟเวอร์แคช:

    tsm topology set-process -pr cacheserver -n node2 -c 1

  10. ปรับใช้การเปลี่ยนแปลง:

    tsm pending-changes apply --ignore-node-status <nodeID>

    หากการเปลี่ยนแปลงที่รอดำเนินการจำเป็นต้องรีสตาร์ทเซิร์ฟเวอร์ คำสั่ง pending-changes apply จะแสดงข้อความแจ้งเพื่อแจ้งให้คุณทราบว่าจะรีสตาร์ท โดยข้อความแจ้งนี้จะปรากฏขึ้นแม้ว่าเซิร์ฟเวอร์จะหยุดทำงาน แต่ในกรณีนี้จะไม่มีการรีสตาร์ท คุณสามารถระงับข้อความแจ้งได้โดยใช้ตัวเลือก --ignore-prompt แต่การดำเนินการนี้จะไม่เปลี่ยนลักษณะการรีสตาร์ท หากการเปลี่ยนแปลงไม่จำเป็นต้องใช้การรีสตาร์ท ระบบจะปรับใช้การเปลี่ยนแปลงนั้นโดยไม่มีข้อความแจ้ง หากต้องการข้อมูลเพิ่มเติม โปรดดู tsm pending-changes apply

  11. รีสตาร์ทตัวควบคุมการดูแลระบบ TSM ดังนี้

    net stop tabadmincontroller_0

    net start tabadmincontroller_0

    หมายเหตุ: คุณต้องเรียกใช้คำสั่งเหล่านี้ในฐานะผู้ดูแลระบบจากข้อความแจ้งคำสั่ง คุณอาจจำเป็นต้องเรียกใช้ในโฟลเดอร์ C:\Windows\System32 ทั้งนี้ขึ้นอยู่กับวิธีกำหนดค่าของคอมพิวเตอร์คุณ

    หมายเหตุ: การรีสตาร์ท tabadmincontroller อาจใช้เวลาสักครู่ หากคุณพยายามปรับใช้การเปลี่ยนแปลงที่รอดำเนินการในขั้นตอนถัดไปก่อนที่ตัวควบคุมจะรีสตาร์ทอย่างสมบูรณ์ TSM จะไม่สามารถเชื่อมต่อกับตัวควบคุมได้ คุณสามารถตรวจสอบว่าตัวควบคุมกำลังทำงานอยู่หรือไม่โดยใช้คำสั่ง tsm status -v ตัวควบคุมการดูแลระบบ Tableau Server ควรจะแสดงเป็น "กำลังทำงาน"

  12. ปรับใช้การเปลี่ยนแปลงที่รอดำเนินการ (แม้ว่าอาจจะไม่มีการเปลี่ยนแปลงใดๆ เลย แต่ก็จำเป็นต้องทำขั้นตอนนี้):

    tsm pending-changes apply --ignore-node-status <nodeID>

  13. เปิดใช้งานใบอนุญาต Tableau Server ไปยังโหนดตัวควบคุมใหม่:

    tsm licenses activate -k <product-key>

  14. ตรวจสอบยืนยันว่าใบอนุญาตได้รับการเปิดใช้งานอย่างถูกต้อง:

    tsm licenses list

  15. หากก่อนหน้านี้โหนดเริ่มต้นทำงานอยู่ในบริการรวม คุณจะต้องปรับใช้ชุดบริการรวมใหม่ที่ไม่ได้รวมโหนดดังกล่าว หากคุณมีคลัสเตอร์แบบสามโหนด และบริการรวมทำงานอยู่ในโหนดเริ่มต้น คุณจะต้องปรับใช้ชุดบริการรวมใหม่แบบอินสแตนซ์เดียวบนโหนดอื่นและล้างข้อมูลทั้งหมดออกจากชุดเก่า ในตัวอย่างนี้ อินสแตนซ์เดียวของบริการรวมถูกปรับใช้ในโหนดที่สอง:

    tsm topology deploy-coordination-service -n node2 --ignore-node-status node1

  16. หากโหนดเริ่มต้นเรียกใช้งานอินสแตนซ์ File Store คุณจะต้องลบอินสแตนซ์ดังกล่าวออก:

    tsm topology filestore decommission -n <nodeID> --delete-filestore

    ในที่นี้ nodeID หมายถึงโหนดเริ่มต้นที่ล้มเหลว

  17. นำการเปลี่ยนแปลงที่รอดำเนินการมาใช้โดยใช้แฟล็ก --ignore-warnings หากชุดบริการรวมใหม่ที่คุณปรับใช้แล้วด้านบนคือชุดโหนดเดี่ยว

    tsm pending-changes apply --ignore-node-status node1 --ignore-warnings

  18. ลบโหนดเริ่มต้นออก โดยในที่นี้ nodeID หมายถึงโหนดเริ่มต้นที่ล้มเหลว

    tsm topology remove-nodes -n <nodeID>

  19. นำการเปลี่ยนแปลงที่รอดำเนินการมาใช้โดยใช้แฟล็ก --ignore-warnings หากชุดบริการรวมใหม่ที่คุณปรับใช้แล้วด้านบนคือชุดโหนดเดี่ยว

    tsm pending-changes apply --ignore-warnings

  20. เริ่มต้น Tableau Server

    tsm start

    ณ จุดนี้ เซิร์ฟเวอร์ของคุณควรที่จะเริ่มต้นทำงาน และคุณจะสามารถใช้ TSM เพื่อกำหนดค่าเซิร์ฟเวอร์ได้ ขั้นตอนถัดไปคือให้แทนที่โหนดเริ่มต้นของคุณเพื่อที่คลัสเตอร์ของคุณจะได้มีโหนดในจำนวนเดิม วิธีทำจะขึ้นอยู่กับว่าคุณต้องการนำโหนดที่ล้มเหลวกลับมาใช้ใหม่หรือไม่ เราขอแนะนำให้คุณนำโหนดเก่ามาใช้ใหม่เฉพาะเมื่อคุณต้องการค้นหาสาเหตุการเกิดความล้มเหลวและดำเนินขั้นตอนเพื่อป้องกันไม่ให้ล้มเหลวซ้ำอีก

  21. หากคุณวางแผนที่จะนำโหนดเดิมกลับมาใช้ใหม่ ก่อนอื่นคุณจะต้องลบ Tableau ออกจากโหนดนั้นให้หมด คุณสามารถทำได้ด้วยการเรียกใช้สคริปต์ tableau-server-obliterate หากต้องการรายละเอียดวิธีทำ โปรดดูลบ Tableau Server ออกจากคอมพิวเตอร์ของคุณ

  22. บนคอมพิวเตอร์เครื่องใหม่ที่ไม่เคยใช้มาก่อน หรือบนคอมพิวเตอร์เครื่องเดิมหลังจากที่ลบ Tableau ออกจนหมดแล้ว ให้ติดตั้ง Tableau โดยใช้โปรแกรมการตั้งค่าเดิมที่คุณเคยใช้และไฟล์ Bootstrap ที่สร้างจากโหนดซึ่งตอนนี้มีตัวควบคุมการดูแลระบบและบริการให้สิทธิ์อนุญาตทำงานอยู่ การทำเช่นนี้จะเป็นการสร้างโหนดใหม่ที่คุณสามารถกำหนดค่าแบบเป็นส่วนหนึ่งของคลัสเตอร์ของคุณได้ หากต้องการรายละเอียดเกี่ยวกับวิธีเพิ่มโหนด โปรดดูติดตั้งและกำหนดค่าโหนดเพิ่มเติม

    แนวทางปฏิบัติที่ดีที่สุดคือการกำหนดค่ากระบวนการที่คุณสูญเสียไปเมื่อโหนดดั้งเดิมล้มเหลว เพื่อให้แน่ใจว่าคลัสเตอร์ของคุณมีอยู่มากมายเต็มเปี่ยม แนะนำให้คุณย้ายการดำเนินการออกจากโหนดเริ่มต้นใหม่ไปยังโหนดเพิ่มเติมที่เพิ่มใหม่เพื่อคัดลอกการกำหนดค่าเดิมของคุณ ตัวอย่างเช่น หากโหนดเริ่มต้นของคุณเรียกใช้เฉพาะเกตเวย์และ File Store คุณควรกำหนดค่าโหนดเริ่มต้นใหม่ในแบบเดียวกัน

  23. นอกจากนี้คุณยังควรปรับใช้ชุดบริการรวมใหม่อีกครั้ง เมื่อมีโหนดที่ทำงานในแบบที่คุณต้องการ ดูรายละเอียดที่หัวข้อปรับใช้ชุดบริการรวม

  24. สุดท้ายนี้ หากคุณยังไม่ได้ดำเนินการ ให้เพิ่มอินสแตนซ์ของ CFS ไปยังทุกโหนดที่เรียกใช้บริการรวม หากต้องการข้อมูลเพิ่มเติม โปรดดู กำหนดค่าบริการไฟล์ไคลเอ็นต์

    ในคลัสเตอร์ หากโหนดที่เรียกใช้อินสแตนซ์เดียวของ CFS ของคุณล้มเหลว ไฟล์ใดๆ ที่ได้รับการจัดการโดย CFS จะสูญหาย และคุณจะต้องสร้างไฟล์ CFS ซ้ำโดยการนำเข้าใบรับรองและภาพที่กำหนดเองอีกครั้ง และทำการเปลี่ยนแปลงการกำหนดค่าที่เกี่ยวข้องดูรายการไฟล์ที่จัดการโดย CFS ที่หัวข้อบริการไฟล์ไคลเอ็นต์ของ Tableau Server

 

ขอบคุณสำหรับข้อเสนอแนะของคุณส่งข้อเสนอแนะของคุณเรียบร้อยแล้ว ขอขอบคุณ