กู้คืนจากโหนดเริ่มต้นที่ล้มเหลว
คอมพิวเตอร์เครื่องแรกที่ติดตั้ง Tableau บน “โหนดเริ่มต้น” มีลักษณะบางอย่างที่เป็นเอกลักษณ์ มีเพียงสามกระบวนการที่ทำงานเฉพาะบนโหนดเริ่มต้นเท่านั้นและไม่สามารถย้ายไปยังโหนดอื่นได้ยกเว้นในสถานการณ์ที่ล้มเหลว ได้แก่ บริการใบอนุญาต (เครื่องมือจัดการใบอนุญาต) บริการการเปิดใช้งาน และตัวควบคุม TSM (ตัวควบคุมการดูแลระบบ) Tableau Server มีสคริปต์ที่ทำให้การย้ายกระบวนการเหล่านี้ไปยังโหนดอื่นๆ ที่มีอยู่เป็นแบบอัตโนมัติ คุณจึงสามารถรับสิทธิ์เข้าถึงอย่างสมบูรณ์กลับไปยัง TSM และทำให้ Tableau Server ยังคงทำงานต่อไปได้
ในช่วงแรก กระบวนการอื่นอีกสองรายการจะรวมอยู่บนโหนดเริ่มต้น แต่สามารถเพิ่มหรือย้ายไปยังโหนดเพิ่มเติม, CFS (บริการไฟล์ไคลเอ็นต์) และบริการรวมได้ คุณอาจยังต้องทำตามขั้นตอนเพื่อปรับใช้กระบวนการเหล่านี้อีกครั้ง โดยขึ้นอยู่กับวิธีกำหนดค่าการติดตั้งด้วย CFS และบริการรวม
หากโหนดเริ่มต้นล้มเหลว
หากมีปัญหากับโหนดเริ่มต้นและคุณมีกระบวนการซ้ำซ้อนบนโหนดอื่นๆ เราไม่รับประกันว่า Tableau Server จะยังคงทำงานต่อ
- Tableau Server สามารถทำงานต่อไปได้นานถึง 72 ชั่วโมงหลังจากที่โหนดเริ่มต้นหยุดทำงาน ก่อนที่บริการให้สิทธิ์อนุญาตจะส่งผลต่อกระบวนการอื่นๆ หากเป็นเช่นนั้น ผู้ใช้อาจดำเนินการเข้าสู่ระบบ ดู และใช้เนื้อหาต่อได้หลังจากที่โหนดเริ่มต้นล้มเหลว แต่คุณจะไม่สามารถกำหนดค่า Tableau Server อีกครั้งได้เนื่องจากคุณจะไม่มีสิทธิ์เข้าถึงตัวควบคุมการดูแลระบบ
- หากคุณใช้ Tableau Server เวอร์ชัน 2021.4.2 (หรือเก่ากว่า) ที่กำหนดค่าสำหรับ ATR ปัญหาเกี่ยวกับโหนดเริ่มต้นจะทำให้ฟังก์ชันเซิร์ฟเวอร์ทั้งหมดใช้งานไม่ได้ สิ่งนี้เป็นจริงไม่ว่าโหนดจะมีปัญหาเองหรือคุณหยุดการทำงานของโหนดนั้นโดยตั้งใจ (เช่น การแพตช์ในระดับระบบ)
แม้ว่าจะมีการกำหนดค่ากระบวนการซ้ำซ้อนเอาไว้ แต่ก็เป็นไปได้ว่า Tableau Server อาจหยุดทำงานหลังจากที่โหนดเริ่มต้นหยุดทำงาน ซึ่งอาจเป็นไปได้แม้ว่าจะกำหนดค่าการติดตั้งให้มีความพร้อมใช้งานสูง จึงหมายความว่าคุณควรย้ายกระบวนการที่ไม่ซ้ำกันทั้งสองกระบวนการไปยังโหนดอื่นที่ทำงานอยู่โดยเร็วที่สุด หากโหนดเริ่มต้นของคุณหยุดทำงานด้วยเหตุผลที่สามารถกู้คืนได้ในระยะเวลาอันสั้น (เช่น การหยุดทำงานของฮาร์ดแวร์ที่คุณสามารถแก้ไขได้) คุณไม่ควรใช้ขั้นตอนด้านล่างนี้เพื่อทำให้โหนดกลับมาทำงานอีกครั้ง
หมายเหตุ: ขั้นตอนในบทความนี้กำหนดให้ต้องหยุดการทำงานของเซิร์ฟเวอร์ชั่วคราวซึ่งอาจสร้างผลกระทบได้ และควรใช้เฉพาะในกรณีที่โหนดเริ่มต้นล้มเหลวอย่างรุนแรงเท่านั้น หากคุณไม่สามารถทำให้โหนดเริ่มต้นกลับมาทำงานอีกครั้งได้ ให้ทำตามขั้นตอนเหล่านี้เพื่อย้ายการดำเนินการของ TSM หลักไปยังโหนดอื่นในคลัสเตอร์ของคุณ
ข้อกำหนดทั่วไป
เวอร์ชัน 2021.1 ของ Tableau Server ได้รับการอัปเดตแล้ว พร้อมฟังก์ชันการกู้คืนที่ปรับปรุงดีขึ้น ขั้นตอนในหัวข้อนี้ได้จัดทำขึ้นสำหรับ Tableau Server 2021.1
หากคุณกำลังพยายามกู้คืนโหนดที่ล้มเหลวจาก Tableau Server เวอร์ชันก่อนหน้านี้ คุณจะต้องปฏิบัติตามขั้นตอนของเวอร์ชันดังกล่าว หากต้องการดูเวอร์ชันที่เก็บถาวรของความช่วยเหลือจาก Tableau โปรดดูที่ ความช่วยเหลือจาก Tableau(ลิงก์จะเปิดในหน้าต่างใหม่)
- ในการตั้งค่าการติดตั้ง Tableau Server ในหลายโหนด คุณควรปรับใช้ชุดบริการรวมเสียก่อน กระบวนการด้านล่างนี้จะถือว่าได้มีการปรับใช้บริการรวมไว้แล้วก่อนที่โหนดเริ่มต้นจะมีปัญหา หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับการปรับใช้ชุดบริการรวม โปรดดู ปรับใช้ชุดบริการรวม
- กระบวนการนี้จะถือว่าคุณได้กำหนดค่าอินสแตนซ์ของ Client File Service (CFS) ไว้แล้วในทุกโหนดที่เรียกใช้บริการรวม หากคุณไม่ได้เพิ่มอินสแตนซ์ของ CFS เสริมเอาไว้ อินสแตนซ์เดียวที่คุณมีจะอยู่ในโหนดเริ่มต้น และคุณจะต้องเพิ่มอย่างน้อยหนึ่งอินสแตนซ์ของ CFS ไปยังโหนดอื่น คุณจะต้องสร้างไฟล์ CFS ซ้ำด้วยเช่นกัน Tableau Server กำหนดให้ต้องมีอินสแตนซ์ของ CFS อย่างน้อยหนึ่งอินสแตนซ์ หากต้องการข้อมูลเพิ่มเติม โปรดดู กำหนดค่าบริการไฟล์ไคลเอ็นต์ และ บริการไฟล์ไคลเอ็นต์ของ Tableau Server
หมายเหตุ: การดำเนินการนี้รวมขั้นตอนที่คุณอาจต้องดำเนินการโดยใช้บรรทัดคำสั่ง TSM
ย้ายตัวควบคุมการดูแลระบบ TSM, บริการใบอนุญาต และบริการเปิดใช้งานไปยังโหนดอื่น
หากมีปัญหาเกิดขึ้นกับโหนดเริ่มต้น คุณจะต้องเริ่มย้ายตัวควบคุมการดูแลระบบ TSM, บริการให้สิทธิ์อนุญาต และบริการเปิดใช้งานไปยังโหนดอื่น ทำตามขั้นตอนเหล่านี้เพื่อใช้สคริปต์ move-tsm-controller
และทำให้ตัวควบคุมการดูแลระบบ TSM, บริการให้สิทธิ์อนุญาต และบริการเปิดใช้งานสามารถทำงานได้ในโหนดอื่น
เรียกใช้สคริปต์การกู้คืนตัวควบคุมบนโหนดที่ยังคงทำงาน วิธีทำคือให้เปิดข้อความแจ้งคำสั่ง แล้วไปที่ไดเรกทอรีสคริปต์ Tableau Server (ตามค่าเริ่มต้น:
C:\Program Files\Tableau\Tableau Server\packages\scripts.<version_code>\
) จากนั้นพิมพ์คำสั่งต่อไปนี้:move-tsm-controller -n <nodeID>
ในที่นี้ "nodeID" คือ ID สำหรับโหนดที่คุณต้องการย้ายตัวควบคุมการดูแลระบบ TSM เข้าไปทำงาน ตัวอย่าง:
move-tsm-controller -n node2
ปิดแล้วเปิดหน้าต่างคำสั่งอีกครั้ง จากนั้นยืนยันว่าตัวควบคุมการดูแลระบบกำลังทำงานอยู่บนโหนดด้วยการพิมพ์คำสั่งนี้:
tsm status -v
หยุด Tableau Server
ส่วนที่เหลือของกระบวนการนี้รวมคำสั่งบางอย่างไว้ในตัวเลือก
--ignore-node-status
เมื่อเรียกใช้คำสั่งกับตัวเลือก--ignore-node-status
คำสั่งดังกล่าวจะทำงานโดยไม่คำนึงถึงสถานะของโหนดที่ระบุ หากต้องการใช้--ignore-node-status
ให้ระบุโหนดที่ล้มเหลวดังนี้tsm stop --ignore-node-status <nodeID>
ตัวอย่างเช่น หาก node1 ล้มเหลว ให้เรียกใช้คำสั่งต่อไปนี้
tsm stop --ignore-node-status node1
เพิ่มบริการใบอนุญาตไปยังโหนด:
tsm topology set-process -pr licenseservice -n <nodeID> -c 1
ลบบริการใบอนุญาตเก่าออกจากโหนดเดิม โดยในที่นี้ “nodeID” หมายถึงโหนดเริ่มต้นที่ล้มเหลว:
tsm topology set-process -pr licenseservice -n <nodeID> -c 0
หากคุณใช้เวอร์ชันใดเวอร์ชันหนึ่งต่อไปนี้
2023.3.0 ขึ้นไป
2023.1.3 ขึ้นไป
2022.3.7 ขึ้นไป
2022.1.15 ขึ้นไป
หรือคุณใช้งานเวอร์ชันก่อนหน้าและใช้ ATR ให้เพิ่มบริการเปิดใช้งานไปยังโหนดใหม่:
tsm topology set-process -pr activationservice -n <nodeID> -c 1
หากคุณใช้เวอร์ชันใดเวอร์ชันหนึ่งต่อไปนี้หรือใหม่กว่า
2023.3.0 ขึ้นไป
2023.1.3 ขึ้นไป
2022.3.7 ขึ้นไป
2022.1.15 ขึ้นไป
หรือหากคุณใช้เวอร์ชันก่อนหน้าและใช้ ATR ให้ลบบริการเปิดใช้งานเก่าออกจากโหนดเดิม โดยในที่นี้ “nodeID” หมายถึงโหนดเริ่มต้นที่ล้มเหลว:
tsm topology set-process -pr activationservice -n <nodeID> -c 0
สำคัญ: ในคลัสเตอร์ หากโหนดที่เรียกใช้อินสแตนซ์เดียวของ CFS ของคุณล้มเหลว ไฟล์ใดๆ ที่ได้รับการจัดการโดย CFS จะสูญหาย และคุณจะต้องสร้างไฟล์ CFS ซ้ำโดยการนำเข้าใบรับรองและภาพที่กำหนดเองอีกครั้ง และทำการเปลี่ยนแปลงการกำหนดค่าที่เกี่ยวข้องดูรายการไฟล์ที่จัดการโดย CFS ได้ที่ บริการไฟล์ไคลเอ็นต์ของ Tableau Server
หากโหนดเริ่มต้นเรียกใช้บริการส่งข้อความ อยู่ ให้เพิ่มบริการส่งข้อความดังกล่าวไปยังโหนดนี้:
tsm topology set-process -pr activemqserver -n node2 -c 1
(ไม่บังคับ) นอกจากนี้คุณสามารถเพิ่มการดำเนินการอื่นๆ ที่ทำงานอยู่ในโหนดเริ่มต้นแต่ไม่ได้ทำงานอยู่ในโหนดนี้ได้อีกด้วย ตัวอย่างเช่น วิธีเพิ่มเซิร์ฟเวอร์แคช:
tsm topology set-process -pr cacheserver -n node2 -c 1
ปรับใช้การเปลี่ยนแปลง:
tsm pending-changes apply --ignore-node-status <nodeID>
หากการเปลี่ยนแปลงที่รอดำเนินการจำเป็นต้องรีสตาร์ทเซิร์ฟเวอร์ คำสั่ง
pending-changes apply
จะแสดงข้อความแจ้งเพื่อแจ้งให้คุณทราบว่าจะรีสตาร์ท โดยข้อความแจ้งนี้จะปรากฏขึ้นแม้ว่าเซิร์ฟเวอร์จะหยุดทำงาน แต่ในกรณีนี้จะไม่มีการรีสตาร์ท คุณสามารถระงับข้อความแจ้งได้โดยใช้ตัวเลือก--ignore-prompt
แต่การดำเนินการนี้จะไม่เปลี่ยนลักษณะการรีสตาร์ท หากการเปลี่ยนแปลงไม่จำเป็นต้องใช้การรีสตาร์ท ระบบจะปรับใช้การเปลี่ยนแปลงนั้นโดยไม่มีข้อความแจ้ง หากต้องการข้อมูลเพิ่มเติม โปรดดู tsm pending-changes applyรีสตาร์ทตัวควบคุมการดูแลระบบ TSM ดังนี้
net stop tabadmincontroller_0
net start tabadmincontroller_0
หมายเหตุ: คุณต้องเรียกใช้คำสั่งเหล่านี้ในฐานะผู้ดูแลระบบจากข้อความแจ้งคำสั่ง คุณอาจจำเป็นต้องเรียกใช้ในโฟลเดอร์
C:\Windows\System32
ทั้งนี้ขึ้นอยู่กับวิธีกำหนดค่าของคอมพิวเตอร์คุณหมายเหตุ: การรีสตาร์ท tabadmincontroller อาจใช้เวลาสักครู่ หากคุณพยายามปรับใช้การเปลี่ยนแปลงที่รอดำเนินการในขั้นตอนถัดไปก่อนที่ตัวควบคุมจะรีสตาร์ทอย่างสมบูรณ์ TSM จะไม่สามารถเชื่อมต่อกับตัวควบคุมได้ คุณสามารถตรวจสอบว่าตัวควบคุมกำลังทำงานอยู่หรือไม่โดยใช้คำสั่ง
tsm status -v
ตัวควบคุมการดูแลระบบ Tableau Server ควรจะแสดงเป็น "กำลังทำงาน"ปรับใช้การเปลี่ยนแปลงที่รอดำเนินการ (แม้ว่าอาจจะไม่มีการเปลี่ยนแปลงใดๆ เลย แต่ก็จำเป็นต้องทำขั้นตอนนี้):
tsm pending-changes apply --ignore-node-status <nodeID>
เปิดใช้งานใบอนุญาต Tableau Server ไปยังโหนดตัวควบคุมใหม่:
tsm licenses activate -k <product-key>
ตรวจสอบยืนยันว่าใบอนุญาตได้รับการเปิดใช้งานอย่างถูกต้อง:
tsm licenses list
หากก่อนหน้านี้โหนดเริ่มต้นทำงานอยู่ในบริการรวม คุณจะต้องปรับใช้ชุดบริการรวมใหม่ที่ไม่ได้รวมโหนดดังกล่าว หากคุณมีคลัสเตอร์แบบสามโหนด และบริการรวมทำงานอยู่ในโหนดเริ่มต้น คุณจะต้องปรับใช้ชุดบริการรวมใหม่แบบอินสแตนซ์เดียวบนโหนดอื่นและล้างข้อมูลทั้งหมดออกจากชุดเก่า ในตัวอย่างนี้ อินสแตนซ์เดียวของบริการรวมถูกปรับใช้ในโหนดที่สอง:
tsm topology deploy-coordination-service -n node2 --ignore-node-status node1
หากโหนดเริ่มต้นเรียกใช้งานอินสแตนซ์ File Store คุณจะต้องลบอินสแตนซ์ดังกล่าวออก:
tsm topology filestore decommission -n <nodeID> --delete-filestore
ในที่นี้
nodeID
หมายถึงโหนดเริ่มต้นที่ล้มเหลวนำการเปลี่ยนแปลงที่รอดำเนินการมาใช้โดยใช้แฟล็ก
--ignore-warnings
หากชุดบริการรวมใหม่ที่คุณปรับใช้แล้วด้านบนคือชุดโหนดเดี่ยวtsm pending-changes apply --ignore-node-status node1 --ignore-warnings
ลบโหนดเริ่มต้นออก โดยในที่นี้
nodeID
หมายถึงโหนดเริ่มต้นที่ล้มเหลวtsm topology remove-nodes -n <nodeID>
นำการเปลี่ยนแปลงที่รอดำเนินการมาใช้โดยใช้แฟล็ก
--ignore-warnings
หากชุดบริการรวมใหม่ที่คุณปรับใช้แล้วด้านบนคือชุดโหนดเดี่ยวtsm pending-changes apply --ignore-warnings
เริ่มต้น Tableau Server
tsm start
ณ จุดนี้ เซิร์ฟเวอร์ของคุณควรที่จะเริ่มต้นทำงาน และคุณจะสามารถใช้ TSM เพื่อกำหนดค่าเซิร์ฟเวอร์ได้ ขั้นตอนถัดไปคือให้แทนที่โหนดเริ่มต้นของคุณเพื่อที่คลัสเตอร์ของคุณจะได้มีโหนดในจำนวนเดิม วิธีทำจะขึ้นอยู่กับว่าคุณต้องการนำโหนดที่ล้มเหลวกลับมาใช้ใหม่หรือไม่ เราขอแนะนำให้คุณนำโหนดเก่ามาใช้ใหม่เฉพาะเมื่อคุณต้องการค้นหาสาเหตุการเกิดความล้มเหลวและดำเนินขั้นตอนเพื่อป้องกันไม่ให้ล้มเหลวซ้ำอีก
หากคุณวางแผนที่จะนำโหนดเดิมกลับมาใช้ใหม่ ก่อนอื่นคุณจะต้องลบ Tableau ออกจากโหนดนั้นให้หมด คุณสามารถทำได้ด้วยการเรียกใช้สคริปต์
tableau-server-obliterate
หากต้องการรายละเอียดวิธีทำ โปรดดูลบ Tableau Server ออกจากคอมพิวเตอร์ของคุณบนคอมพิวเตอร์เครื่องใหม่ที่ไม่เคยใช้มาก่อน หรือบนคอมพิวเตอร์เครื่องเดิมหลังจากที่ลบ Tableau ออกจนหมดแล้ว ให้ติดตั้ง Tableau โดยใช้โปรแกรมการตั้งค่าเดิมที่คุณเคยใช้และไฟล์ Bootstrap ที่สร้างจากโหนดซึ่งตอนนี้มีตัวควบคุมการดูแลระบบและบริการให้สิทธิ์อนุญาตทำงานอยู่ การทำเช่นนี้จะเป็นการสร้างโหนดใหม่ที่คุณสามารถกำหนดค่าแบบเป็นส่วนหนึ่งของคลัสเตอร์ของคุณได้ หากต้องการรายละเอียดเกี่ยวกับวิธีเพิ่มโหนด โปรดดูติดตั้งและกำหนดค่าโหนดเพิ่มเติม
แนวทางปฏิบัติที่ดีที่สุดคือการกำหนดค่ากระบวนการที่คุณสูญเสียไปเมื่อโหนดดั้งเดิมล้มเหลว เพื่อให้แน่ใจว่าคลัสเตอร์ของคุณมีอยู่มากมายเต็มเปี่ยม แนะนำให้คุณย้ายการดำเนินการออกจากโหนดเริ่มต้นใหม่ไปยังโหนดเพิ่มเติมที่เพิ่มใหม่เพื่อคัดลอกการกำหนดค่าเดิมของคุณ ตัวอย่างเช่น หากโหนดเริ่มต้นของคุณเรียกใช้เฉพาะเกตเวย์และ File Store คุณควรกำหนดค่าโหนดเริ่มต้นใหม่ในแบบเดียวกัน
นอกจากนี้คุณยังควรปรับใช้ชุดบริการรวมใหม่อีกครั้ง เมื่อมีโหนดที่ทำงานในแบบที่คุณต้องการ ดูรายละเอียดที่หัวข้อปรับใช้ชุดบริการรวม
สุดท้ายนี้ หากคุณยังไม่ได้ดำเนินการ ให้เพิ่มอินสแตนซ์ของ CFS ไปยังทุกโหนดที่เรียกใช้บริการรวม หากต้องการข้อมูลเพิ่มเติม โปรดดู กำหนดค่าบริการไฟล์ไคลเอ็นต์
ในคลัสเตอร์ หากโหนดที่เรียกใช้อินสแตนซ์เดียวของ CFS ของคุณล้มเหลว ไฟล์ใดๆ ที่ได้รับการจัดการโดย CFS จะสูญหาย และคุณจะต้องสร้างไฟล์ CFS ซ้ำโดยการนำเข้าใบรับรองและภาพที่กำหนดเองอีกครั้ง และทำการเปลี่ยนแปลงการกำหนดค่าที่เกี่ยวข้องดูรายการไฟล์ที่จัดการโดย CFS ที่หัวข้อบริการไฟล์ไคลเอ็นต์ของ Tableau Server