Anonim

มันเริ่มในคืนวันเสาร์กับภรรยาของฉันถามว่าทำไม DVR ของเราหยุดเล่นรายการที่เธอดู ฉันบอกเธอว่ามันอาจจะเป็นแค่ความผิดพลาดบางอย่าง แต่ฉันจะดู ฉันเดินเข้าไปในห้องสำหรับครอบครัวเพื่อดูและข้อผิดพลาดโดยทั่วไประบุว่าดิสก์ต้นแบบไม่สามารถใช้ได้อีกต่อไป ไม่ดี! นี่เป็นจุดเริ่มต้นของเรื่องราวสยองขวัญสามวันของฉัน …

พื้นหลังเล็กน้อย

DVR ของฉันเป็นเพียงซอฟต์แวร์พิเศษ (SageTV สำหรับผู้ที่อยากรู้อยากเห็น) ที่ทำงานบนพีซี ซอฟต์แวร์มีความยืดหยุ่นสูงและให้คุณแยกแยะแง่มุมต่าง ๆ ทั้งหมดของมันได้ ฉันมีเครื่องแยกต่างหากสำหรับการควบคุมจากส่วนกลางการตั้งเวลาและการบันทึกเครื่องแยกต่างหากสำหรับการเล่นและดาวเด่นของเรื่องนี้ซึ่งเป็นเครื่องแยกต่างหากสำหรับการจัดเก็บ สำหรับที่เก็บข้อมูลฉันใช้เซิร์ฟเวอร์ไฟล์ Linux ใช้ LVM (Logical Volume Manager) เพื่อรวมไดรฟ์ที่แยกและไม่เหมือนกันจำนวนมากให้เป็นโลจิคัลไดรฟ์ขนาดใหญ่ (~ 6TB ปัจจุบัน) ที่ระบบปฏิบัติการเห็น เนื่องจากการสำรองข้อมูลหลาย TB นั้นใช้ไม่ได้และเนื่องจากข้อมูลดังกล่าวเป็นรายการทีวี“ เพียง” ปรัชญาการสำรองของฉันสำหรับสิ่งนี้ก็ไม่ได้สนใจ จนกระทั่งเหตุการณ์ล่าสุดปรัชญานี้ไม่ได้ถูกทดสอบโดยเหตุการณ์จริง

พยายามกู้คืนข้อมูล

เมื่อเห็นข้อผิดพลาดบนเครื่อง DVR ฉันเริ่มมองเซิร์ฟเวอร์จัดเก็บทันที ระบบไฟล์มีความเชื่องช้าและช้าในการตอบสนองดังนั้นฉันจึงสอบถาม LVM เกี่ยวกับสถานะของฟิสิคัลไดรฟ์ที่มีพื้นฐานของโลจิคัลวอลุ่ม หลังจากหน่วงเวลานานขึ้นมาและแจ้งว่าไดรฟ์ 750 GB หายไป เอ่อโอ้! ฉันรีบูตเซิร์ฟเวอร์และน่าอัศจรรย์ไดรฟ์กลับมา ฉันออกคำสั่ง pvmove เพื่อโอนย้ายข้อมูลทั้งหมดออกจากไดรฟ์นั้นโดยอัตโนมัติ แต่มันล้มเหลวอย่างสมบูรณ์น้อยกว่า 2%

ต้องเผชิญกับไดรฟ์ที่ไม่ให้ความร่วมมือกับการอ่านข้อมูล แต่อย่างน้อยก็ปรากฏในไบออสฉันหันไปใช้เครื่องมือกู้คืนไดรฟ์ที่ชื่นชอบ Spinrite แม้ว่าปกติแล้ว Spinrite จะบู๊ตจากสื่อที่ถอดออกได้ แต่เมื่อหลายปีก่อนฉันตั้งค่าการบูทเครือข่ายที่บ้านของฉันเพื่อรับค่าสาธารณูปโภคต่าง ๆ ดังนั้นฉันจึงไม่ต้องกังวลกับการติดตามสื่อใด ๆ โดยปกติฉันเพิ่งเชื่อมต่อกับเครือข่ายของฉันเลือกการบูตจากเครือข่ายและฉันมีเครื่องมือที่หลากหลายเพื่อกำจัดปัญหามากมาย ปัญหาคือเครื่องจักรที่ทำให้เวทมนต์ทั้งหมดนี้ทำงานเหมือนเครื่องจักรที่หยุดทำงานในปัจจุบัน ไม่มีเรื่องใหญ่ที่ฉันพูดฉันจะเพียงแค่บูตจากแผ่นซีดี Spinrite ยกเว้นเมื่อสองสามปีที่แล้วออปติคัลไดรฟ์ในไฟล์เซิร์ฟเวอร์ของฉันยอมแพ้ ในเวลาที่เกิดขึ้นฉันตัดสินใจตั้งแต่ฉันไม่เคยใช้สื่อออพติคัลในเครื่องนั้นฉันไม่จำเป็นต้องเปลี่ยนมัน ไม่ต้องกังวลฉันบอกตัวเองว่าฉันจะเอาออปติคัลไดรฟ์ออกจากคอมพิวเตอร์หลักของฉัน ฉันปิดเครื่องคอมพิวเตอร์หลักและนำออปติคัลไดรฟ์ออก จากนั้นฉันก็หาแผ่นซีดีบูตของ Spinrite หาไม่เจอ! เราย้ายเข้าบ้านใหม่ไม่กี่เดือนที่ผ่านมาดังนั้นทุกอย่างอยู่ในความระส่ำระสาย ฉันคิดว่าฉันจะเขียนสำเนาใหม่ แต่ฉันไม่สามารถหาสื่อแสงที่ว่างเปล่า! สำหรับแผนต่อไปแฟลชไดรฟ์ที่สามารถบู๊ตได้! หลังจากสองสามนาทีบน Google เพื่อรีเฟรชหน่วยความจำของฉันฉันมีแฟลชไดรฟ์ Spinrite ที่สามารถบู๊ตได้ ฉันบูตกล่องลินุกซ์ของฉันออกไปแล้วเปิด Spinrite คอมพิวเตอร์ค้างและดูเหมือนว่าจะมีปัญหา ฉันพยายามย้ายไดรฟ์ที่ไม่ดีออกจากการเสียบเข้ากับการ์ดเอ็กซ์แพนชัน PCI-e เป็นการเสียบเข้ากับเมนบอร์ดโดยตรง ตอนนี้ Spinrite เปิดตัวได้ดี แต่ใช้เวลานานและนานในการระบุไดรฟ์ที่เชื่อมต่อกับมัน ฉันถอดปลั๊กไดรฟ์อื่นทั้งหมดอย่างเป็นระบบยกเว้นไดรฟ์ที่ไม่ดี แต่ไม่เคยระบุไดรฟ์ให้เสร็จสมบูรณ์ไม่ว่าฉันจะรอนานแค่ไหนก็ตาม ไปสู่แผนต่อไป! ฉันนำไดรฟ์ออกจากกล่อง Linux ของฉันเชื่อมต่อกับคอมพิวเตอร์หลักของฉันและบูตจากแฟลชไดรฟ์ Spinrite ใหม่ของฉัน Spinrite เปิดตัวและดูไดรฟ์ทันทีและฉันบอกให้เริ่มกู้คืนข้อมูลพอใจว่าในที่สุดฉันก็กำลังดำเนินการอยู่ ฉันกลับไปตรวจสอบอีกครั้งหลังจากผ่านไป 10 นาทีและมีข้อผิดพลาดบนหน้าจอและดูเหมือนว่าไดรฟ์จะหายไปอีกครั้ง ผิดหวังฉันลองอีกสองสามครั้งและบอก Spinrite ให้เริ่มที่ส่วนต่าง ๆ ของไดรฟ์ แต่รับผลลัพธ์เดียวกันทุกครั้ง ดูเหมือนว่ามันจะไม่ช่วยฉันเลย

ด้วยความหวังอย่างไม่มีเหตุผลฉันวางไดรฟ์ไว้ในกล่อง Linux และเพิ่มพลังให้กับมัน เพื่อความประหลาดใจของฉันไดรฟ์ปรากฏขึ้นและ LVM ทำให้ทุกอย่างใช้งานได้ ลองเสี่ยงโชคอีกครั้งฉันออกคำสั่ง pvmove อีกครั้งเพื่อพยายามย้ายข้อมูลออกจากไดรฟ์อีกครั้ง ก่อนหน้านี้ฉันเห็นข้อความแสดงข้อผิดพลาดเกี่ยวกับการไม่สามารถอ่านจากไดรฟ์ได้ แต่น่าประหลาดใจที่ pvmove ยังคงก้าวหน้าต่อไปเรื่อย ๆ จนใกล้เสร็จสมบูรณ์ 100% ส่วนผสมของความสับสนโล่งอกและความตื่นเต้นก็ทำให้ฉัน ฉันจะหนีจากการบาดเจ็บนี้หรือไม่? น่าเศร้าสิ่งสุดท้ายที่ LVM ทำภายใต้ฝาครอบเพื่อทำความสะอาด pvmove ให้เสร็จสิ้นคือการเขียนบันทึกที่อัปเดตไปยังไดรฟ์ทั้งหมดภายใต้การควบคุมของมัน หลักสูตรนี้ล้มเหลวเมื่อพยายามเขียนไปยังไดรฟ์ที่ไม่ดีและทำให้กระบวนการทั้งหมดล้มเหลว เอาชนะความพ่ายแพ้จากกรามแห่งชัยชนะอีกครั้ง! ฉันดำน้ำกลับไปที่ Google และค้นพบว่าเป็นไปได้ที่จะควบคุมปริมาณข้อมูลที่คำสั่ง pvmove เคลื่อนย้ายแทนการย้ายข้อมูลทั้งหมดในนัดเดียว ฉันทดลองกับสิ่งนี้และประสบความสำเร็จอย่างดีในการเคลื่อนย้ายข้อมูลส่วนเล็ก ๆ ของฉันในแต่ละครั้ง ฉันโลภมากและไดรฟ์หายไปสองสามครั้ง แต่กลับมาตามหลังรอบการใช้พลังงานของคอมพิวเตอร์ จากการพิจารณาว่าอาจมีเพียงบางส่วนของไดรฟ์ที่ไม่ดีฉันเริ่มกระโดดไปรอบ ๆ แทนที่จะทำงานที่จุดเริ่มต้นของไดรฟ์ หลังจากทำซ้ำสองสามครั้งฉันมีทั้งหมดยกเว้น 40 GB จาก 750 GB อย่างปลอดภัยย้ายออกจากไดรฟ์ สำหรับ 40 GB ที่เหลือมันไม่สามารถเคลื่อนไหวได้ไม่ว่าฉันจะพยายามทำอะไร ตอนนี้มันเป็นตอนเย็นวันอาทิตย์และฉันก็หมดแรงดังนั้นฉันจึงตัดสินใจเข้านอนและจัดการปัญหานี้ให้มากขึ้นในวันถัดไป

วันรุ่งขึ้นหลังจากนอนหลับและครึ่งวันแรกของที่ทำงานฉันตัดสินใจที่จะกัดกระสุนเพราะฉันไม่สนใจรายการทีวีที่บันทึกไว้ 40 GB ล่าสุดและตั้งค่าเกี่ยวกับการลบไดรฟ์ออกจากการกำหนดค่า LVM ของฉัน . ฉันเคยทำมาหลายครั้งแล้วดังนั้นมันจึงค่อนข้างราบรื่น ถัดไปในรายการการล้างข้อมูลคือการซ่อมแซมรูที่อยู่ตรงกลางของระบบไฟล์ ฉันคิดเพียง 40 GB แทนที่จะเป็น 750 GB หายไปมันจะไม่เลวร้ายเกินไปใช่ไหม ไม่ถูกต้อง! หลังจากการซ่อมแซมฉันมีพื้นที่ว่างเพิ่มขึ้น 900 GB เมื่อเทียบกับก่อนเริ่มการทดสอบเพื่อที่จะได้ค่อนข้างต่อเนื่อง โอ้ฉันบอกตัวเองว่ามันเป็นแค่ทีวีอยู่ดี ในที่สุด DVR ของฉันก็ทำงานได้อีกครั้งหลังจากที่หายไปสามวันและในที่สุดฉันก็สามารถหยุดคิดเกี่ยวกับสิ่งนี้ได้ในทุก ๆ รอบของสมอง

บทเรียนที่ได้รับ

ดังนั้นฉันเรียนรู้อะไรจากทั้งหมดนี้ ฉันควรจะทำงานที่ดีขึ้นในสิ่งที่สำคัญจริงๆ เรื่องนี้เกิดขึ้นเมื่อไม่กี่สัปดาห์ที่ผ่านมาและในเวลานั้นฉันยังไม่ได้พลาดเนื้อหารายการทีวีใด ๆ ที่หายไป อย่างไรก็ตามฉันเสียใจที่ต้องป้องกันตัวเอง แต่ที่สำคัญกว่าครอบครัวของฉันคือสามารถใช้ทีวีเป็นเวลาสามวันและทำให้ตัวเองอยู่ในโหมดวิกฤติสูงสำหรับสามวันนั้น ถ้าฉันยอมแพ้ในการกู้คืนข้อมูลของฉันในตอนต้นฟังก์ชันจะได้รับการกู้คืนในเวลาประมาณหนึ่งชั่วโมงไม่ใช่สามวัน ฉันรู้ดีว่าเวลาส่วนใหญ่ข้อมูลของเรามีค่า แต่ในสถานการณ์เช่นนี้มันไม่ได้

ประการที่สองหากข้อมูลของคุณมีค่าจริงและ 99% ของเวลาที่เป็นจริงคุณต้องปกป้องมัน! สำรองข้อมูลของคุณไม่มีข้อแก้ตัว สำหรับข้อมูลของฉันที่ไม่สามารถถูกแทนที่ได้เช่นเดียวกับหลายพันภาพของลูกชายของฉันที่ฉันมีบนคอมพิวเตอร์ของฉันฉันแน่ใจว่าได้สำรองข้อมูลไว้ในที่ไม่น้อยกว่าสามแห่งซึ่งหนึ่งในนั้นเป็นผู้ให้บริการสำรองข้อมูลบนคลาวด์ สำหรับการจัดเก็บ DVR ฉันยังไม่คิดว่ามันเป็นเรื่องจริงที่จะสำรองไว้ในระบบคลาวด์ แต่ด้วยราคาของไดรฟ์ทุกวันนี้ฉันไม่มีข้อแก้ตัวใด ๆ ที่จะไม่ได้รับการปกป้องจาก RAID และนั่นคือสิ่งที่ฉัน กำลังจะทำ เมื่อฉันตั้งค่าคลัสเตอร์การจัดเก็บข้อมูลของฉันครั้งแรกเมื่อหลายปีก่อนฉันคิดว่ามันต้องใช้ไดรฟ์ 10 ตัวหรือมากกว่านั้นเพื่อไปที่พูลหลาย TB ฉันเพิ่งตรวจสอบราคาและคุณสามารถซื้อไดรฟ์ 3 TB ได้ในราคาต่ำกว่า $ 100 ฉันไม่มีข้อแก้ตัวในการปล่อยให้ข้อมูลของฉันไม่มีการป้องกันและหากข้อมูลสูญหายเช่นนี้เกิดขึ้นกับฉันอีกครั้งมันเป็นความผิดของตัวเองอย่างแท้จริง

เรื่องราวของความโศกเศร้าความยุ่งยากและการสูญเสียข้อมูล