ระบบคลาวด์ Google Compute Engine ในยุโรปล่ม เนื่องจากปัญหา "ฟ้าผ่า"

ระบบคลาวด์ Google Compute Engine ในยุโรปล่ม เนื่องจากปัญหา "ฟ้าผ่า"

ประเด็นสำคัญของแวดวงคลาวด์คือการให้บริการได้ต่อเนื่อง (availability) ซึ่งบางครั้งก็ไม่สามารถทำได้เพราะเหตุสุดวิสัยบางอย่าง ล่าสุด Google Compute Engine ในยุโรปต้องล่มไปเพราะเหตุ "ฟ้าผ่า"

เหตุเกิดที่ศูนย์ข้อมูลของกูเกิลในเมือง St. Ghislain ที่ประเทศเบลเยียม (ให้บริการโซน europe-west1-b) เกิดเหตุฟ้าผ่าที่โครงข่ายไฟฟ้าท้องถิ่น 4 ครั้งติดต่อกัน ทำให้ระบบไฟฟ้าของศูนย์ข้อมูลใช้งานไม่ได้ชั่วขณะ ระบบสตอเรจของกูเกิลมีแบตเตอรี่สำรองในตัว สามารถทำงานต่อได้ตามปกติ แต่มีสตอเรจส่วนน้อยที่กลับมีปัญหาแบตเตอรี่ไม่ทำงานจนล่มไป ซึ่งวิศวกรของกูเกิลสามารถแก้ไขให้กลับมาทำงานได้ในภายหลัง

ปัญหาคือข้อมูลที่กำลังถูกเขียนบนดิสก์ในจังหวะที่ระบบไฟล่มกลับหายไปด้วย และไม่สามารถกู้คืนได้ ถือเป็นปัญหา data loss ที่รุนแรง แม้ว่าจะมีสัดส่วนแค่ 0.000001% ของพื้นที่เก็บข้อมูลทั้งหมดก็ตาม

กูเกิลยอมรับว่าเป็นความรับผิดชอบของตัวเองที่ปล่อยให้เกิดปัญหานี้ และทยอยอัพเกรดระบบสตอเรจให้เป็นรุ่นที่ทนทานต่อปัญหาระบบไฟฟ้าล่มมากกว่าเดิม


Leave a comment!

You must be logged in to post a comment.