TPA & Alibaba Cloud ผนึกกำลัง สร้างสรรค์สัมมนาและอบรม ต่อยอดความร่วมมือสู่อนาคต
เมื่อวันที่ 21 พฤศจิกายน ที่ผ่านมา คุณเซฟ พงษ์ศิริ นายก […]
ประเด็นสำคัญของแวดวงคลาวด์คือการให้บริการได้ต่อเนื่อง (availability) ซึ่งบางครั้งก็ไม่สามารถทำได้เพราะเหตุสุดวิสัยบางอย่าง ล่าสุด Google Compute Engine ในยุโรปต้องล่มไปเพราะเหตุ “ฟ้าผ่า”
เหตุเกิดที่ศูนย์ข้อมูลของกูเกิลในเมือง St. Ghislain ที่ประเทศเบลเยียม (ให้บริการโซน europe-west1-b) เกิดเหตุฟ้าผ่าที่โครงข่ายไฟฟ้าท้องถิ่น 4 ครั้งติดต่อกัน ทำให้ระบบไฟฟ้าของศูนย์ข้อมูลใช้งานไม่ได้ชั่วขณะ ระบบสตอเรจของกูเกิลมีแบตเตอรี่สำรองในตัว สามารถทำงานต่อได้ตามปกติ แต่มีสตอเรจส่วนน้อยที่กลับมีปัญหาแบตเตอรี่ไม่ทำงานจนล่มไป ซึ่งวิศวกรของกูเกิลสามารถแก้ไขให้กลับมาทำงานได้ในภายหลัง
ปัญหาคือข้อมูลที่กำลังถูกเขียนบนดิสก์ในจังหวะที่ระบบไฟล่มกลับหายไปด้วย และไม่สามารถกู้คืนได้ ถือเป็นปัญหา data loss ที่รุนแรง แม้ว่าจะมีสัดส่วนแค่ 0.000001% ของพื้นที่เก็บข้อมูลทั้งหมดก็ตาม
กูเกิลยอมรับว่าเป็นความรับผิดชอบของตัวเองที่ปล่อยให้เกิดปัญหานี้ และทยอยอัพเกรดระบบสตอเรจให้เป็นรุ่นที่ทนทานต่อปัญหาระบบไฟฟ้าล่มมากกว่าเดิม