ทำไมตึก กสท บางรัก ไฟดับแล้วทำให้ระบบเน็ตป่วนทั้งประเทศ

ทำไมตึก กสท บางรัก ไฟดับแล้วทำให้ระบบเน็ตป่วนทั้งประเทศ
Blognone

สนับสนุนเนื้อหา

ทำไมตึก กสท บางรัก ไฟดับแล้วทำให้ระบบเน็ตป่วนทั้งประเทศ

อาคาร กสท บางรัก (อาคาร 30 ชั้นติดริมแม่น้ำเจ้าพระยา) เป็นอาคารโทรคมนาคม และเครือข่ายที่ใหญ่ที่สุดในประเทศไทย ภายในประกอบด้วย

  • บริษัท Internet Data Center เปิดพื้นที่ให้บริการรับฝากวางเครื่องเซิร์ฟเวอร์ และให้บริการเชื่อมต่อโครงข่ายอินเทอร์เน็ตไปพร้อมๆ กัน
  • ศูนย์แลกเปลี่ยนเส้นทางอินเทอร์เน็ตภายในประเทศไทยหลัก ของ กสท (CAT NIX)
  • ศูนย์แลกเปลี่ยนเส้นทางอินเทอร์เน็ตต่างประเทศหลัก ของ กสท (CAT THIX หรือเรียกอีกชื่อว่า IIG)
  • ระบบการเชื่อมต่อการสื่อสารผ่านสายใยแก้วนำแสง (fiber optic) ของบริษัทโทรคมนาคม (ทั้งอินเทอร์เน็ต โทรศัพท์ และโทรศัพท์มือถือ) เกือบทุกรายในประเทศ
  • มหาวิทยาลัย ศูนย์การศึกษา สำนักงาน และส่วนพื้นที่ให้เช่าอื่นๆ (มีกระทั่งถ่ายทำละครในอาคารนี้ด้วยนะ!)

อาคารมีระบบสาธารณูปโภคพื้นฐานครบครันสำหรับการเปิดให้บริการศูนย์ข้อมูลระดับ 4 อยู่แล้ว ซึ่งมีข้อบังคับว่าจะต้องมี

  • ระบบไฟฟ้าหลัก จากอย่างน้อย 2 โรงไฟฟ้า
  • ระบบสำรองไฟฟ้า (UPS)
  • เครื่องปั่นไฟฟ้า
  • ระบบเชื่อมต่อเครือข่ายหลายเส้นทาง (Multiple uplinks) ผ่านสายเคเบิลใยแก้วนำแสง (Fiber optic cable) -- จากข้อมูลที่มี มีสายไฟเบอร์ลากมาที่ตึกนี้ไม่ต่ำกว่า 50 เส้น (ตัวเลขเป๊ะๆ ไม่เปิดเผย)

ในการนี้ก็มีผู้ให้บริการภายนอก ที่เชื่อมต่อผ่านมายัง CAT NIX/IIG ทั้งสองรายอยู่พอสมควร (ดูข้อมูลได้จาก แผนภาพอินเทอร์เน็ตประเทศไทย) โดยมีการเชื่อมต่อภายนอกที่สำคัญๆ ประมาณนี้ครับ (ข้อมูลเมื่อวันที่ 7 พฤศจิกายนที่ผ่านมาครับ)

  • ทรูอินเทอร์เน็ต เชื่อมต่อหา IIG 58.5Gbps (50%) ใช้เป็นเส้นทางหลักสำหรับให้บริการลูกค้าตามบ้านทั่วไป
  • Proen เชื่อมต่อไป TOT-NIX 10Gbps, TIG-DIX 5Gbps
  • Otaro เชื่อมต่อไป ทรูอินเทอร์เน็ต 10Gbps, TOT-NIX 20Gbps
  • ISSP เชื่อมต่อไป TIG-DIX 4Gbps
  • ISPIO เชื่อมต่อไป TIG-DIX 10Gbps, TOT-NIX 40Gbps

ข้อสังเกตใหญ่มากคือ ISP หลายรายไม่มีการเชื่อมต่อหากันโดยตรง หรือผ่านบริการ NIX รายอื่นเลย หลายรายยังคงพึ่งพา CAT NIX อยู่เป็นหลัก โดยมีเส้นทางผ่าน NIX รายอื่นเป็นเส้นทางสำรองขนาดเล็กเท่านั้น ดังเช่นต่อไปนี้ (ในกรอบสีแดงเป็นส่วนข้อมูลที่แสดงว่ามีการใช้งานผ่าน CAT NIX ครับ)

ภาพตัวอย่างการส่งข้อมูลจากทรูอินเทอร์เน็ต ไปยังเครือข่ายของ TOT ในสภาวะปกติ

ภาพตัวอย่างการส่งข้อมูลจาก 3BB ไปยังเครือข่ายของ TOT ในสภาวะปกติ

ส่วนการเชื่อมต่อภายในตึก เนื่องจากมีผู้ให้บริการศูนย์ข้อมูลอยู่หลายราย ทำให้แต่ละรายก็มีวิธี รูปแบบ ความจุ และความสามารถในการให้บริการแตกต่างกันออกไปแล้วแต่ผู้ให้บริการครับ

เมื่ออาคารนี้เป็นศูนย์รวมการเชื่อมต่อทั้งภายในประเทศและต่างประเทศ ทำให้เว็บไซต์ชื่อดังเป็นจำนวนมากเลือกที่จะเช่าพื้นที่วางเครื่องเซิร์ฟเวอร์ เพื่อให้ผู้ใช้งานสามารถเข้าใช้งานได้เร็วที่สุด เช่น dek-d.com, manager.co.th, voicetv.co.th รวมถึงระบบโทรคมนาคมของเครือข่ายโทรศัพท์มือถือหลายๆ เจ้า และระบบเครือข่ายอินเทอร์เน็ตของ CAT เองด้วย

ในสภาวะปกติทางอาคารมีการเตรียมพร้อมรับมือภัยพิบัติต่างๆ เช่น น้ำท่วม ไฟไหม้ หรือแม้กระทั่งเหตุการณ์อย่างสายไฟเบอร์ถูกตัด ตามมาตรฐานของศูนย์ข้อมูลชั้นนำทั่วไปอยู่แล้วครับ ซึ่งที่ผ่านมา (ไม่นับเหตุการณ์ที่บาง ISP ล่มเอง) ตัวอาคารเองก็ถือว่าสามารถให้บริการได้ตามมาตรฐานที่ควรจะเป็น แต่คงไม่ใช่เหตุการณ์ที่ "เครื่องปั่นไฟฟ้าถูกถอดวงจรแผงควบคุม" แน่นอน เมื่อกระแสไฟฟ้าถูกตัด ไฟฟ้าสำรองก็อยู่ได้ไม่นาน เครื่องปั่นไฟทำงานไม่ได้ ก็ทำให้อุปกรณ์ทั้งหมดดับลงไปครับ ส่วนผลกระทบที่เกิดขึ้นก็ประมาณนี้ครับ

  • ระบบอินเทอร์เน็ตภายในประเทศผ่าน CAT NIX ใช้การไม่ได้ทั้งหมด (ข้อมูลจาก ISP อื่น เส้นทางที่วิ่งไปหา NIX หายจากอินเทอร์เน็ตไปเลย 100%)
  • ระบบอินเทอร์เน็ตออกต่างประเทศผ่าน CAT IIG ใช้การไม่ได้เกือบทั้งหมด (ตรวจสอบจาก ISP ต่างประเทศยังเหลือเส้นทางอยู่พอสมควร)
  • ช่องทางออกต่างประเทศของทรูอินเทอร์เน็ตตามบ้านก็ใช้การไม่ได้ไปด้วยบางส่วน ทำให้หลายๆ คนเข้าใช้งานเว็บไซต์ต่างประเทศไม่ได้ไปพักใหญ่ๆ
  • อินเทอร์เน็ตของ CAT ล่มทั้งประเทศ (ระบบหลักอยู่ที่นี่)
  • บริการโทรศัพท์มือถือ my by cat ล่มเป็นวงกว้าง (น่าจะทั้งประเทศ), Truemove-H ล่มหลายพื้นที่ (เข้าใจว่ามีระบบสำคัญๆ บางอย่างที่เชื่อมต่อมาจาก CAT)
  • ศูนย์ข้อมูลที่อยู่ภายในอาคารทั้งหมดไม่สามารถให้บริการได้
  • เว็บไซต์จำนวนมาก (ตัวเลขประมาณการโดยผู้เขียนคือระดับหลักหมื่น) รวมถึงบริการบนอินเทอร์เน็ตอื่นๆ ที่อยู่ภายในอาคารไม่สามารถใช้งานได้โดยสิ้นเชิง
  • บริการ CDN ของเว็บไซต์ต่างประเทศหลายตัวไม่สามารถเข้าใช้งานได้ เนื่องจากพึ่งการส่งเส้นทางรับส่งข้อมูลบนอินเทอร์เน็ต และมีการจำกัดเครือข่ายที่เข้าใช้งานไว้ แต่เส้นทางเปลี่ยนจนเกิดการส่งไปยังเครื่องเซิร์ฟเวอร์ที่อยู่เครือข่ายอื่นที่ไม่ได้ตั้งค่ารับการเชื่อมต่อไว้
  • การสื่อสารข้ามเครือข่ายบางส่วน (เช่น TOT กับ 3BB , TOT กับ True) ต้องวิ่งผ่านเส้นทางต่างประเทศทำให้ใช้งานได้ช้าลง หรือไม่สามารถเชื่อมต่อกันได้เลย
  • หลังจากไฟฟ้ากลับมาปกติ พบว่ามีอุปกรณ์บางส่วนชำรุดเสียหาย ทำให้เสียเวลาซ่อมแซมและเปลี่ยนอุปกรณ์นานขึ้นไปอีก

ส่วนที่ไม่ได้รับผลกระทบ หรือได้รับผลกระทบน้อยมากมีประมาณนี้ครับ

  • การใช้งานเว็บไซต์ต่างประเทศจากอินเทอร์เน็ตอื่นที่ไม่ใช่ทรู
  • สำหรับผู้ให้บริการโทรศัพท์มือถือค่ายอื่นๆ
  • AIS ใช้โครงข่ายหลักของ SBN ที่เชื่อมต่อหาทุก IX อยู่แล้ว
  • Dtac มีการเชื่อมต่อสำรองผ่าน CSLoxinfo IX ที่ก็เชื่อมต่อครบทุก IX เช่นกัน
  • การใช้งานเว็บไซต์ที่มีโครงข่ายเป็นของตัวเอง หรืออยู่กับผู้ให้บริการรายอื่นที่มีการเชื่อมต่อหลายเส้นทาง ไม่ได้อยู่ในอาคารนี้ และไม่ได้ต้องเรียกใช้ข้อมูลจากเครื่องที่อยู่ภายในอาคาร

ทิ้งท้ายกันด้วยสิ่งที่ควรปรับปรุงหลังจากนี้ คือมาตรการรักษาความปลอดภัยเชิงกายภาพของระบบสาธารณูปโภคสำคัญสำหรับการให้บริการศูนย์ข้อมูล ไม่ควรให้ใครเข้ามาตัดระบบได้ง่ายๆ แบบครั้งนี้ครับ

ขอบคุณเนื้อหา และภาพประกอบ
บทความโดย: