
Sự cố AWS làm tê liệt FanDuel và Coinbase: Trung tâm dữ liệu quá nhiệt khiến hàng loạt dịch vụ gián đoạn
Một sự cố kỹ thuật lớn tại hệ thống trung tâm dữ liệu của Amazon Web Services (AWS) đã gây ra làn sóng gián đoạn trên nhiều nền tảng trực tuyến nổi tiếng, trong đó có ứng dụng cá cược thể thao FanDuel và sàn giao dịch tiền điện tử Coinbase.
Theo thông báo từ AWS, sự cố bắt đầu từ tối thứ Năm tại khu vực US-East-1 ở Bắc Virginia — một trong những trung tâm hạ tầng đám mây quan trọng nhất của hãng. Nguyên nhân ban đầu được xác định liên quan tới “vấn đề về nhiệt” trong một cơ sở dữ liệu thuộc khu vực này.
AWS cho biết việc khôi phục hoàn toàn hệ thống sẽ mất thêm nhiều giờ, đồng thời cảnh báo rằng một số dịch vụ điện toán vẫn đang gặp trục trặc.
AWS gặp sự cố tại trung tâm dữ liệu Virginia
Trong bản cập nhật phát hành lúc 9:51 sáng giờ ET ngày thứ Sáu, AWS cho biết các kỹ sư đang nỗ lực đưa thêm công suất làm mát vào hoạt động nhằm khôi phục phần cứng bị ảnh hưởng.
Theo Amazon Web Services, sự cố xảy ra trong một “Availability Zone” — hay còn gọi là Vùng Khả dụng — thuộc khu vực US-East-1 tại Bắc Virginia.
Đây là một trong những khu vực hạ tầng quan trọng nhất của AWS, phục vụ hàng triệu doanh nghiệp toàn cầu.
AWS viết:
“Chúng tôi đang tích cực làm việc để đưa thêm công suất hệ thống làm mát vào vận hành, điều này sẽ giúp khôi phục phần cứng còn bị ảnh hưởng.”
Sự cố lần đầu được phát hiện vào khoảng 8:25 tối thứ Năm theo giờ ET, khi bảng điều khiển trạng thái của AWS hiển thị cảnh báo về các vấn đề liên quan tới máy chủ.
Coinbase và FanDuel bị ảnh hưởng trực tiếp
Sự cố tại AWS nhanh chóng lan rộng tới nhiều nền tảng phụ thuộc vào hạ tầng điện toán đám mây của hãng.
Trong số đó, Coinbase — một trong những sàn giao dịch tiền điện tử lớn nhất thế giới — xác nhận rằng các dịch vụ giao dịch cốt lõi đã bị gián đoạn kéo dài.
Nền tảng này cho biết trên mạng xã hội X rằng lỗi từ nhiều vùng AWS đã ảnh hưởng trực tiếp tới hoạt động giao dịch.
Dù Coinbase sau đó thông báo phần lớn vấn đề đã được giải quyết, nhiều người dùng vẫn phản ánh về tình trạng chậm xử lý lệnh và lỗi truy cập tài khoản trong nhiều giờ.
Trong khi đó, FanDuel — nền tảng cá cược thể thao phổ biến tại Mỹ — cũng gặp sự cố nghiêm trọng.
Khoảng 9 giờ tối thứ Năm, FanDuel xác nhận họ đang điều tra các vấn đề kỹ thuật khiến người dùng không thể truy cập hệ thống.
Hai giờ sau, công ty tiếp tục cập nhật rằng nguyên nhân liên quan tới sự cố ngừng hoạt động diện rộng của AWS.
Người dùng phàn nàn mất quyền truy cập và không thể rút tiền
Sự cố khiến nhiều người dùng FanDuel bức xúc khi họ không thể truy cập vào các giao dịch cược đang diễn ra hoặc thực hiện rút tiền đúng thời điểm.
Trên mạng xã hội, nhiều người phản ánh rằng:
- Vé cược bị đóng băng
- Không thể đăng nhập ứng dụng
- Không xử lý được thanh toán
- Không thể rút tiền thắng cược
Đối với Coinbase, một số nhà giao dịch tiền điện tử cũng cho biết họ gặp khó khăn khi thực hiện giao dịch trong thời điểm thị trường biến động mạnh.
Các chuyên gia công nghệ nhận định đây là ví dụ điển hình cho mức độ phụ thuộc cực lớn của nền kinh tế số vào các nhà cung cấp hạ tầng đám mây như AWS.
AWS hiện kiểm soát khoảng 1/3 thị trường đám mây toàn cầu
Amazon Web Services hiện là nhà cung cấp dịch vụ điện toán đám mây lớn nhất thế giới.
Theo nhiều báo cáo thị trường, AWS đang chiếm khoảng một phần ba thị phần hạ tầng đám mây toàn cầu, vượt trước nhiều đối thủ như Microsoft Azure hay Google Cloud.
Hàng triệu doanh nghiệp đang sử dụng hệ sinh thái của AWS cho:
- Lưu trữ dữ liệu
- Máy chủ ảo
- Ứng dụng web
- Giao dịch tài chính
- Trí tuệ nhân tạo
- Streaming
- Game online
Điều này đồng nghĩa chỉ một sự cố tại trung tâm dữ liệu cũng có thể gây ảnh hưởng dây chuyền trên quy mô rất lớn.
“Vấn đề nhiệt” đang trở thành rủi ro mới của trung tâm dữ liệu AI
Sự cố lần này cũng làm nổi bật áp lực ngày càng lớn đối với hệ thống trung tâm dữ liệu toàn cầu.
Khi AI, điện toán đám mây và xử lý dữ liệu bùng nổ, các trung tâm dữ liệu tiêu thụ lượng điện và nhiệt năng khổng lồ.
Nếu hệ thống làm mát gặp trục trặc, phần cứng có thể bị quá nhiệt nhanh chóng, dẫn tới:
- Tắt máy chủ khẩn cấp
- Mất kết nối
- Hỏng phần cứng
- Gián đoạn dịch vụ diện rộng
Nhiều chuyên gia cảnh báo rằng các công ty công nghệ sẽ phải đầu tư mạnh hơn vào:
- Hệ thống làm mát thế hệ mới
- Điện dự phòng
- Hạ tầng phân tán đa khu vực
- Tối ưu tiêu thụ điện năng AI
Đặc biệt trong bối cảnh các mô hình AI tạo sinh đang khiến nhu cầu xử lý dữ liệu tăng chưa từng có.
EC2 gặp lỗi khiến nhiều máy chủ ảo bị ảnh hưởng
AWS cũng xác nhận rằng họ đang xử lý các vấn đề liên quan tới EC2 — dịch vụ máy chủ ảo quan trọng nhất của hãng.
Amazon EC2 (Elastic Compute Cloud) là nền tảng cung cấp năng lực tính toán cho vô số website, ứng dụng và nền tảng tài chính trên toàn cầu.
Khi EC2 gặp sự cố:
- Ứng dụng có thể bị treo
- API phản hồi chậm
- Dữ liệu không đồng bộ
- Giao dịch bị gián đoạn
Đây là lý do nhiều dịch vụ tài chính và giao dịch trực tuyến bị ảnh hưởng gần như ngay lập tức sau sự cố tại Virginia.
Tại sao chỉ một khu vực AWS gặp lỗi cũng gây hậu quả lớn?
Mặc dù AWS có hạ tầng toàn cầu, nhiều doanh nghiệp vẫn tập trung phần lớn hoạt động tại khu vực US-East-1 do:
- Chi phí thấp
- Độ ổn định cao
- Độ trễ tốt
- Hệ sinh thái dịch vụ đầy đủ
Tuy nhiên, việc phụ thuộc quá nhiều vào một khu vực khiến các doanh nghiệp dễ bị ảnh hưởng nếu nơi đó xảy ra sự cố.
Nhiều chuyên gia cho rằng các công ty nên triển khai chiến lược đa vùng (multi-region) để tránh rủi ro tương tự trong tương lai.
Ngành công nghệ ngày càng dễ tổn thương trước sự cố hạ tầng
Sự cố AWS lần này là lời nhắc nhở mạnh mẽ rằng nền kinh tế số hiện phụ thuộc rất lớn vào các nhà cung cấp hạ tầng công nghệ.
Một lỗi về nhiệt tại trung tâm dữ liệu không còn chỉ là vấn đề kỹ thuật nội bộ, mà có thể tác động trực tiếp tới:
- Giao dịch tài chính
- Thị trường tiền số
- Cá cược trực tuyến
- Dịch vụ streaming
- Hệ thống AI
- Ứng dụng doanh nghiệp
Khi thế giới ngày càng vận hành trên nền tảng điện toán đám mây, các sự cố hạ tầng như vậy có thể trở thành rủi ro mang tính hệ thống.
AWS là gì?
AWS (Amazon Web Services) là nền tảng điện toán đám mây của Amazon, cung cấp hạ tầng máy chủ và lưu trữ cho hàng triệu doanh nghiệp trên toàn cầu.
Vì sao FanDuel và Coinbase bị ảnh hưởng?
Hai nền tảng này sử dụng hạ tầng AWS để vận hành dịch vụ, nên khi trung tâm dữ liệu gặp lỗi, hệ thống giao dịch cũng bị gián đoạn.
Nguyên nhân sự cố AWS lần này là gì?
AWS cho biết nguyên nhân liên quan tới “vấn đề về nhiệt” tại một trung tâm dữ liệu ở Bắc Virginia.
EC2 là gì?
EC2 là dịch vụ máy chủ ảo của AWS, cho phép doanh nghiệp thuê năng lực tính toán trên nền tảng đám mây.
Vì sao trung tâm dữ liệu cần hệ thống làm mát mạnh?
Máy chủ hoạt động liên tục tạo ra lượng nhiệt rất lớn. Nếu không được làm mát hiệu quả, hệ thống có thể bị quá nhiệt và ngừng hoạt động.
Theo dõi tin tức công nghệ & AI mới nhất mỗi ngày
Cập nhật các sự kiện nóng về công nghệ, AI, dữ liệu, tiền điện tử và hạ tầng số toàn cầu tại DiemTinNhanh.com
Truy cập DiemTinNhanh.com



