Việt Nam vươn mình trong kỷ nguyên mới

AOL tăng hiệu năng cơ sở dữ liệu lên 4 lần

Chia sẻ Zalo

KTĐT - Mạng lưu trữ SAN (Storage Area Network) dạng SSD, dung lượng 50TB, được AOL lắp đặt để loại trừ tắc nghẽn I/O (dữ liệu vào/ra) do hệ thống lưu trữ back-end (chạy nền) gây nên.

KTĐT - Mạng lưu trữ SAN (Storage Area Network) dạng SSD, dung lượng 50TB, được AOL lắp đặt để loại trừ tắc nghẽn I/O (dữ liệu vào/ra) do hệ thống lưu trữ back-end (chạy nền) gây nên.

Để quản lý 6 petabyte (6PB ~ 1.000TB) dữ liệu của công ty cung cấp dịch vụ Internet toàn cầu AOL, một Fibre Channel SAN (mạng dữ liệu kênh sợi quang) là đủ. Nhưng với cơ sở dữ liệu (CSDL) các mối quan hệ quan trọng nhất của công ty, AOL thấy rằng SAN quá hạn chế và làm cho bộ phận CNTT khó có thể đáp ứng dịch vụ cho các đơn vị phận kinh doanh trên 50% thời gian.

Sau khi nghiên cứu những gì có thể gây ra tắc nghẽn I/O, AOL thấy rằng vấn đề là lưu trữ back-end. Để khắc phục, AOL quyết định xây dựng mạng lưu trữ SAN 50TB từ công nghệ solid-state.

Thực hiện nâng cấp, cung cấp gấp hơn 4 lần khả năng với CSDL SQL so với Fibre Channel SAN, trong khi vẫn tạo cho quản trị viên lưu trữ sự linh hoạt để di chuyển dữ liệu giữa các hệ thống lưu trữ bởi vì bộ nhớ NAND flash đặt phía sau một thiết bị ảo hóa, mà kết hợp tất cả lưu trữ back-end và các máy chủ vào một khối duy nhất.

Các kỹ sư AOL thấy rằng các vấn đề đã có không còn xuất hiện đối với phần cứng. Công ty có 5 mảng cao cấp với các đĩa cứng tốc độ cao 15.000 vòng/phút hoặc 10.000 vòng/phút để lưu trữ chính và hai mảng cấp thấp các đĩa cứng serial ATA (SATA) để sao lưu. Nhưng những mảng lưu trữ chỉ có thể cung cấp dữ liệu cho các thiết bị bên trong bằng tốc độ mà SAS (Serial Attached SCSI) cho phép, vào khoảng 6 Gbit/giây.

Hạ tầng lưu trữ của AOL hỗ trợ khoảng 4.000 máy chủ để cung cấp thông tin cho cả người dùng trực tuyến và các ứng dụng chạy nền của chính công ty.

Dan Pollack, kiến trúc sư vận hành cấp cao tại AOL cho biết, ông quan tâm đến việc thêm các thiết bị lưu trữ SSD tới các mảng lưu trữ hiện có của công ty, nhưng quyết định không sử dụng vì chúng sẽ bị giảm tốc độ theo băng thông điều khiển của các mảng.

“Vậy là bạn thấy bạn có thể dùng các thiết bị SSD hiệu năng cao và một nữa hiệu năng bị mất tại phần đầu của mảng”, Pollack nói với cử tọa tại hội nghị Thế giới mạng lưu trữ trong tuần này.

Pollack cũng quan tâm việc sử dụng các bộ lưu trữ SSD trong máy chủ nhưng không thể dùng bởi vì ông không thể kết nối chúng thành chuỗi (gọi là kỹ thuật clustering) vào trong SAN của mình, chúng không thể cung cấp khả năng được yêu cầu, như các thiết bị không thể thay nóng và dữ liệu không thể dịch chuyển giữa các hệ thống.

Pollack đã bố trí một mảng lưu trữ solid-state tại Mountain View, Califonia dựa trên hệ thống của công ty Violin Memory. Nó có thể cắm trực tiếp và mạng Fibre Channel của ông, và có thể đặt phía sau thiết bị ảo hóa lưu trữ của ông từ YottaYotta mà ông đã mua hồi năm ngoái từ nhà cung cấp “khổng lồ” về lưu trữ EMC.

Pollack nói việc triển khai, bao gồm cả lên kế hoạch và chạy thử nghiệm chỉ hết có 8 tuần. Hệ thống đã bắt đầu hoạt động từ 1/6. Từ đó, mảng SSD có thời gian ngưng hoạt động bằng 0 và nó cho phép bộ phận phục vụ liên tục cho các đơn vị kinh doanh không hề có ngoại lệ. Thời gian hồi đáp I/O thông thường dưới 1 mili giây và không ảnh hưởng tới đội ngũ IT của ông trong khả năng quản lý lưu trữ back-end.

Theo Pollack, giải pháp này hấp dẫn nhưng khá tốn kém. Pollack nói mảng solid-state của AOL có chi phí khoảng 20 USD/gigabyte, và với dung lượng 50TB chi phí lên đến 1 triệu USD. Thế nhưng tiền ít lại đem đến một trở ngại khác, đó là tốn nhiều nhân lực hơn cho các vấn đề về cơ sở dữ liệu, ông bổ sung.

Mảng flash thiết lập RAID 5 có cơ chế bảo vệ, vì thế các đĩa có thể được thay nóng. Để tăng cường bảo vệ, Pollack cấu hình ở mức RAID 1 (mirror) để dữ liệu được nhân đôi trên hai cụm thiết bị Violin được kết chuỗi (cluster) với nhau - với mỗi cụm gồm 6 bộ Violin.

Trong khi mảng không cung cấp được trên 1 triệu I/O trên mỗi giây (I/Os per second - IOPS) như nhà cung cấp tiếp thị phô trương trong tài liệu, nó đạt khoảng 250.000 IOPS, mà theo Pollack là quá đủ cho các mục đích của ông.

Ngoài ra việc dùng bộ nhớ flash còn giúp tiết kiệm được một khoản chi phí đáng kể, ông nói thêm.

Theo Pollack, các mảng Fibre Channel thường chỉ sử dụng khoảng 10% dung lượng trong những ổ đĩa lớp trên của chúng bởi vì các quản trị viên lưu trữ thường có xu hướng chỉ sử dụng các sector ở những vòng ngoài của đĩa (hay là các cylinder ngoài) để đảm bảo an toàn mà tốc độ truy xuất lại cao hơn. Điều đó có thể ngốn đến 20 kW điện với mỗi mảng, ông nói.

Trong khi đó, mảng flash chỉ tiêu tốn 2 kW điện và 90% dung lượng của nó được sử dụng. Hơn nữa, mảng lưu trữ Violin chiếm diện tích bề mặt ít hơn và tạo ra nhiệt ít hơn so với các thiết lập trước đó, và điều đó giúp giảm thiểu năng lượng cần thiết.

Violin không sử dụng NAND flash trong các ổ cứng như nhiều công ty solid-state làm thời nay. Thay vào đó công ty sử dụng các chip flash trực tiếp trên các card được gọi là những module bộ nhớ thông minh của Violin (Violin Intelligent Memory Module - VIMM). VIMM tương tự như DIMM, chỉ có điều được tích hợp flash thay vì RAM động.

"Vì vậy, bạn sẽ nhận được 4 GB/giây băng thông PCIe, chứ không phải là 5 Gbit/giây hay 6 Gbit/giây băng thông SAS. Bạn sẽ nhận được gần như độ lớn của băng thông cho lưu trữ nội tại bởi bạn đang sử dụng một giao tiếp có khả năng đó", Pollack nói.