Tin tức Khoa học Skynet

Nâng cao hiệu quả lưu trữ flash trong trung tâm dữ liệu

Ngày:
Th4 04, 2019
Tóm tắt:

Kiến trúc mới hứa hẹn sẽ cắt giảm một nửa năng lượng và không gian vật lý cần thiết để lưu trữ và quản lý dữ liệu người dùng.

Chia sẻ:
BÀI VIẾT ĐẦY ĐỦ

Trung tâm dữ liệu là các trang trại máy chủ tạo điều kiện giao tiếp giữa người dùng và dịch vụ web và là một trong những cơ sở tiêu thụ năng lượng nhất trên thế giới. Trong đó, hàng ngàn máy chủ đói năng lượng lưu trữ dữ liệu người dùng và các máy chủ riêng biệt chạy các dịch vụ ứng dụng truy cập dữ liệu đó. Các máy chủ khác đôi khi tạo điều kiện cho việc tính toán giữa hai cụm máy chủ đó.

Hầu hết các máy chủ lưu trữ ngày nay đều sử dụng ổ đĩa trạng thái rắn (SSD), sử dụng bộ lưu trữ flash có thể lập trình điện tử và bộ nhớ có thể xóa mà không có bộ phận chuyển động để xử lý các yêu cầu dữ liệu thông lượng cao ở tốc độ cao. Trong bài báo được trình bày tại Hội nghị quốc tế ACM về Hỗ trợ kiến ​​trúc cho ngôn ngữ lập trình và hệ điều hành, các nhà nghiên cứu mô tả một hệ thống mới có tên LightStore sửa đổi SSD để kết nối trực tiếp với mạng của trung tâm dữ liệu mà không cần bất kỳ thành phần nào khác và để hỗ trợ tính toán đơn giản hơn và hoạt động lưu trữ dữ liệu hiệu quả hơn. Đổi mới phần mềm và phần cứng tích hợp liền mạch hệ thống vào cơ sở hạ tầng trung tâm dữ liệu hiện có.

Trong các thí nghiệm, các nhà nghiên cứu đã tìm thấy một cụm gồm bốn đơn vị LightStore, được gọi là các nút lưu trữ, chạy hiệu quả gấp đôi so với các máy chủ lưu trữ truyền thống, được đo bằng mức tiêu thụ năng lượng cần thiết cho các yêu cầu dữ liệu thực địa. Cụm cũng yêu cầu ít hơn một nửa không gian vật lý bị chiếm bởi các máy chủ hiện có.

Hầu hết các máy chủ lưu trữ ngày nay đều sử dụng ổ đĩa trạng thái rắn (SSD)
Hầu hết các máy chủ lưu trữ ngày nay đều sử dụng ổ đĩa trạng thái rắn (SSD)

Các nhà nghiên cứu đã phá vỡ tiết kiệm năng lượng bằng các hoạt động lưu trữ dữ liệu cá nhân, như một cách để nắm bắt tốt hơn việc tiết kiệm năng lượng đầy đủ của hệ thống. Ví dụ, trong dữ liệu “ghi ngẫu nhiên”, đây là hoạt động chuyên sâu tính toán nhất trong bộ nhớ flash, LightStore hoạt động hiệu quả hơn gần tám lần so với các máy chủ truyền thống.

Hy vọng là một ngày nào đó, các nút LightStore có thể thay thế các máy chủ ngốn điện trong các trung tâm dữ liệu. Arvind, Giáo sư Khoa học Máy tính của Johnson cho biết: “Chúng tôi đang thay thế kiến ​​trúc này bằng một giải pháp lưu trữ đơn giản hơn, rẻ hơn … sẽ tốn một nửa dung lượng và một nửa năng lượng, nhưng vẫn cung cấp hiệu suất dung lượng tương tự”. Kỹ sư và một nhà nghiên cứu trong Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo. “Điều đó sẽ giúp bạn trong chi tiêu hoạt động, vì nó tiêu thụ ít năng lượng hơn và chi tiêu vốn, bởi vì tiết kiệm năng lượng trong các trung tâm dữ liệu chuyển trực tiếp sang tiết kiệm tiền.”

Tham gia Arvind trên giấy là: tác giả đầu tiên Chanwoo Chung, một sinh viên tốt nghiệp Khoa Kỹ thuật Điện và Khoa học Máy tính; và các sinh viên tốt nghiệp Jinhyung Koo và JunSu Im, và Giáo sư Sungjin Lee, tất cả của Viện Khoa học và Công nghệ Daegu Gyeongbuk (DGIST).

Thêm “giá trị” vào flash

Một vấn đề hiệu quả lớn với các trung tâm dữ liệu ngày nay là kiến ​​trúc đã không thay đổi để phù hợp với lưu trữ flash. Nhiều năm trước, các máy chủ lưu trữ dữ liệu bao gồm các đĩa cứng tương đối chậm, cùng với rất nhiều mạch nhớ truy cập ngẫu nhiên động (DRAM) và các đơn vị xử lý trung tâm (CPU) giúp xử lý nhanh chóng tất cả dữ liệu đổ vào từ các máy chủ ứng dụng.

Tuy nhiên, ngày nay, các đĩa cứng hầu hết đã được thay thế bằng các ổ flash nhanh hơn nhiều. “Mọi người chỉ cắm flash vào nơi mà các đĩa cứng đã từng ở, mà không thay đổi bất cứ điều gì khác”, Chung nói. “Nếu bạn chỉ có thể kết nối ổ đĩa flash trực tiếp với mạng, bạn sẽ không cần những máy chủ lưu trữ đắt tiền này.”

Một vấn đề hiệu quả lớn với các trung tâm dữ liệu ngày nay là kiến ​​trúc đã không thay đổi để phù hợp với lưu trữ flash.
Một vấn đề hiệu quả lớn với các trung tâm dữ liệu ngày nay là kiến ​​trúc đã không thay đổi để phù hợp với lưu trữ flash.

Đối với LightStore, các nhà nghiên cứu đã sửa đổi SSD đầu tiên được truy cập theo “cặp giá trị khóa”, một giao thức rất đơn giản và hiệu quả để truy xuất dữ liệu. Về cơ bản, các yêu cầu của người dùng xuất hiện dưới dạng các khóa, giống như một chuỗi số. Các khóa được gửi đến một máy chủ sẽ giải phóng dữ liệu (giá trị) được liên kết với khóa đó.

Khái niệm này đơn giản, nhưng các khóa có thể cực kỳ lớn, do đó, tính toán (tìm kiếm và chèn) chúng chỉ trong SSD đòi hỏi rất nhiều sức mạnh tính toán, được sử dụng bởi “lớp dịch flash” truyền thống. Phần mềm khá phức tạp này chạy trên một mô-đun riêng trên ổ đĩa flash để quản lý và di chuyển xung quanh dữ liệu. Các nhà nghiên cứu đã sử dụng các kỹ thuật cấu trúc dữ liệu nhất định để chạy phần mềm quản lý flash này chỉ sử dụng một phần sức mạnh tính toán. Khi làm như vậy, họ đã chuyển phần mềm hoàn toàn vào một mạch nhỏ trong ổ flash chạy hiệu quả hơn nhiều.

Việc giảm tải đó giải phóng các CPU riêng biệt đã có trên ổ đĩa được thiết kế để đơn giản hóa và nhanh chóng thực hiện tính toán hơn để chạy phần mềm LightStore tùy chỉnh. Phần mềm này sử dụng các kỹ thuật cấu trúc dữ liệu để xử lý hiệu quả các yêu cầu cặp giá trị khóa. Về cơ bản, không thay đổi kiến ​​trúc, các nhà nghiên cứu đã chuyển đổi ổ đĩa flash truyền thống thành ổ đĩa có giá trị khóa. “Vì vậy, chúng tôi đang thêm tính năng mới này cho flash nhưng chúng tôi thực sự không thêm gì cả,” Arvind nói.

Thích ứng và nhân rộng

Thách thức sau đó là đảm bảo các máy chủ ứng dụng có thể truy cập dữ liệu trong các nút LightStore. Trong trung tâm dữ liệu, ứng dụng truy cập dữ liệu thông qua nhiều giao thức cấu trúc, chẳng hạn như hệ thống tệp, cơ sở dữ liệu và các định dạng khác. Các máy chủ lưu trữ truyền thống chạy phần mềm tinh vi cung cấp cho các máy chủ ứng dụng quyền truy cập thông qua tất cả các giao thức này. Nhưng điều này sử dụng một lượng năng lượng tính toán tốt và không phù hợp để chạy trên LightStore, vốn dựa vào tài nguyên tính toán hạn chế.

Các nhà nghiên cứu đã thiết kế phần mềm rất nhẹ tính toán, được gọi là “bộ chuyển đổi”, dịch tất cả các yêu cầu của người dùng từ dịch vụ ứng dụng thành các cặp khóa giá trị. Các bộ điều hợp sử dụng các hàm toán học để chuyển đổi thông tin về dữ liệu được yêu cầu chẳng hạn như các lệnh từ các giao thức cụ thể và số nhận dạng của máy chủ ứng dụng thành một khóa. Sau đó, nó sẽ gửi khóa đó đến nút LightStore thích hợp để tìm và giải phóng dữ liệu được ghép nối. Vì phần mềm này đơn giản hơn về mặt tính toán, nên nó có thể được cài đặt trực tiếp lên các máy chủ ứng dụng.

“Bất kể dữ liệu nào bạn truy cập, chúng tôi thực hiện một số bản dịch cho tôi biết khóa và giá trị liên quan đến nó. Khi làm như vậy, tôi cũng lấy một số phức tạp khỏi các máy chủ lưu trữ”, Arvind nói.

Một cải tiến cuối cùng là việc thêm các nút LightStore vào một cụm quy mô tuyến tính với dữ liệu thông qua tốc độ mà dữ liệu có thể được xử lý. Theo truyền thống, mọi người xếp SSD trong các trung tâm dữ liệu để giải quyết thông lượng cao hơn. Nhưng, trong khi khả năng lưu trữ dữ liệu có thể tăng lên, các cao nguyên thông lượng chỉ sau một vài ổ đĩa bổ sung. Trong các thí nghiệm, các nhà nghiên cứu phát hiện ra rằng bốn nút LightStore vượt qua mức thông lượng bằng cùng một lượng SSD.


Nguồn tin tức:

Tài liệu được cung cấp bởi Viện Công nghệ Massachusetts . Bản gốc được viết bởi Rob Matheson. Lưu ý: Nội dung có thể được chỉnh sửa cho kiểu dáng và độ dài.


Bài viết liên quan

Bài viết mới