top of page

Hệ thống vòng kín là gì?

Các trung tâm dữ liệu đám mây hiện đại không chỉ tiêu thụ một lượng điện năng khổng lồ cho việc tính toán và làm mát mà còn tiêu thụ một lượng nước đáng kể vì hầu hết đều sử dụng phương pháp làm mát bằng chất lỏng bay hơi.

Ngược lại, các máy GB200 NVL72 và GB300 NVL72 của Nvidia sử dụng hệ thống làm mát bằng chất lỏng trực tiếp đến chip, được cho là tiết kiệm năng lượng hơn 25 lần và tiết kiệm nước hơn 300 lần so với các bộ làm mát hiện nay. Tuy nhiên, có một vấn đề là hệ thống NVL72 dạng rack-scale tiêu thụ nhiều điện năng hơn bảy lần so với các rack thông thường.

Các giá đỡ máy chủ trung tâm dữ liệu thông thường tiêu thụ khoảng 20kW điện, trong khi các giá đỡ dựa trên H100 của Nvidia tiêu thụ hơn 40kW điện. Tuy nhiên, các hệ thống giá đỡ GB200 NVL72 và GB300 NVL72 của Nvidia tiêu thụ 120kW – 140kW điện, vượt xa phần lớn các giá đỡ đã được lắp đặt.
Do đó, các phương pháp làm mát bằng không khí không còn đủ để quản lý tải nhiệt do các giá đỡ mật độ cao này tạo ra. Do đó, Nvidia đã phải áp dụng giải pháp làm mát mới cho các máy Blackwell của mình, dẫn đến việc phát triển một giải pháp mới.

Hệ thống GB200 NVL72 và GB300 NVL72 của Nvidia sử dụng hệ thống làm mát bằng chất lỏng trực tiếp đến chip. Phương pháp này bao gồm việc tuần hoàn chất làm mát trực tiếp qua các tấm lạnh gắn vào GPU, CPU và các thành phần sinh nhiệt khác, truyền nhiệt hiệu quả ra khỏi các thiết bị này mà không cần dựa vào không khí làm trung gian.

Không giống như làm mát bay hơi hoặc làm mát ngâm, làm mát bằng chất lỏng của NVL72 là một hệ thống vòng kín, do đó chất làm mát không bay hơi hoặc cần thay thế do mất mát do thay đổi pha, giúp tiết kiệm nước.

Trong kiến ​​trúc NVL72, nhiệt được hấp thụ bởi chất làm mát lỏng sau đó được truyền đến cơ sở hạ tầng làm mát của trung tâm dữ liệu thông qua bộ trao đổi nhiệt lỏng-lỏng ở cấp giá đỡ. Các đơn vị phân phối chất làm mát (CDU) này, chẳng hạn như CoolIT CHx2000, có khả năng quản lý công suất làm mát lên đến 2 mW, hỗ trợ triển khai mật độ cao với khả năng chịu nhiệt thấp và tản nhiệt đáng tin cậy.

Ngoài ra, thiết lập này cho phép hệ thống hoạt động bằng cách làm mát bằng nước ấm, do đó giảm hoặc loại bỏ nhu cầu sử dụng máy làm lạnh cơ học, giúp cải thiện cả hiệu quả năng lượng và tiết kiệm nước.

Có một số điều cần lưu ý về các giải pháp làm mát bằng chất lỏng trực tiếp đến chip vòng kín của Nvidia. Mặc dù các giải pháp làm mát bằng chất lỏng vòng kín được những người đam mê PC sử dụng rộng rãi, nhưng có một số lý do thực tế, kỹ thuật và kinh tế khiến các hệ thống này hiện không được áp dụng rộng rãi ở quy mô lớn.

Các trung tâm dữ liệu yêu cầu tính mô-đun và khả năng truy cập để bảo trì, nâng cấp và thay thế linh kiện, đó là lý do tại sao chúng sử dụng các linh kiện có thể hoán đổi nóng. Tuy nhiên, các hệ thống kín khít khiến việc thay thế nhanh chóng các máy chủ hoặc GPU bị lỗi trở nên khó khăn, vì việc phá vỡ lớp niêm phong sẽ làm hỏng toàn bộ cụm.
ree
Ngoài ra, việc định tuyến các vòng chất lỏng kín qua các giá đỡ và toàn bộ trung tâm dữ liệu sẽ gây ra sự phức tạp về mặt hậu cần trong đường ống, dự phòng bơm và cô lập lỗi. May mắn thay, các giải pháp làm mát bằng chất lỏng trực tiếp đến chip hiện tại sử dụng các phụ kiện ngắt kết nối nhanh với các miếng đệm không nhỏ giọt, mang lại khả năng bảo dưỡng mà không cần bịt kín hoàn toàn (cuối cùng, phát hiện và cô lập rò rỉ nhanh chóng sẽ rẻ hơn so với việc tạo ra một giải pháp quy mô trung tâm dữ liệu hoàn toàn kín). Tuy nhiên, sử dụng làm mát bằng chất lỏng quy mô trung tâm dữ liệu vẫn đòi hỏi phải thiết kế lại toàn bộ trung tâm dữ liệu, điều này rất tốn kém.

Tuy nhiên, vì bộ xử lý Blackwell của Nvidia cung cấp hiệu suất vô song, những người sử dụng GPU B200 sẵn sàng đầu tư vào các thiết kế lại như vậy. Ngoài ra, cần lưu ý rằng Nvidia đã đồng phát triển các thiết kế tham chiếu với Schneider Electric cho cụm 1152 GPU DGX SuperPOD GB200, sử dụng CDU lỏng-lỏng Motivair và bộ làm mát chất lỏng với hỗ trợ adiabatic. Điều này cho phép triển khai nhanh các hệ thống như vậy với hiệu suất tối đa.

Mặc dù Nvidia yêu cầu sử dụng làm mát bằng chất lỏng với GPU và hệ thống Blackwell B200, công ty đã đầu tư vào các thiết kế tham chiếu của các giải pháp làm mát bằng chất lỏng kín để tránh sử dụng các giải pháp làm mát bằng chất lỏng bay hơi, trong nỗ lực bảo tồn nước, có vẻ như là một sự đánh đổi hợp lý.

Theo Toms

Bình luận


bottom of page