Giải thích về lõi CUDA của Nvidia: Khác nhau thế nào?

OFREZH EDITOR
25 thg 6, 2025
9 phút đọc

Theo TÉCHCENTURY

Nvidia gọi nền tảng xử lý song song của mình là CUDA. Trong khi CUDA Core là các đơn vị xử lý bên trong GPU giống như Stream Processor của AMD.

CUDA là viết tắt của Compute Unified Device Architecture. Đây là tên gọi của nền tảng xử lý song song và API được sử dụng để truy cập trực tiếp vào bộ lệnh GPU Nvidia.

Không giống như DirectX và OpenGL, CUDA không yêu cầu các nhà phát triển phải hiểu ngôn ngữ lập trình đồ họa phức tạp; nó chỉ hoạt động trên các ngôn ngữ lập trình phổ biến như C, C++ và công nghệ độc quyền của Nvidia.

Nếu bạn đã từng xem bảng thông số kỹ thuật của card đồ họa Nvidia, chắc chắn bạn đã bắt gặp thuật ngữ này.

Chúng ta hãy xem xét một ví dụ để hiểu cách hoạt động của lõi CUDA. Hãy nghĩ về bộ xử lý như một bể chứa nước. Nếu bạn muốn làm rỗng bể, bạn sẽ cần sử dụng các đường ống.

GPU Nvidia hiện đại có ba loại lõi xử lý khác nhau:

Lõi CUDA

Lõi Tensor

Lõi Ray-Tracing

Nếu bạn muốn biết về Tensor Core, bạn có thể xem bài đăng này về tensor core để tìm hiểu về chúng.

Card đồ họa bắt đầu từ kiến ​​trúc Tesla có lõi CUDA. Tất cả GPU Nvidia thuộc về Tesla, Fermi, Kepler, Maxwell, Pascal, Volta, Turing và Ampere đều có lõi CUDA. Nhưng không thể nói như vậy về lõi Tensor hoặc lõi Ray-Tracing.

Lõi Nvidia CUDA

Hình tiếp theo cho thấy sơ đồ khối của GPU Fermi.

Kiến trúc Nvidia Fermi

Với kiến ​​trúc Kepler, số lượng lõi CUDA đã tăng gấp ba lần. Kiến trúc Kepler hỗ trợ tới 1536 lõi CUDA. Nó dựa trên công nghệ chế tạo 28nm.

Sơ đồ khối kiến ​​trúc Nvidia Kepler

Từ đây trở đi, Nvidia tiếp tục tung ra nhiều lõi CUDA hơn qua mỗi thế hệ. Đây là sơ đồ khối của Nvidia Quadro GP100. Đây là một phần của kiến ​​trúc Pascal do Nvidia phát hành vào năm 2016.

Cả kiến ​​trúc Maxwell và Pascal đều có 128 lõi CUDA trên mỗi bộ xử lý đa luồng (SM). Đơn vị số nguyên đã được cắt bớt trong kiến ​​trúc Maxwell, loại bỏ đơn vị nhân chuyên dụng.

Sơ đồ kiến ​​trúc Nvidia GP100 Pascal

Kiến trúc Turing của Nvidia mang lại nhiều thay đổi cho GPU. Đây là sơ đồ khối của GPU TU102.

Sơ đồ khối Turing TU102

Kiến trúc Ampere mới nhất mang đến Lõi Ray Tracing thế hệ thứ 2. GPU GA100 có 128 SM. Ampere GA102 có 10.752 lõi CUDA. Lần này, mỗi lõi bao gồm hai đơn vị xử lý FP32 (Các đơn vị thực hiện các phép toán dấu phẩy động 32 bit).

Sơ đồ khối Nvidia Ampere GA100

Sau đây là sơ đồ khối của GPU GA102 dựa trên kiến ​​trúc Ampere mới nhất của Nvidia.

Thế hệ GPU tiếp theo của Nvidia rất có thể sẽ dựa trên quy trình sản xuất 5 nm. Điều này sẽ thu nhỏ kích thước die hơn nữa, giảm yêu cầu về điện năng và tăng tốc độ xung nhịp lên hơn 2 GHz.

Khi các nhà phát triển bắt đầu hiểu rõ hơn về kiến ​​trúc mới, họ có thể tối ưu hóa trò chơi và chương trình của mình để tăng cường hiệu suất hơn nữa.

Lõi CUDA ảnh hưởng đến hiệu suất như thế nào?

VRAM lưu trữ tài sản, kết cấu, bản đồ bóng đổ và tất cả dữ liệu khác được xử lý thông qua GPU. Lý do tại sao card đồ họa lưu trữ dữ liệu này trong VRAM là vì truy cập dữ liệu từ VRAM nhanh hơn nhiều so với DRAM, SSD hoặc HDD.

Nhiều yếu tố ảnh hưởng đến lượng VRAM mà hệ thống của bạn yêu cầu (như độ phân giải). Hầu hết các card đồ họa hiện đại đều có kích thước VRAM từ 2GB đến thậm chí 24GB VRAM ( RTX 3090 , chúng tôi đang nói đến bạn).

Một lõi GPU không thể lấy hoặc giải mã lệnh mà chỉ thực hiện tính toán. Số lượng lõi CUDA thường ở mức hàng nghìn GPU hiện đại.

Số lượng lõi CUDA có thể là một chỉ báo tốt về hiệu suất nếu bạn so sánh các GPU trong cùng một thế hệ. Nvidia GTX 960 có 1024 lõi CUDA, trong khi GTX 970 có 1664 lõi CUDA. GTX 970 có nhiều lõi CUDA hơn so với người em của nó, GTX 960.

Điểm CUDA cao hơn có nghĩa là hiệu suất tốt hơn cho các GPU cùng thế hệ miễn là không có yếu tố nào khác làm giảm hiệu suất.

Nếu chúng ta so sánh hai GPU ở thế hệ khác nhau, GTX 980 Ti dựa trên kiến ​​trúc Maxwell và GTX 1080 dựa trên kiến ​​trúc Pascal, thì đây là những gì chúng ta quan sát được.

Sau đây là một phương trình giả định cho thấy hiệu suất của GPU phụ thuộc vào nhiều yếu tố khác nhau.

Hiệu suất của GPU = số_lõi * tần_số_xung_đợi * hệ_số_kiến_trúc;

Bây giờ chúng ta hãy tóm tắt lại những gì chúng ta đã hiểu cho đến thời điểm này.

Số lượng lõi CUDA càng nhiều thì có thể xử lý song song được nhiều dữ liệu hơn.

Tốc độ xung nhịp cao hơn có nghĩa là một lõi đơn có thể hoạt động nhanh hơn nhiều.

GPU ngày càng tốt hơn qua các thế hệ và kiến ​​trúc mới, do đó, card đồ họa có nhiều lõi CUDA hơn chưa chắc đã mạnh hơn card đồ họa có ít lõi CUDA hơn.

Bộ xử lý luồng

Bộ xử lý luồng tương đương với lõi CUDA của AMD. Cả GPU AMD và Nvidia đều vượt trội về hiệu suất đồ họa. Mặc dù lõi CUDA và bộ xử lý luồng không tương đương với nhau, nhưng về cơ bản chúng khác nhau.

Sẽ không đúng nếu đánh giá hiệu suất của card đồ họa chỉ bằng cách nhìn vào số lõi CUDA và bộ xử lý luồng.

Điều thú vị nữa là Nvidia đã làm tốt hơn trong việc duy trì hỗ trợ nhà phát triển cho lõi CUDA của họ trong khi AMD luôn theo đuổi mức giá cạnh tranh và GPU của họ có giá trị tốt hơn so với số tiền bỏ ra.

Phần kết luận

Dù có chuyện gì xảy ra, nếu bạn là một game thủ, hãy luôn nhớ rằng card đồ họa có thể tạo ra nhiều FPS hơn trong các tựa game AAA luôn là người chiến thắng.

Bình luận

https://nguoilamvuon.net

https://phantrunque.net

https://topfarm.vn

Card đồ họa bắt đầu từ kiến trúc Tesla có lõi CUDA. Tất cả GPU Nvidia thuộc về Tesla, Fermi, Kepler, Maxwell, Pascal, Volta, Turing và Ampere đều có lõi CUDA. Nhưng không thể nói như vậy về lõi Tensor hoặc lõi Ray-Tracing.

Với kiến trúc Kepler, số lượng lõi CUDA đã tăng gấp ba lần. Kiến trúc Kepler hỗ trợ tới 1536 lõi CUDA. Nó dựa trên công nghệ chế tạo 28nm.

Sơ đồ khối kiến trúc Nvidia Kepler

Từ đây trở đi, Nvidia tiếp tục tung ra nhiều lõi CUDA hơn qua mỗi thế hệ. Đây là sơ đồ khối của Nvidia Quadro GP100. Đây là một phần của kiến trúc Pascal do Nvidia phát hành vào năm 2016.

Cả kiến trúc Maxwell và Pascal đều có 128 lõi CUDA trên mỗi bộ xử lý đa luồng (SM). Đơn vị số nguyên đã được cắt bớt trong kiến trúc Maxwell, loại bỏ đơn vị nhân chuyên dụng.

Sơ đồ kiến trúc Nvidia GP100 Pascal

Sau đây là sơ đồ khối của GPU GA102 dựa trên kiến trúc Ampere mới nhất của Nvidia.

Khi các nhà phát triển bắt đầu hiểu rõ hơn về kiến trúc mới, họ có thể tối ưu hóa trò chơi và chương trình của mình để tăng cường hiệu suất hơn nữa.

Nếu chúng ta so sánh hai GPU ở thế hệ khác nhau, GTX 980 Ti dựa trên kiến trúc Maxwell và GTX 1080 dựa trên kiến trúc Pascal, thì đây là những gì chúng ta quan sát được.

GPU ngày càng tốt hơn qua các thế hệ và kiến trúc mới, do đó, card đồ họa có nhiều lõi CUDA hơn chưa chắc đã mạnh hơn card đồ họa có ít lõi CUDA hơn.