Kiểm tra nhóm: GPU NVIDIA GeForce RTX 40 Series và Super Series

KhanhThi · 5/9/24

GPU GeForce RTX 40 Series nào mang lại hiệu quả tốt nhất cho công việc CG? Để tìm hiểu, Jason Lewis đã tiến hành một loạt các bài kiểm tra thực tế toàn diện đối với các GPU tiêu dùng hiện tại của NVIDIA – bao gồm cả các card Super Series mới.

Bài kiểm tra nhóm mới nhất của chúng tôi là một dạng 'phần hai' của bài tổng hợp về GPU GeForce RTX 40 Series năm ngoái , trong đó tôi đã so sánh các card tiêu dùng thế hệ Ada hiện tại của NVIDIA với các card cũ hơn từ thế hệ Ampere và Turing trong một loạt các bài kiểm tra CG thực tế.

Bài đánh giá ban đầu giới thiệu ba trong số những card đồ họa đầu tiên thuộc Dòng GeForce RTX 40 được phát hành: GeForce RTX 4090, GeForce RTX 4080 và GeForce RTX 4070 Ti.

Kể từ đó, NVIDIA đã phát hành bản làm mới giữa chu kỳ, dòng card 'Super Series': GeForce RTX 4080 Super, GeForce RTX 4070 Ti Super và GeForce RTX 4070 Super.

Trong bài đánh giá này, chúng tôi sẽ tiến hành thử nghiệm tương tự như trên các card Super mới, sử dụng các phiên bản gần đây của ứng dụng CG dùng để đánh giá chuẩn.

Những GPU nào được đưa vào thử nghiệm nhóm?

Trong bài đánh giá này, chúng tôi sẽ tập trung vào dòng sản phẩm cao cấp GeForce RTX 40 Series của NVIDIA : GeForce RTX 4090, GeForce RTX 4080 và GeForce RTX 4070 Ti ban đầu, và hai dòng Super Series mới, GeForce RTX 4080 Super và GeForce RTX 4070 Super.

Thật đáng buồn là tôi không thể có được chiếc card Super Series thứ ba, GeForce RTX 4070 Ti Super, và như trước đây, chúng ta sẽ không xem xét các card tầm trung và cấp thấp: GeForce RTX 4070, GeForce RTX 4060 Ti và GeForce RTX 4060.

Đây là thế hệ GPU hiện tại của NVIDIA, dựa trên kiến trúc Ada Lovelace và dự định thay thế GeForce RTX 30 Series trước đây , dựa trên kiến trúc Ampere , và GeForce RTX 20 Series , dựa trên kiến trúc Turing .

Để so sánh, chúng tôi cũng sẽ thử nghiệm hai card từ Dòng GeForce RTX 30, GeForce RTX 3090 và GeForce RTX 3070 , và một card từ Dòng GeForce RTX 20, GeForce RTX 2080 Ti .

Chúng tôi cũng sẽ thử nghiệm ba card máy trạm của NVIDIA, RTX A6000 thế hệ Ampere, Titan RTX và Quadro RTX 8000 thế hệ Turing .

Trước khi đi vào phần đánh giá, đây là bản tóm tắt nhanh về một số thuật ngữ kỹ thuật mà bạn sẽ gặp trong đó. Nếu bạn đã quen thuộc với chúng, bạn có thể bỏ qua.

Giống như GPU Ampere và Turing thế hệ trước của NVIDIA, kiến trúc GPU Ada Lovelace hiện tại có ba loại lõi xử lý: lõi CUDA, được thiết kế cho quá trình quét hình ảnh và tính toán GPU nói chung; lõi Tensor, được thiết kế cho các hoạt động học máy; và lõi RT, nhằm mục đích tăng tốc quá trình dò tia.

Để tận dụng các lõi RT, phần mềm phải truy cập chúng thông qua API đồ họa: trong trường hợp các ứng dụng được giới thiệu trong bài đánh giá này, đó là DXR (DirectX Raytracing), được sử dụng trong Unreal Engine hoặc OptiX của NVIDIA , được sử dụng trong hầu hết các trình kết xuất ngoại tuyến.

Trong nhiều trình kết xuất, chương trình phụ trợ kết xuất OptiX được cung cấp như một giải pháp thay thế cho chương trình phụ trợ cũ hơn dựa trên API CUDA của NVIDIA . Chương trình phụ trợ CUDA hoạt động với nhiều loại GPU và ứng dụng phần mềm NVIDIA hơn, nhưng OptiX cho phép dò tia được tăng tốc phần cứng và thường cải thiện hiệu suất.

Thông số kỹ thuật

Đầu tiên, chúng ta hãy cùng xem qua thông số kỹ thuật của GPU Super Series mới đang được thử nghiệm. Bạn có thể tìm thấy thông số kỹ thuật của GeForce RTX 4090, GeForce RTX 4080 và GeForce RTX 4070 TI trong bài đánh giá gốc .

GeForce RTX 4080 Super về cơ bản chỉ là 4080 thông thường, nhưng có bộ xử lý AD103 được mở khóa hoàn toàn, giúp tăng số lượng lõi CUDA lên 10.240, tăng từ 9.728 lõi của 4080 ban đầu. Số lượng lõi Tensor và RT được tăng từ 304 và 76 lên 320 và 80. Băng thông bộ nhớ cũng tăng nhẹ lên 736,3 GB/giây, tăng từ 716,8 GB/giây.

Ở phiên bản Founders Edition, GeForce RTX 4080 Super sử dụng cùng thiết kế bộ tản nhiệt ba khe cắm như phiên bản 4080 gốc, cùng đầu nối nguồn 16 chân 12VHPWR và có cùng TDP là 320 W.

GeForce RTX 4070 Super là GeForce RTX 4070 nâng cấp, sử dụng cùng GPU AD104, nhưng có sự gia tăng đáng kể hơn nhiều về số lõi tính toán. Số lõi CUDA tăng lên 7.168 lõi CUDA, tăng từ 5.188, trong khi số lõi Tensor và RT tăng lên 224 và 56, tăng từ 184 và 46. Băng thông bộ nhớ không đổi, ở mức 504,2 GB/giây.

Trong Founders Edition, GeForce RTX 4070 Super sử dụng thiết kế tản nhiệt hai khe cắm gần giống với GeForce RTX 4070 nguyên bản, chỉ lớn hơn một chút về kích thước và sử dụng cùng đầu nối 16 chân 12VHPWR. Tuy nhiên, TDP của nó cao hơn: 220 W, tăng từ 200 W của bản gốc.

Một điều cuối cùng cần lưu ý về GPU Super Series là trọng lượng của GeForce RTX 4080 Super. Với trọng lượng 4,68 pound, nó nặng như RTX 4080 ban đầu và gần bằng RTX 4090. Tôi khuyên bạn nên sử dụng giá đỡ GPU để hỗ trợ trọng lượng đó và ngăn bo mạch chủ bị cong và nứt theo thời gian. Giá đỡ và giá đỡ GPU có thể được tìm thấy trực tuyến với giá vài đô la: theo tôi, đây là khoản đầu tư nhỏ vào tính toàn vẹn về mặt cấu trúc của GPU.

Quy trình thử nghiệm

Đối với máy thử nghiệm, tôi vẫn đang sử dụng hệ thống Xidax AMD Threadripper 3990X đáng tin cậy mà tôi đã đánh giá vào năm 2020. Mặc dù đã bốn năm tuổi nhưng đây vẫn là một hệ thống cực kỳ mạnh mẽ và dường như không phải là nút thắt cổ chai đối với bất kỳ GPU nào được thử nghiệm.

Phiên bản hiện tại của hệ thống kiểm tra có thông số kỹ thuật sau:

CPU : AMD Threadripper 3990X
Bo mạch chủ : MSI Creator TRX40
RAM : 64 GB 3.600 MHz Corsair Dominator DDR4
Lưu trữ : 2TB Samsung 970 EVO Plus NVMe SD / 1TB WD Black NVMe SSD / 4TB HGST 7.200 vòng/phút HD
Nguồn : 1300W Seasonic Platinum HĐH
: Windows 11 Pro cho máy trạm

GPU duy nhất không được thử nghiệm trên hệ thống Threadripper là GeForce RTX 3070. Tôi không còn quyền truy cập vào RTX 3070 trên máy tính để bàn nữa nên thử nghiệm đã được thực hiện bằng cách sử dụng RTX 3070 di động trong máy tính xách tay Asus ProArt Studiobook 16 từ bài đánh giá gần đây này .

Trong bài đánh giá đó, tôi xác định rằng qua một loạt các bài kiểm tra, RTX 3070 di động chậm hơn khoảng 10% so với phiên bản máy tính để bàn, vì vậy ở đây, tôi đã thêm 10% vào điểm số để ước tính hiệu suất của card máy tính để bàn. Đây không phải là phương pháp lý tưởng, nhưng nó đưa chúng ta đến đúng phạm vi.

Để thử nghiệm, tôi đã sử dụng các ứng dụng sau:

Hiệu suất khung nhìn
3ds Max 2024, Blender 3.6, Chaos Vantage 2.1.1, D5 Render 2.3.4, Fusion 360, Maya 2024, Modo 16.0v2, Omniverse Create 2022.3.1, SolidWorks 2022, Substance 3D Painter 9.0.0, Unigine Community 2.16.0.1, Unity 2022.1, Unreal Engine 5.3.1 và 4.27.2

Kết xuất
Arnold cho Maya 5.1.0, Blender 3.6 (Trình kết xuất Cycles), KeyShot 11.2.0, LuxCoreRender 2.6, Maverick Studio 2022.5, OctaneRender 2022.1 Standalone, Redshift 3.5.24 cho 3ds Max, SolidWorks Visualize 2022, V-Ray GPU 6 cho 3ds Max Hotfix 3

Các chuẩn mực khác
Axiom 3.0.1 cho Houdini 19.5, Cinema 4D v2023.1 (Pyro solver), Metashape 1.8.5, Premiere Pro 2022

Điểm chuẩn tổng hợp
3DMark Speed Way 1.0 và Port Royal 1.2, Cinebench 2024.0.1, Điểm chuẩn dò tia CryEngine Neon Noir, OctaneBench 2020.1.5, Điểm chuẩn Redshift v3.5, Bản demo Unity Enemies, Điểm chuẩn V-Ray v5.02.01

Mọi phép đo chuẩn đều được thực hiện bằng Trình điều khiển NVIDIA Studio được cài đặt cho GPU GeForce RTX và trình điều khiển máy trạm được cài đặt cho RTX A6000 và Quadro RTX 8000. Bạn có thể tìm thấy thảo luận chi tiết hơn về trình điều khiển được sử dụng ở phần sau của bài viết .

Trong các chuẩn mực về khung nhìn và chỉnh sửa, điểm số tốc độ khung hình thể hiện các con số đạt được khi thao tác các tài sản 3D được hiển thị, được tính trung bình trong năm phiên thử nghiệm để loại bỏ sự không nhất quán. Trong tất cả các chuẩn mực kết xuất, CPU đã bị vô hiệu hóa nên chỉ có GPU được sử dụng để tính toán.

Thử nghiệm được thực hiện trên thiết lập màn hình năng suất phù hợp, bao gồm một cặp màn hình 4K 27″ chạy ở độ phân giải 3.840 x 2.160px và màn hình rộng 34″ chạy ở độ phân giải 3.440 x 1.440px. Cả ba màn hình đều có tốc độ làm mới là 144Hz. Khi thử nghiệm hiệu suất khung nhìn, khung nhìn phần mềm bị giới hạn ở màn hình chính (một trong những màn hình 27″): không được phép mở rộng trên nhiều màn hình.

Kết quả chuẩn mực

Hiệu suất khung nhìn
Các tiêu chuẩn khung nhìn bao gồm một số ứng dụng DCC quan trọng – phần mềm 3D đa năng như 3ds Max, Blender và Maya, các công cụ chuyên dụng hơn như Substance 3D Painter, các gói CAD như SolidWorks và Fusion 360 và các ứng dụng 3D thời gian thực như D5 Render, Unity và Unreal Engine.

Trong các điểm chuẩn về khung nhìn, hiệu suất của GeForce RTX 4080 Super không khác nhiều so với người tiền nhiệm của nó, GeForce RTX 4080: chỉ nhỉnh hơn một chút trong hầu hết các bài kiểm tra và thậm chí tụt hậu ở một vài bài. Nếu bạn tính trung bình tất cả các số liệu, nó nhanh hơn 3-5% so với 4080 nguyên bản.

Mặc dù tôi chưa bao giờ có cơ hội thử nghiệm GeForce RTX 4070 vanilla, GeForce RTX 4070 Super dường như cung cấp hiệu suất tăng đáng kể hơn nhiều, vì trong các thử nghiệm này, về cơ bản nó là GeForce RTX 4070 Ti mới. Nó vượt trội hơn một chút so với 4070 TI thực tế trong một số thử nghiệm và tụt hậu một chút trong những thử nghiệm khác.

Một điều khác cần lưu ý là điểm Unreal Engine. Trong bài kiểm tra nhóm ban đầu, tôi nhận thấy có một sự bất thường về hiệu suất kỳ lạ với các cảnh City và Valley of the Ancients. Có vẻ như đây là sự cố phần mềm với chính Unreal Engine 5.1, vì việc chuyển sang Unreal Engine 5.3 đã khắc phục được sự cố, với GPU GeForce RTX 40 Series cung cấp hiệu suất tăng cao hơn nhiều so với các card cũ hơn.

Kết xuất
Tiếp theo, chúng ta có một bộ chuẩn kết xuất GPU, được thực hiện bằng nhiều trình kết xuất GPU phổ biến hơn, kết xuất từng khung hình ở độ phân giải 4K hoặc cao hơn.

Các bài kiểm tra kết xuất tuân theo một mô hình tương tự như các điểm chuẩn của khung nhìn. Hiệu suất của GeForce RTX 4080 Super gần giống với GeForce RTX 4080, nhỉnh hơn một chút trong hầu hết các bài kiểm tra, nhưng lại tụt hậu ở một số bài kiểm tra – không thực sự bất ngờ, vì số lượng lõi CUDA, Tensor và RT của nó chỉ cao hơn một chút và nó có cùng 16 GB VRAM.

GeForce RTX 4070 Super về cơ bản là GeForce RTX 4070 Ti mới, nhỉnh hơn một chút so với card gốc ở một số bài kiểm tra nhưng lại kém hơn một chút ở một số bài kiểm tra khác.

Tuy nhiên, điều đáng chú ý là về khả năng kết xuất, GeForce RTX 4090, với bộ đệm khung hình 24 GB, vẫn chiếm ưu thế với biên độ lớn.

Các tiêu chuẩn khác
Các tiêu chuẩn tiếp theo kiểm tra việc sử dụng GPU cho các tác vụ chuyên biệt hơn. Premiere Pro sử dụng GPU để mã hóa video; ứng dụng ảnh trắc lượng Metashape sử dụng GPU để xử lý hình ảnh và tạo mô hình 3D; và plugin Houdini Axiom và trình giải Pyro của Cinema 4D đều sử dụng GPU để mô phỏng chất lỏng.

Các bài kiểm tra hỗn hợp tuân theo một mô hình tương tự như các bài kiểm tra khung nhìn và kết xuất: GeForce RTX 4080 Super chỉ nhanh hơn một chút so với GeForce RTX 4080, trong khi GeForce RTX 4070 Super về cơ bản là GeForce RTX 4070 Ti mới. Sự khác biệt về hiệu suất thậm chí còn nhỏ hơn so với hai loại trước.

Không có GPU mới nào hoạt động tốt với mô phỏng Cinema 4D Pyro, một lần nữa là do hạn chế về bộ nhớ. GPU duy nhất thực sự hoạt động tốt là card máy trạm 48 GB.

Tiêu chuẩn tổng hợp
Cuối cùng, chúng ta có một loạt các tiêu chuẩn tổng hợp. Chúng không dự đoán chính xác hiệu suất của GPU trong quá trình sản xuất, nhưng chúng là thước đo khá tốt về hiệu suất của GPU so với các GPU khác và điểm số có thể được so sánh với điểm số có sẵn trực tuyến cho các card khác.

Điểm chuẩn tổng hợp xác nhận rằng chúng ta đã biết về GeForce RTX 4080 Super, xếp hạng nó cao hơn một chút so với GeForce RTX 4080 tiêu chuẩn.

Sự tò mò là GeForce RTX 4070 Super: không giống như các bài kiểm tra trước, một số điểm chuẩn tổng hợp cho thấy nó kém hơn đáng kể so với GeForce RTX 4070 Ti. Đây là lý do tại sao tôi không phải là người hâm mộ lớn của tổng hợp, vì chúng thường được điều chỉnh theo cách không phản ánh được cách sử dụng thực tế.

Những cân nhắc khác

Tiêu thụ điện năng
Để kiểm tra mức sử dụng điện năng của GeForce RTX 40 Series, tôi đã đo mức tiêu thụ điện năng của toàn bộ hệ thống thử nghiệm tại ổ cắm trên tường, sử dụng đồng hồ đo P3 Kill A Watt . Vì máy thử nghiệm là hệ thống Threadripper ngốn điện nên số liệu của tôi sẽ cao hơn hầu hết các máy trạm DCC.

Đối với thử nghiệm nhóm này, tôi đã đo cả công suất và dòng điện được rút ra. Dòng điện (Ampe) thường bị người đánh giá bỏ qua, nhưng nó có thể là yếu tố quyết định quan trọng về số lượng máy bạn có thể chạy trên một mạch điện duy nhất.

Hầu hết các ngôi nhà ở Hoa Kỳ đều chạy mạch 15A từ bảng điều khiển chính và nhiều cầu dao điện được đánh giá ở mức 80% tải tối đa của chúng, do đó, mạch 15A với cầu dao điện tiêu chuẩn không được vượt quá 12A khi sử dụng liên tục. Trong các thử nghiệm của tôi, dòng điện mà hệ thống thử nghiệm sử dụng đạt tới 6A khi lắp đặt các GPU ngốn điện hơn. Nếu các ổ cắm trên tường trong văn phòng tại nhà của bạn được kết nối bằng một mạch điện duy nhất, điều này có thể xác định xem bạn có thể chạy hai máy trạm cùng lúc hay không, đặc biệt là khi bạn tính đến màn hình và đèn.

GPU GeForce RTX 40 Series ban đầu có bước tiến đáng kể về hiệu suất sử dụng điện so với GeForce RTX 30 Series và các card Super Series mới còn cải thiện hiệu suất hơn nữa.

GeForce RTX 4080 Super cho thấy mức tiêu thụ điện năng giảm đáng kể so với GeForce RTX 4080 gốc trong mọi thử nghiệm ngoại trừ Unreal Engine 5.

GeForce RTX 4070 Super cũng có mức sử dụng điện năng thấp hơn hoặc bằng với GeForce RTX 4070 Ti bản gốc trong hầu hết mọi thử nghiệm: một lần nữa, ngoại trừ Unreal Engine 5.

Trình điều khiển
Cuối cùng, một lưu ý về Trình điều khiển Studio mà tôi đã dùng để đánh giá chuẩn GPU GeForce RTX. NVIDIA hiện cung cấp tùy chọn Trình điều khiển Studio hoặc Game Ready cho card GeForce, khuyến nghị Trình điều khiển Studio cho công việc DCC và Trình điều khiển Game Ready cho chơi game. Trong các thử nghiệm của mình, tôi không thấy có sự khác biệt rõ rệt nào giữa chúng về mặt hiệu suất hoặc chất lượng hiển thị. Theo tôi hiểu, Trình điều khiển Studio được thiết kế để đảm bảo tính ổn định trong các ứng dụng DCC và mặc dù tôi chưa gặp bất kỳ sự cố thực sự nào khi chạy phần mềm DCC trên Trình điều khiển Game Ready, nhưng nếu bạn chủ yếu sử dụng hệ thống của mình để tạo nội dung, thì không có lý do gì để không sử dụng Trình điều khiển Studio.

Nhấp vào hình ảnh để xem kích thước đầy đủ.

Phán quyết

Cả GeForce RTX 4080 Super và GeForce RTX 4070 Super đều có những cải tiến đáng kể so với phiên bản tiền nhiệm.

GeForce RTX 4080 Super chỉ nhanh hơn một chút so với GeForce RTX 4080 bản gốc, nhưng nó cũng sử dụng ít điện năng hơn một chút và điểm thu hút lớn nhất của nó là giá cả: ở mức 999 đô la, giá bán lẻ đề xuất của nó thấp hơn 200 đô la.

GeForce RTX 4070 Super khiến tôi ngạc nhiên vì hiệu năng của nó: trong các bài kiểm tra của tôi, nó ngang bằng hoặc nhỉnh hơn một chút so với GeForce RTX 4070 Ti ban đầu và mặc dù tôi không kiểm tra GeForce RTX 4070 nguyên bản, tôi chỉ có thể cho rằng sự khác biệt sẽ còn đáng kể hơn nữa. 4070 Super nhỏ hơn 4070 Ti và sử dụng ít điện năng hơn, với mức giá 599 đô la, giá ra mắt của nó thấp hơn 200 đô la.

Khiếu nại duy nhất của tôi là bộ nhớ GPU. Cả hai card Super đều có cùng dung lượng bộ nhớ như các card tiền nhiệm và – như các thử nghiệm nhóm này đã chỉ ra nhiều lần – dung lượng bộ nhớ rất quan trọng đối với công việc DCC. Tôi muốn thấy GeForce RTX 4080 Super được tăng từ 16 GB lên 20 GB, ngay cả khi điều đó có nghĩa là giữ nguyên MSRP ban đầu là 1.199 đô la. Tôi nhận ra rằng chơi game vẫn là thị trường ưu tiên đối với các GPU này, nhưng sự lựa chọn luôn có lợi cho người tiêu dùng.

Kết luận chung
Cả GeForce RTX 4080 Super và GeForce RTX 4070 Super đều là những GPU tuyệt vời để tạo nội dung. Chúng hoạt động cực kỳ tốt trong hầu hết các bài kiểm tra của tôi, chỉ gặp khó khăn trong những bài kiểm tra đòi hỏi nhiều VRAM.

Nhưng mặc dù vậy, nếu bạn có đủ ngân sách, tôi vẫn khuyên bạn nên dùng GeForce RTX 4090 nguyên bản cho công việc DCC nặng. GPU AD102 siêu nhanh của nó - và quan trọng hơn là bộ nhớ GPU 24GB - sẽ xử lý được hầu hết mọi tác vụ bạn yêu cầu.

Cuối cùng, tôi muốn cảm ơn bạn đã dành thời gian ghé thăm. Tôi hy vọng bài đánh giá này hữu ích và nếu bạn có bất kỳ câu hỏi hoặc đề xuất nào, hãy cho tôi biết theo địa chỉ email bên dưới.

by Jim Thacker

Kiểm tra nhóm: GPU NVIDIA GeForce RTX 40 Series và Super Series

Những GPU nào được đưa vào thử nghiệm nhóm?

Thông số kỹ thuật

Quy trình thử nghiệm

Kết quả chuẩn mực

Những cân nhắc khác

Phán quyết

Gợi ý cho bạn

[Coupon] Giảm giá Freepik đến 44% trong năm 2026

Rotate Object - Chức năng xoay, đổi góc đối tượng 2D bất kỳ như là 3d trong...

Chủ đề mới

Tin tuyển dụng

Những GPU nào được đưa vào thử nghiệm nhóm?​

Thông số kỹ thuật​

Quy trình thử nghiệm​

Kết quả chuẩn mực​

Những cân nhắc khác​

Phán quyết​

Gợi ý cho bạn

[Coupon] Giảm giá Freepik đến 44% trong năm 2026

Rotate Object - Chức năng xoay, đổi góc đối tượng 2D bất kỳ như là 3d trong...

Chủ đề mới

Tin tuyển dụng

Những GPU nào được đưa vào thử nghiệm nhóm?

Thông số kỹ thuật

Quy trình thử nghiệm

Kết quả chuẩn mực

Những cân nhắc khác

Phán quyết