GPU Arm-G77 - bộ hoàn chỉnh

Tác Giả: Randy Alexander
Ngày Sáng TạO: 3 Tháng Tư 2021
CậP NhậT Ngày Tháng: 1 Tháng BảY 2024
Anonim
GPU Arm-G77 - bộ hoàn chỉnh - Công Nghệ
GPU Arm-G77 - bộ hoàn chỉnh - Công Nghệ

NộI Dung


Bên cạnh lõi CPU Cortex-A77 mới, Arm đã tiết lộ một GPU thế hệ tiếp theo dành cho điện thoại thông minh SoC thế hệ tiếp theo. Không thể nhầm lẫn với Mali-G77 với bộ xử lý hiển thị mới của Mali-D77, đánh dấu sự ra đi của kiến ​​trúc Arm Bifrost và chuyển sang Valhall.

Chúng tôi sẽ nhận được vào các chi tiết tốt đẹp của kiến ​​trúc mới trong một thời điểm. Đầu tiên, chúng tôi sẽ nhảy ngay vào những gì người dùng nên mong đợi về hiệu suất.

Tổng quan về hiệu suất của Mali-G77

Arm tự hào tăng tới 40% hiệu năng đồ họa với các thiết bị Mali-G77 thế hệ tiếp theo so với các mẫu máy Mali-G76 ngày nay. Con số này đang tính đến quá trình tính toán cũng như cải tiến kiến ​​trúc. Mali-G77 có thể cấu hình từ 7 đến 16 lõi shader và mỗi lõi có kích thước gần như chính xác với lõi G76. Điều này có nghĩa là điện thoại thông minh cao cấp có thể sẽ xuất xưởng với số lượng lõi GPU tương tự như hiện nay - một nơi nào đó ở thanh thiếu niên thấp. Handily, điều này cho phép chúng tôi thực hiện một số đánh giá hiệu suất đầu cơ so với các chipset hiện có.


Nhìn vào điểm chuẩn Manhattan GFXBench nổi tiếng, hiệu suất tăng 40 phần trăm mở ra một sự dẫn đầu đáng kể so với phần cứng thế hệ hiện tại. Chip Adreno thế hệ tiếp theo của Qualcomm sẽ cần nâng cấp hiệu suất đáng kể của riêng mình để giữ mức độ sân chơi. Các bảng dường như đang được ủng hộ trong Arm Arm.

Kiến trúc khôn ngoan, hiệu suất chơi game tăng 20 đến 40%, trong khi học máy tăng 60%

Dựa trên nền tảng bóng khá thô sơ này, một chiếc máy lõi 10 lõi (một cấu hình mà chúng ta thường thấy từ Huawei) trông có vẻ giống với phần cứng đồ họa di động hàng đầu thế hệ này. Cấu hình 12 lõi, thường thấy trong Samsung miễn Exynos, cung cấp một sự dẫn dắt lớn cho GPU mới nhất của Arm Arm. Tất nhiên, điểm chuẩn thực sự sẽ phụ thuộc vào các yếu tố khác, bao gồm nút quá trình, bộ nhớ đệm GPU, cấu hình bộ nhớ LPDDR và ​​loại ứng dụng mà bạn đang thử nghiệm. Vì vậy, lấy biểu đồ trên với một lượng muối khổng lồ.


Xét riêng về kiến ​​trúc mới, Arm tuyên bố rằng Mali-G77 mang lại sự cải thiện trung bình 30% cho hiệu suất năng lượng và mật độ hiệu suất. Ngoài ra, còn có mức tăng 60% cho các ứng dụng học máy, nhờ hỗ trợ sản phẩm chấm INT8. Các kỳ vọng về hiệu suất chơi trò chơi được đặt ở đâu đó giữa mức tăng 20 đến 40 phần trăm, tùy thuộc vào tiêu đề và loại khối lượng công việc đồ họa được cung cấp.

Để hiểu chính xác làm thế nào Arm đạt được hiệu suất nâng cao này, hãy để Lặn đi sâu hơn vào kiến ​​trúc.

Gặp Valhall, người kế nhiệm Bifrost từ

Vahall là kiến ​​trúc GPU vô hướng thế hệ thứ hai Arm Arm. Nó là một công cụ thực thi dọc 16 chiều, về cơ bản có nghĩa là GPU thực hiện 16 lệnh song song trên mỗi chu kỳ, trên mỗi đơn vị xử lý, trên mỗi lõi. Rằng lớn lên từ 4 và 8 rộng trong Bifrost.

Các tính năng kiến ​​trúc mới khác bao gồm lập lịch hướng dẫn động được quản lý hoàn toàn bằng phần cứng và một bộ hướng dẫn hoàn toàn mới vẫn giữ được sự tương đương hoạt động với Bifrost. Những thứ khác bao gồm hỗ trợ cho định dạng nén Arm [AFBC1.3, các mục tiêu kết xuất của FP16, kết xuất lớp và các đầu ra shader đỉnh.

Mali-G77 thực hiện song song nhiều hơn 33% so với G76.

Các chìa khóa để hiểu các thay đổi kiến ​​trúc chính được tìm thấy bằng cách kiểm tra đơn vị thực thi bên trong lõi. Phần này của GPU chịu trách nhiệm cho việc bẻ khóa số.

Bên trong động cơ thực thi

Trong Bifrost, mỗi lõi GPU chứa ba động cơ thực thi hoặc hai trong trường hợp một số thiết kế Mali-G52 cấp thấp hơn. Mỗi công cụ chứa một i-cache, tệp đăng ký và đơn vị điều khiển dọc. Trong Mali-G72, mỗi động cơ xử lý 4 hướng dẫn trong mỗi chu kỳ, tăng lên 8 trong năm ngoái, Mali Mali-G76. Trải rộng trên ba lõi này cho phép các hướng dẫn tích lũy nhân (FMA) 12 và 24 điểm nổi 32 bit trên mỗi chu kỳ.

Với Valhall và Mali-G77, chỉ có một công cụ thực thi duy nhất bên trong mỗi lõi GPU. Như trước đây, động cơ này chứa bộ điều khiển dọc, thanh ghi và icache, hiện được chia sẻ trên hai đơn vị xử lý. Mỗi đơn vị xử lý xử lý 16 lệnh dọc cho mỗi chu kỳ, với tổng thông lượng là 32 lệnh FP32 FMA cho mỗi lõi. Đó là một sự gia tăng 33 phần trăm cho thông lượng hướng dẫn so với Mali-G76.

Arm đã chuyển từ ba thành chỉ một đơn vị thực thi trên mỗi lõi GPU, nhưng hiện tại có hai đơn vị xử lý trong lõi G77.

Ngoài ra, mỗi đơn vị xử lý này chứa hai khối chức năng toán học mới. Đơn vị chuyển đổi mới (CVT) xử lý các số nguyên cơ bản, logic, nhánh và hướng dẫn chuyển đổi. Đơn vị chức năng đặc biệt (SFU) tăng tốc nhân số nguyên, chia, căn bậc hai, logarit và các hàm số nguyên phức khác.

Đơn vị FMA tiêu chuẩn đã thấy một vài điều chỉnh, hỗ trợ 16 hướng dẫn FP32 cho mỗi chu kỳ, 32 hướng dẫn sản phẩm 32 FP16 hoặc 64 điểm INT8. Những tối ưu hóa này tạo ra sự nâng cao hiệu suất 60 phần trăm trong các ứng dụng học máy.

Bản đồ kết cấu Quad

Sự thay đổi quan trọng khác trong Mali-G77 là sự ra đời của một trình ánh xạ kết cấu quad, từ một trình ánh xạ kết cấu kép ở thế hệ trước. Trình ánh xạ kết cấu chịu trách nhiệm ánh xạ các đa giác 3D trong một cảnh thành biểu diễn 2D mà bạn nhìn thấy trên màn hình. Nó có trách nhiệm lấy mẫu, nội suy và lọc để làm mịn nội dung góc cạnh và di chuyển để tránh các cạnh khắc nghiệt, chất lượng thấp.

Khử răng cưa chi phí thấp vẫn được áp dụng để hỗ trợ chất lượng hình ảnh, nhưng việc tăng gấp đôi hiệu suất kết cấu là lợi ích chính ở đây. Đơn vị kết cấu hiện xử lý 4 texons song tuyến trên mỗi đồng hồ tăng từ 2 trước đó, 2 tex tam giác trên mỗi đồng hồ và xử lý quá trình lọc FP16 và FP32 nhanh hơn.

Trình ánh xạ kết cấu quad được chia thành hai đường dẫn, cung cấp một đường dẫn ngắn hơn cho các luồng đánh vào nội dung trong bộ đệm. Đường dẫn bỏ lỡ, xử lý chuyển đổi định dạng và giải nén kết cấu, có giao diện rộng hơn với bộ đệm L2. Điều này cũng hữu ích cho khối lượng công việc học máy có thể thường xuyên cần lấy dữ liệu mới từ bộ nhớ.

Kết hợp mọi thứ lại với nhau trong Mali-G77

Arm đã thực hiện một số điều chỉnh khác cho Mali-G77 để trùng khớp với những thay đổi lớn trong kiến ​​trúc Valhall. Khối điều khiển được đơn giản hóa nhờ thiết kế đơn vị thực thi duy nhất, trong khi bộ lập lịch động bên trong thực sự cho phép phát lệnh linh hoạt hơn bên trong mỗi lõi. Với thông lượng cao hơn trong mỗi lõi, datapath cũng ngắn hơn và độ trễ thấp hơn, chỉ còn 4 chu kỳ so với 8 chu kỳ trước đó.

Thiết kế mới cũng được liên kết tốt hơn với API Vulkan, đơn giản hóa các mô tả trình điều khiển để giảm chi phí trình điều khiển để cải thiện hiệu suất của trò chơi kim loại.

Tóm lại, Mali-G72 và Valhall thực hiện những thay đổi quan trọng từ Bifrost hứa hẹn tăng hiệu suất đáng kể cho các ứng dụng chơi game và học máy. Điều quan trọng, thiết kế phù hợp với cùng ngân sách năng lượng và diện tích như Bifrost, đảm bảo rằng các thiết bị di động sẽ có thể cung cấp hiệu suất cao hơn mà không phải lo lắng về chi phí nhiệt, điện và silicon. Dựa trên các dự đoán về hiệu suất, Mali-G77 sẽ có thể mang đến cho Adcommo thế hệ tiếp theo Adreno một khoản tiền tốt.

Đội trênNhà phát triển XDA đã dành một chút thời gian để xem qua mã có trong phần mềm mới nhất của điện thoại thông minh amung hiện có, như amung Gala...

Ốp lưng Samsung Galaxy S10 tốt nhất

Monica Porter

Tháng BảY 2024

amung Galaxy 10 cung cấp một nền tảng hoàn hảo giữa Galaxy 10e tương đối phải chăng và Galaxy 10 Plu ấn tượng hơn, nhưng giá cả. Tất nhiên, Galaxy 10 vẫn là một chiếc flaghip ...

Phổ BiếN Trên Trang Web