Wiesz jaka jest różnica w wydajności obliczeń raytracingu między Pascalem i Turingiem? Pytam niezłośliwie.
Tak, od 3 do 5 razy na korzysc ukladow z RT core. Troche wiecej na szybko o rt core:
"The RT core essentially adds a dedicated pipeline (ASIC) to the SM to calculate the ray and triangle intersection. It can access the BVH and configure some L0 buffers to reduce the delay of BVH and triangle data access. The request is made by SM. The instruction is issued, and the result is returned to the SM's local register. The interleaved instruction and other arithmetic or memory io instructions can be concurrent. Because it is an ASIC-specific circuit logic, performance/mm2 can be increased by an order of magnitude compared to the use of shader code for intersection calculation."
To daje sporo informacji. Oczywiscie lepiej uzywac dedykowanych cu niz dowolnych, dodatkowo konfiguracja l1 cache do dzielenia danych tez pomaga (i rejestry). Jezeli Navi w konsolach wspiera RT to oznacza, ze w Navi albo uzyli niektorych CU/sm i zmodyfikowali je podobnie, jak nVidia, albo maja inny sposob dostepu do danych (wariacja infinity fabric?) i sa w stanie osiagnac podobny (lub niewiele gorszy) wynik uzywajac standardowych CU. Co jak co, ale w czystym compute power karty AMD zawsze byly ok. Dodajmy do tego niskopoziomowa optymalizacje w konsolach i moze miec to jako taki sens - chociaz wolalbym, zeby zamiast tego RT poszla moc w fps lub AI. Ale wiemy doskonale, ze decyzja miedzy FPS a wieksza iloscia obiektow / efektow skonczy sie kiepsko dla FPS.
Navi jest za slaba, zeby ja dodatkowo ograniczac przez zabieranie CU i dedykowanie ich do RT na PC (i jeszcze ktos musi napisac do tego stery;) )... bo wtedy ani jedno, ani drugie nie bedzie dzialalo poprawnie. RDNA prawdopodobnie nie zmiesci tego, co jest potrzebne bo to rozszerzenie GCN, wiec na prawdziwe RT na PC od AMD poczekamy - ale konsole to inna broszka. Dodatkowo watpie, zeby AMD chcialo robic custom navi chip, wiec dlatego stawiam na uzycie standardowych CU plus zmiany na poziomie sterownika w chipie.
Poniewaz wlasnie roznica wydajnosci na nVidia to zaledwie 3-5 raza to imo daje to szanse na implementacje tego na zwyklych CU Navi. W 30 fps.