Seleccionar página

Lo probé: AMD GCN - Presentamos Radeon HD 7970 y HD 7950

Ha llegado el momento de presentar finalmente la arquitectura AMD GCN (Graphics Core Next) y sus dos representantes más potentes, la Radeon HD 7970 y la Radeon HD 7950.

Logotipos de artículos de GCN

De la HD 7950, rindimos homenaje de inmediato a dos de ellas, por lo que también tuvimos la oportunidad de probar CrossFireX, y también realizamos mediciones sintonizadas con ambas tarjetas. Por supuesto, también enviamos a varios corredores contra los dos nuevos cañones para ver cuánto se habían acelerado las tarjetas en comparación con las GeForces y Radeons de la generación anterior. 


Antes de adentrarnos en los participantes y las pruebas, analizaremos más de cerca la arquitectura GCN y asumiremos las funciones de los modelos HD 7970 y HD 7950.

 todas las cajas de cartas 2k

 Núcleo de gráficos siguiente

En mayo de 2007, AMD presentó la tarjeta gráfica Radeon HD 2900 XT, que ya estaba construida sobre una arquitectura de sombreado unificada. Al final resultó que, el diseño tenía una serie de fallas, pero los problemas se eliminaron casi por completo en el momento de la serie Radeon HD 4000, lo que le dio a la compañía un punto de apoyo en el mercado de tarjetas gráficas de escritorio. En este punto, se pudo ver que ahora se necesitaban cambios radicales. La serie HD 6900 “Cayman” se considera el primer paso. Aquí, los procesadores superescalares de 5 vías anteriores (VLIW5) han sido reemplazados por procesadores de 4 vías (VLIW4), y Cayman fue el primer chip en manejar múltiples flujos de instrucciones independientes. La otra gran innovación fue la introducción de los dos “motores gráficos”, que duplicaron la capacidad de configuración del triángulo (aumentando el poder de teselado) y el número de algunos elementos (Rasterizer, Hierarchical Z, Tessellator). Hoy se convirtió en el tema de nuestra prueba de siguiente nivel. Gracias a una arquitectura llamada Graphics Core Next (GCN), las matrices de sombreadores que funcionan con instrucciones VLIW utilizadas hasta ahora se han vuelto obsoletas, reemplazadas por las llamadas Unidades de Computación (CU). GCN hizo su debut en la familia Radeon HD 7900 “Tahiti”.

19 m

Curiosamente, pero no sorprendentemente, las GPU de Tahití han logrado densidades de transistores excepcionales gracias a la tecnología de fabricación de ancho de banda de 28 nm de TSMC: contienen 365 mil millones de transistores por 4,3 milímetros cuadrados. Una unidad de cómputo contiene cuatro SIMD y una unidad escalar. La insignia Radeon HD 7970 "Tahiti XT" de AMD funciona con 32 CU activas, asumiendo un total de 2048 procesadores de sombreado (cuatro SIMD de 16 vías, 64 ALU). Dado el progreso de las generaciones hasta ahora, esto no parece ser un valor sobresaliente a primera vista, pero en aras de una mejor eficiencia y utilización, nos gustaría señalar que no vale la pena extraer accidentalmente conclusiones de gran alcance de este un indicador técnico. En teoría, una CU puede funcionar tanto como una sola unidad Cayman SIMD. Un problema importante con las generaciones anteriores es la dependencia de los datos (las instrucciones sucesivas dependen unas de otras de los datos), lo que ha provocado que la utilización fluctúe bruscamente. La arquitectura GCN también es un paso adelante en esta área porque elimina las dependencias previamente experimentadas a través del procesamiento de secuencias. Los beneficios están solo en palabras clave: la programación, la depuración, la estimación del rendimiento esperado y el desarrollo de controladores también se han vuelto radicalmente más simples y transparentes. 

24

36 mUna CU no solo contiene cuatro unidades SIMD, sino que también tiene su propio programador, 340 KB de almacenamiento en búfer y un grupo de texturizado. Esta es la suma del registro vectorial de 4 × 64 KB, el recurso compartido de datos locales de 64 KB, el registro escalar de 4 KB y la caché de primer nivel con capacidad de 16 KB. La imagen de arriba muestra otro componente que definitivamente vale la pena mencionar, y es la llamada “Unidad de sucursales y mensajes”, que juega un papel en el control de programas más eficiente.
Teniendo la información hasta ahora, revisemos nuevamente los parámetros clave del procesador de gráficos "Tahiti XT": 32 CU (2048 procesadores de sombreado, 128 SIMD), 128 unidades de texturizado, 512 unidades de almacenamiento de carga y un total de 8,2 MB de caché. Así que la posición de la niña fue diferente de inmediato, a pesar de que estábamos empezando a "desnudarnos".

35 mInterfaz

En términos de interfaz, podemos ver diferencias significativas en comparación con la arquitectura de NVIDIA GF110. Básicamente, la gestión no se realiza a nivel de las UC. Esta tarea la realizan el procesador de comandos y el motor informático asincrónico (ACE). El chip ha recibido dos motores geométricos que, además del ensamblador de geometría, el ensamblador de vértices, también acomodan unidades teseladoras de novena generación. La comunicación con las CU es facilitada por Global Data Share (GDS), a través del cual estas unidades también pueden compartir datos entre sí. La sección de interfaz contiene dos rasterizadores; puede ver el diseño a continuación.

37

Interfaz de memoria y ROP
AMD Tahiti contiene 8 grupos ROP; en este punto, encontramos una coincidencia con el chip Cayman. Cada uno de estos "arreglos" contiene cuatro unidades ROP y 16 muestreadores Z. Es importante mencionar que a cada clúster se le asignó su propia caché. Se ha producido otro cambio importante: ya no hay una conexión directa con el controlador de memoria. La medida tiene como objetivo mejorar la flexibilidad y la usabilidad, lo que podemos ver en el contexto de Pitcairn ... Los ROP pueden escribir en la caché L768 de 2 KB, que a su vez puede ser leída por varias unidades. La interfaz de memoria recibe una imagen alegre. Los seis controladores de memoria de 64 bits tienen una capacidad total de 384 bits. Solo agregaríamos una palabra a esto. ¡Finalmente! El tamaño predeterminado de la memoria de video es 3072 MB, pero en teoría, también son posibles 1536 MB y 6 GB.

Esperamos que nuestros lectores no lo tomen con mala reputación, pero en este punto expresaremos nuestra opinión personal sobre el área de backend. La relación entre Barts, que ha funcionado realmente bien, y el chip Cayman, que muestra resultados relativamente modestos, sugiere que el "problema general" con los chips AMD es la reducida capacidad ROP. Tampoco se ha avanzado en Tahití aquí, mientras que las páginas podrían escribirse con cierta exageración sobre otras novedades en el chip. El papel de los ROP es especialmente prominente durante los juegos, durante las tareas y aplicaciones de GPGPU se convierten en segundos violinistas. También es cierto que este apartado consume una gran cantidad de transistores, lo que por supuesto también se refleja en el tamaño del chip.

 

Hasta ahora, las mejoras de AMD han respondido en gran medida a las necesidades de los jugadores. Ahora ha habido un giro de al menos 90 grados y se ha convertido en un objetivo muy específico para satisfacer las necesidades profesionales, para utilizar la GPU de manera más amplia. Por supuesto, esto no es un problema, ya que básicamente estamos hablando de un nivel de rendimiento muy rudo, que sin duda resistirá las pruebas de los juegos modernos durante unos años. Según los rumores, no solo AMD, sino también NVIDIA está tratando las ROP de manera estrecha con Kepler.

La ampliación del bus de memoria fue un paso encomiable. De hecho, los diseñadores tenían pocas opciones. Los relojes ya no se pueden aumentar significativamente, pero el chip está hambriento de datos. En nuestra opinión, este movimiento por sí solo podría haber aumentado el rendimiento durante los juegos hasta en un 15 por ciento.

44DirectX 11.1 y PCI Express 3.0
El estándar PCI-Express 3.0 aumenta la velocidad de 16 GB / segundo a 32 GB / segundo, duplicando la tasa de transferencia de datos de PCIe 2.0. Los fabricantes de placas base inmediatamente "mordieron el tema", pero no importa cuánto quieran, el conmutador no ofrece una ventaja significativa en este momento. PCIe 3.0 es un arma importante desde una perspectiva de marketing, un estándar obligatorio para AMD y NVIDIA, y otra "trampa de dinero" para los usuarios.
DirectX 11.1 puede comenzar su conquista con el siguiente sistema operativo Windows, que contiene correcciones y optimizaciones menores. Según el material oficial, podemos esperar soporte 3D estéreo nativo y rasterización más eficiente de la nueva API. Desafortunadamente, quizás el punto más interesante, que trata sobre cómo se puede mejorar la flexibilidad y la usabilidad generalizada del hardware de gráficos, no se ha detallado.

31 m

La arquitectura Graphics-Core-Next se parece a esto en términos generales. Por supuesto, el chip no solo satisface las necesidades de los jugadores, sino que también tiene espacio para tareas profesionales. El rendimiento máximo computacional teórico de Tahití (para cálculos de doble precisión) es 947 GFLOP, cuatro veces más alto para operaciones de punto flotante de precisión simple. Además, las memorias tienen soporte ECC y la GPU está bien familiarizada con las API de DirectCompute 11.1, OpenCL 1.2 C ++ AMP.27 Nuevas funciones: Zero-Core
En general, los principales depredadores de Radeon HD 7900 están acostumbrados a consumir como un tema tabú, pero los ingenieros de AMD carecen de ingenio. La idea es simple pero genial, pero no nueva. Si deja la computadora durante mucho tiempo, pero por alguna razón no desea apagarla, es posible que desee dejar el monitor solo en modo de espera. Gracias a la tecnología ZeroCore Power, con la pantalla apagada, todo el controlador de gráficos se puede desenergizar y no se requiere enfriamiento activo de esta forma. Los beneficios son convincentes: cero ruido, 3 vatios de consumo de energía. Será un factor insignificante para muchos, pero el procedimiento para los sistemas Crossfire de cuatro vías apaga las tarjetas de video no primarias, lo que reduce significativamente su factura de electricidad, aunque cualquiera que piense en tal ensamblaje hace poco para abordar la eficiencia energética.

21a

20

Eyefinity 2.0
Una de las características interesantes de la nueva versión es que le permite realizar conversaciones de conferencias con varios monitores con audio multibanda. El nombre oficial del procedimiento es Audio multipunto digital discreto (DDM). La Radeon HD 7970 se puede conectar a tres pantallas al mismo tiempo, que pueden recibir una transmisión de audio de ocho canales. Es posible que esto no sea de interés específicamente para los usuarios domésticos, pero es un buen ejemplo de en cuántas áreas se puede usar el nuevo cañón. La unidad Catalyst también está evolucionando, lo que facilita la colocación de la bandeja, por ejemplo, y le permite compilar resoluciones personalizadas. Vale la pena mencionar que el contenido 3D estéreo Full HD también se puede ver en el modo Eyefinity. 

29 m

UVD y VCE
UVD 3.0 ya ofrece aceleración de hardware para DivX / Xvid, contenido MVC MPEG-4 Parte 2, y Video Code Engine (VCE) es virtualmente el equivalente AMD de Intel Quick Sync Video. VCE es un hardware independiente y solo está diseñado para acelerar la transcodificación de videos H.264. El motor es más lento que los procesadores de sombreado en el procesador de gráficos, pero mucho más eficiente energéticamente. Hay dos modos disponibles para los usuarios. Al principio, solo funciona el VCE, que en sí mismo es más rápido que la mayoría de las CPU. En este caso, no experimentaremos una ralentización, podemos cargar la tarjeta de video o la unidad central sin ningún problema. La segunda opción es el modo híbrido. Las unidades aritmético-lógicas del VCE y la GPU saltan juntas a la tarea. Este "matrimonio" obviamente tiene un buen efecto en la velocidad de codificación, pero en ese caso, no se sorprenda si su juego favorito cambia al modo "presentación de diapositivas".

32

Ahora que conocemos la teoría y los números, ¡familiaricémonos con los tres modelos GCN de la prueba!

Kupónok

TENGOO HJ-15 Chaqueta calefactora 15 zonas calefactoras Carga USB Chaqueta térmica cálida Abrigo con capucha calefactable para motocicleta Ropa deportiva para exteriores para hombres

TENGOO HJ-15 Chaqueta calefactora 15 zonas calefactoras Carga USB Chaqueta térmica cálida Abrigo con capucha calefactable para motocicleta Ropa deportiva para exteriores para hombres

BGEUHJ15A
Womier-Teclado mecánico K98 con cable Hotswap RGB, diseño 96%, interruptor mecánico Gateron, pudín acrílico para jugadores de Mac y Windows

Womier-Teclado mecánico K98 con cable Hotswap RGB, diseño 96%, interruptor mecánico Gateron, pudín acrílico para jugadores de Mac y Windows

BG23f9f0
Bolas de dominadas, entrenador de dedos antideslizante, entrenamiento de fuerza de agarre, músculos del brazo, pesas, gimnasio, ejercicio muscular de mano

Bolas de dominadas, entrenador de dedos antideslizante, entrenamiento de fuerza de agarre, músculos del brazo, pesas, gimnasio, ejercicio muscular de mano

BGEUPB01

bandera