Los procesadores se vuelven modulares

Si bien 2018 en el mundo de los procesadores se caracterizó principalmente por los desarrollos evolutivos y la limitación de daños, en 2019 quieren volver a dar grandes saltos. AMD viene con Zen 2 y 64 núcleos de procesador, Intel finalmente con una nueva arquitectura de procesador. La tendencia aquí es hacia los procesadores modulares.

Tanto Intel como AMD sacaron al mercado en 2018 procesadores que se basaban principalmente en arquitecturas de procesadores ya existentes con más núcleos y mejoras en los detalles. Además, los desarrolladores se ocuparon de tomar medidas contra los posibles ataques que posibilita la ejecución especulativa de instrucciones. Prácticamente todos los procesadores modernos eran susceptibles a las diversas brechas de Spectre, Intel también tuvo que lidiar con el ataque de Meltdown. Aunque todavía no se ha acabado del todo, es probable que los próximos procesadores estén equipados con cambios de hardware para protegerse de estos ataques, que entonces no costarán tanto rendimiento como las actuales correcciones de software y firmware. Por otro lado, se espera que el año 2019 traiga por fin al mundo de la informática grandes saltos en la arquitectura y fabricación de procesadores. Intel, en particular, tiene mucho que hacer para ponerse al día. Pero AMD también tiene mucho bajo la manga.

Los caminos de AMD conducen a Roma

Después de un largo periodo de sequía, AMD fue capaz de recuperar terreno frente a su gran competidor con Zen. Con los distintos modelos Ryzen, la compañía vuelve a tener en stock procesadores competitivos para PC y portátiles. Con las CPU Epyc, el retorno al centro de datos y a los proveedores de la nube es un éxito. En el evento Next Horizon, el fabricante dio un vistazo a sus planes para 2019 y más allá.

El procesador de servidor Epyc de próxima generación, cuyo nombre es "Roma", se lanzará en 2019. Se basa en la microarquitectura Zen 2 y duplica el número de núcleos del procesador en comparación con el actual Epyc, pasando de 32 a 64, y el número de hilos a 128. El nuevo procesador vuelve a estar formado por varios troqueles en un paquete de procesador común. Sin embargo, AMD está adoptando un enfoque diferente con Roma que antes: el procesador de 64 núcleos consta de ocho módulos de CPU, que AMD llama "chiplets", y un módulo central de E/S con ocho canales de memoria. Entre otras cosas, este diseño pretende garantizar que la latencia de los accesos a la memoria sea la misma para todos los núcleos. La conexión entre los chiplets y el troquel de E/S es gestionada por el Infinity Fabric de AMD, una evolución de HyperTransport.

Los chips son fabricados por TSMC en un proceso de 7nm. Para la matriz de E/S se utiliza un proceso de 14 nanómetros. Se dice que Global Foundries es el fabricante. Además del mayor número de núcleos en una CPU x86, Rome será también el primer procesador de servidor compatible con PCI-Express 4.0. Se supone que PCIe 4.0 duplica la velocidad de PCIe 3.0. Según AMD, el procesador ofrece un total de 128 carriles, que probablemente se repartan entre los ocho chiplets. El fabricante aún no ha dado ningún detalle. En una configuración de doble procesador, se utilizan 64 carriles cada uno para conectar las CPUs a través de Infinity Fabric. Según Mark Papermaster, director de tecnología y vicepresidente senior de tecnología e ingeniería de AMD, los núcleos individuales también tendrán un canal de ejecución mejorado. También hay mejoras en la predicción de saltos, en la precarga de instrucciones y en la ampliación de la caché de microoperaciones. En comparación con el actual Epyc, Papermaster también promete cuadruplicar el rendimiento en coma flotante, ya que la microarquitectura Zen 2 aumenta la unidad de carga y las unidades de ejecución de la FPU de 128 a 256 bits. Además, los cambios en el hardware deberían hacer que los procesadores Zen-2 sean inmunes a los ataques de Spectre incluso sin actualizaciones de microcódigo.

La separación del procesador en chiplets individuales de CPU y un dispositivo de E/S proporciona a AMD más flexibilidad y menores costes de fabricación. Sólo las matrices de la CPU, relativamente pequeñas, se fabrican en el costoso proceso de 7nm, mientras que las matrices de E/S, menos críticas para el rendimiento, se fabrican en un proceso probado y barato de 14nm. Las CPU con menos núcleos, por ejemplo para los ordenadores de sobremesa, pueden ensamblarse fácilmente a partir de un menor número de chiplets y un troquel de E/S más pequeño. Este será el caso de la tercera generación de procesadores de sobremesa Ryzen. En el CES de Las Vegas, la consejera delegada de AMD, Lisa Su, ofreció un primer avance del procesador para el socket AM4, que se está desarrollando bajo el nombre en clave de "Matisse" y que se presentará oficialmente a mediados de año. Será la primera CPU de sobremesa compatible con PCI Express 4.0. En la feria, un procesador de preproducción con ocho núcleos y una velocidad de reloj no revelada ofreció un rendimiento similar al Core i7-9900K de ocho núcleos de Intel en la prueba de referencia de trazado de rayos Cinebench 15, pero con un consumo de energía un 30% menor. Esto sugiere que las mejoras en la microarquitectura están dando el resultado deseado y que el proceso de 7 nanómetros de TSMC también está funcionando bien.

Picasso para portátiles

En cambio, la segunda generación de procesadores Ryzen para portátiles presentada en el CES, con el nombre en clave de "Picasso", no es todavía modular, sino una reducción de la matriz de los anteriores procesadores móviles Ryzen 2000 de 14 a 12 nanómetros, mejorada en detalle. Los nuevos procesadores Ryzen 3000 con dos o cuatro núcleos Zen+ y unidad gráfica Radeon Vega integrada seguirán ofreciéndose como variante U con TDP de 15 vatios y, recientemente, como versión más potente Ryzen 5 o Ryzen 7 H con TDP de 35 vatios. Se utiliza en combinación con una tarjeta gráfica dedicada, por ejemplo en los portátiles para juegos. El modelo básico de la familia Picasso es el Athlon 300U, en principio un Ryzen 3 3200U con una frecuencia de reloj reducida. Los procesadores AMD A6-9220C y AMD A4-9120C recién presentados para los Chromebooks siguen siendo APUs con módulos excavadores de 28nm de la era anterior a los núcleos Zen, aunque con un TDP de seis vatios. Los primeros Chromebooks con procesadores AMD son el Acer Chromebook 315 y el HP Chromebook 14

Radeon Instinct para el centro de datos

Las GPUs Vega de las tarjetas aceleradoras de centro de datos AMD Radeon Instinct MI60 y MI50 están fabricadas en un proceso de 7nm en TSMC, al igual que los núcleos Zen 2. Con ellos, AMD quiere alcanzar a Nvidia en tarjetas aceleradoras para HPC e IA, que la compañía ha ganado con Tesla. Las tarjetas de AMD son compatibles con los actuales marcos de aprendizaje profundo, como TensorFlow y PyTorch. La plataforma de software HPC abierto ROCm se presenta en una versión mejorada para adaptarse a las tarjetas. Con su interfaz PCIe 4.0, las tarjetas Radeon Instinct también deberían funcionar de forma óptima con los nuevos procesadores Epyc. Las tarjetas se basan en la arquitectura Vega y están equipadas con HBM2 como memoria. El MI60 viene con 32 GB de memoria ECC, el MI60 con 16 GB. Según AMD, las tarjetas Radeon Instinct son también las únicas GPU con virtualización por hardware.

Intel: Sol y Hielo

Aunque muchos observadores consideran que Intel está en declive: La empresa sigue ganando espléndidamente. AMD sólo juega un papel menor en los procesadores para portátiles y convertibles, y Epyc también está ganando velocidad lentamente en el mercado de los servidores. Sin embargo, Intel tiene un problema. La compañía se ha acostumbrado demasiado a tener el mercado de los procesadores x86 en el bolsillo y ha trasladado su interés a nuevas áreas de negocio como los wearables o los drones. Al mismo tiempo, el fabricante se despidió del modelo tic-tac y siguió entregando nuevas variantes de sus procesadores de 14 nanómetros con más núcleos y, por lo demás, sólo con mejoras graduales.

En el pasado CES, Intel presentó una serie de procesadores Core con una GPU desactivada, que llegan al mercado como modelos F y KF, respectivamente, y que están pensados principalmente para atraer a la comunidad de jugadores, para quienes una unidad gráfica integrada es superflua de todos modos. Sin embargo, los procesadores sin GPU no ofrecen una mayor frecuencia de reloj, y sólo el Core i3-9350KF es realmente nuevo como primer Core i3 con Turbo Boost. Intel aún no ha podido establecer una producción estable de procesadores de 10 nm. Probablemente sólo se produjeron unas pocas CPUs Cannon Lake, como el Core i3-8121U, y el proyecto quedó probablemente enterrado. Esto significa que la producción en masa de 10 nanómetros solo llegará con "Ice Lake", los procesadores móviles Core U y CoreY basados en la nueva microarquitectura Sunny Cove prevista para finales de 2019. Se espera que el proceso de 10 nm permita a Intel alcanzar anchos de estructura similares a los del proceso de 7 nm de TSMC. Más adelante, le seguirán los procesadores de sobremesa y, en 2020, los procesadores Xeon de la familia Ice Lake.

En el caso de los procesadores Xeon, este año se darán dos pasos intermedios de 14 nanómetros, primero con Cascade Lake y después con Cooper Lake. En ellas, Intel quiere integrar funciones específicas para la aceleración de cargas de trabajo de IA, que se resumen bajo el nombre de "DL Boost". Cascade Lake viene con hasta 48 núcleos y 12 canales de memoria. También será compatible con la memoria persistente Intel Optane DC, que es una memoria Optane en forma de módulos DIMM compatibles con pines DDR4. Bajo el nombre de "Snow Ridge", el fabricante trabaja en un SoC de 10 nanómetros destinado a estaciones base 5G y edge computing

Intel utiliza el proceso de 10 nanómetros en CPUs con arquitectura Sunny Cove para dar cabida a más transistores en la matriz. Sunny Cove aporta una caché de datos de nivel 1 un 50% más grande, una caché de nivel 2 ampliada y una caché de micro-operaciones diseñada para contener más que las anteriores 2.048 entradas. Además, hay diez puertos de ejecución en lugar de los ocho anteriores, para poder procesar más instrucciones por reloj. En las Jornadas de Arquitectura celebradas en diciembre, el fabricante de chips también ofreció la posibilidad de mejorar la arquitectura de Sunny Cove. Además de DL Boost para la IA, Intel también menciona las funciones de criptografía. El controlador de memoria soporta la memoria más rápida LPDDR4X. La unidad gráfica integrada en el procesador Ice Lake será significativamente más rápida en comparación con los actuales procesadores Kaby Lake y Coffee Lake. Con 64 en lugar de las 24 unidades de ejecución anteriores, se supone que ofrecerá un rendimiento de cálculo superior a un teraflop. Además, hay capacidades como el Tile Based Rendering -Intel llega tarde a este punto- o la compatibilidad con Adaptive Sync y HDR. A nivel de chipset, la integración de Tunderbolt 3 y 802.11ax está en la agenda de Ice Lake.

Con Foveros a la tercera dimensión

Intel ya ha dado los primeros pasos hacia los procesadores modulares de varios chiplets con el Embedded Multi-Die Interconnect Bridge (EMIB). Se utiliza para la integración de FPGAs en un procesador x86 o el acoplamiento del procesador Intel Core y la GPU AMD Radeon en los procesadores Kaby Lake G. El proyecto "Foveros" da ahora el paso a la tercera dimensión apilando chiplets. En este proceso, se combinan diferentes tipos de chiplets con diferentes procesos de fabricación para diferentes tareas del procesador. Algunos ejemplos son las CPUs de alto rendimiento, los procesadores de IA, las CPUs muy económicas, las FPGAs, las memorias, los sensores o los chiplets de redes de radio.

El primer hardware basado en Foveros fue mostrado por Intel en el CES con la plataforma cliente "Lakefield" con procesador híbrido. Combina un chiplet Sunny Cove de 10 nm, un átomo de cuatro núcleos de la próxima generación Tremont y la memoria principal en un paquete 3D. Esto permite a los desarrolladores construir una placa base muy pequeña que deja mucho espacio para la batería, incluso en los ordenadores móviles compactos 2 en 1.

Con Lakefield, Intel retoma el concepto big.LITTLE habitual en los procesadores ARM, que combina núcleos lentos pero muy económicos para tareas rutinarias y de espera conectada con núcleos rápidos para aplicaciones más exigentes. También es probable que un modelo LTE o más tarde también 5G forme parte del equipamiento de los equipos móviles con el nuevo procesador híbrido. Con este concepto, Intel responde a los PCs siempre conectados con CPUs ARM lanzados conjuntamente por Qualcomm y Microsoft.

Qualcomm y Windows on ARM

Como el negocio de los smartphones ya no crece de forma significativa, el de las tabletas ARM incluso está en declive y la competencia de los fabricantes chinos de ARM es cada vez más fuerte, el fabricante de chips estadounidense está poniendo sus SoCs ARM en los portátiles 2 en 1 con Windows. Se supone que ofrecen un tiempo de espera conectado extremadamente largo y también duran más en funcionamiento lejos de la toma de corriente que los dispositivos comparables con procesadores x86. Además, los SoCs Snapdragon ya llevan integrado un módem LTE. Microsoft apoya a Qualcomm con su propia versión de Windows 10 para procesadores ARM. El sistema operativo y las aplicaciones universales se ejecutan de forma nativa en el procesador ARM. Una capa de emulación x86 es responsable de los programas convencionales de Windows, pero sólo los programas de 32 bits se ejecutan en ella. Los primeros dispositivos con Snapdragon 835 no convencieron porque el rendimiento de la emulación deja mucho que desear. El rendimiento de los dispositivos con el Snapdragon 850, más potente, es algo mejor, pero sigue sin ser óptimo.

Se supone que el Snapdragon 8cx ofrece un aumento significativo del rendimiento con un consumo de energía, no obstante, bajo. Será el primer procesador de 7nm para portátiles y no está pensado para sustituir al Snapdragon 850, sino para complementarlo como modelo superior. En el SoC se encuentra una CPU Kryo 495 con ocho núcleos de 64 bits y construcción big.LITTLE. Tiene cachés más grandes que el Kryo-385 con Snapdagon 850. Se supone que la GPU Adreno-680 ofrece el doble de rendimiento que la unidad gráfica del Snapdragon 850. Además, se supone que el Snapdragon 8cx admite hasta 16 GR de RAM y SSD NVMe. Se supone que el módem LTE integrado ofrece velocidades de datos de dos Gbps, y que es posible una posterior ampliación a 5G con un módem adicional.


Deja un comentario