¿Qué importa exactamente para la velocidad de un procesador?

Aquí hay una analogía que podría ayudarte.

Digamos que estamos comparando dos autos. El auto uno tiene un motor de 1.4 litros y 4 cilindros y puede acelerar hasta 6500 RPM.

El segundo auto tiene un V6 de 3.6 litros con un turbocompresor, pero el limitador de revoluciones está a 5200 RPM.

Ahora, aunque el automóvil uno tiene un motor que puede girar su manivela a una velocidad significativamente más rápida, es casi seguro que producirá menos potencia que el motor del automóvil número dos, es decir, puede hacer menos trabajo.

Por lo tanto, cuando se comparan los dos motores, es importante tener en cuenta no solo qué tan rápido pueden ir sino también qué es lo que está en movimiento y qué tan bien puede hacer frente a la tarea que se realiza una vez que la transmisión está activada y está bajo carga. En muchas aplicaciones, la eficiencia de ese motor también es importante: el motor 1.4 en un automóvil pesado tendría que trabajar a altas RPM todo el tiempo, produciendo mucho calor y quemando una gran cantidad de combustible, pero el V6 podría tomar cómodamente La carga con mayor engranaje y potencia de sobra.

Lo mismo ocurre con las CPU. El Pentium 4 más rápido, el 672, corrió a una velocidad estándar de 3.8Ghz (3.8 billones de veces por segundo). Esa es una cifra muy respetable incluso hoy en día, y es mucho más alta que los 2.7 GHz i5 (hasta 3.1 GHz para períodos cortos) del MacBook Pro 2015 que compré.

Pero echemos un vistazo dentro de esos chips. El Pentium 4 tiene 169 millones de transistores. Suena como mucho ¡Pero el i5 tiene 1.9 mil millones de transistores! Más de 10 veces la cantidad. Todos estos transistores le brindan numerosas ventajas, entre las cuales: puede manejar de manera competente los gráficos y generar múltiples monitores sin necesidad de un adaptador separado; tiene dos núcleos de procesamiento; y puede comprender un conjunto de instrucciones mucho más amplio, por lo que es más versátil y, dado el software correcto, puede realizar ciertas tareas en un ciclo de reloj que podrían demorar el Pentium 4 en seis o más ciclos de reloj.

Procesador Intel® Pentium® 4 672 compatible con tecnología HT (caché 2M, 3.80 GHz, 800 MHz FSB) Especificaciones

Intel lanza Broadwell-U: nuevos SKU, hasta 48 EU e Iris 6100

¿Y qué tal el rendimiento? No es de extrañar, ¡el i5 deja el P4 por muerto!

El número de GHz es lo que se llama la velocidad del reloj . Literalmente, hay un reloj que está funcionando dentro de su procesador y que se usa para medir el tiempo. Puede imaginar su procesador como una especie de fábrica: las cosas se mueven a lo largo de las líneas de ensamblaje, y cada vez que el reloj hace tic, todas las líneas de ensamblaje avanzan un paso.

Ahora, si está imaginando esto en su cabeza, debería ver que la velocidad de la garrapata no es lo único que importa.

En nuestra metáfora de fábrica, tanto la velocidad que marca el reloj como la cantidad que se hace por materia es importante. Para decirlo de otra manera, si la Fábrica A puede ensamblar un widget completo en 6 pasos, mientras que la Fábrica B necesita 20 pasos para hacerlo, la Fábrica A aún puede ser más rápida que B, incluso si el reloj de B marca tres veces más a menudo.

El número de líneas de montaje también puede importar. Si B tiene cuatro veces más líneas de ensamblaje que juntan los widgets que A, entonces puede apagar los widgets más rápido, incluso si se necesita el doble de tiempo para ensamblar cada widget.

Pero las cosas se complican más que esto. Imagine que cada widget necesita seis partes diferentes, cada una de las cuales está siendo producida por otras líneas de ensamblaje dentro de la fábrica. Y, por supuesto, cada uno de ellos está hecho de otras partes, algunas de las cuales se producen en la fábrica, otras de las cuales se traen desde el exterior.

Además, la fábrica no solo crea un tipo de widget: hace veinte tipos diferentes, y los números de cada tipo que se necesitan varían de un día a otro. Un día, es posible que tenga un pedido de cincuenta del widget 1, diez del widget 2, ochenta del widget 3, ninguno del widget 4, etc.

En este tipo de escenario, el problema se reduce a la optimización de la velocidad de cada línea de montaje individual, y más a la logística: a asegurarse de que cada cadena de montaje obtenga lo que necesita cuando lo necesita. Tal vez pueda tener la línea de ensamblaje A reunir el cincuenta del widget 1 … pero tal vez no pueda, porque el camión que viene a recogerlos llega a las 9:00 AM, así que para cumplir con ese cronograma, debe tener cinco líneas de producción. widget 1. Pero desea agregar un margen de error, por lo que configura seis líneas que producen el widget 1, y en algún momento, cuando sabe que tiene el margen que necesita, cambia la línea seis para producir el widget 2 en su lugar, pero para evitar que la gente se quede sin hacer nada, debe asegurarse de que las partes del widget 2 empiecen a llegar a esa línea en el momento adecuado.

Así es realmente el interior de un procesador moderno: la optimización en estos días se centra no en aumentar la velocidad del reloj, sino en aumentar la eficiencia al asegurarse de que todas las líneas de instrucciones dentro del procesador permanezcan llenas, la memoria caché de instrucciones y datos tenga la necesidad Datos en ellos, y así sucesivamente.

La cantidad de núcleos y la cantidad de tuberías en cada núcleo son importantes. Lo mismo ocurre con el tamaño de las caches. Lo mismo ocurre con la cantidad de ciclos de reloj necesarios para ejecutar cada instrucción.

Por supuesto, para todo esto, el tipo de trabajo que se realiza también es importante. Algunos procesadores son más rápidos en un tipo de cosas, pero más lentos en otro. Por lo tanto, los profesionales de la computación tienden a usar pruebas de referencia para medir la velocidad. Lo ideal es que una prueba de referencia ejecute el mismo tipo de carga de trabajo que realmente tendrá el procesador, de modo que pueda ver qué tan rápido se desempeña cada procesador en “condiciones reales”.

Para usar una analogía, es como elegir el modo de transporte que te llevará a ti ya tus cuatro amigos del punto A al punto B más rápido: la velocidad máxima no es la única consideración. En teoría, un avión puede ser mucho más rápido … pero si el punto A está a solo cincuenta millas del punto B, pasará más tiempo pasando por la seguridad del aeropuerto, esperando que los otros pasajeros aborden, y mucho más de lo que le llevaría a conducir allí Su amigo Joe’s Ferrari puede parecer la próxima opción más rápida … pero solo tiene capacidad para cuatro personas, de verdad, por lo que Joe tendría que hacer un segundo viaje para regresar y buscar uno de ustedes. Entonces, ¿el sedán de Tina? Los sentará a todos, pero hay un atajo que podría tomar si pudiera ir fuera de la carretera. Por lo tanto, puede resultar que un SUV sea la mejor opción, ¡aunque tenga la velocidad máxima más baja de todas sus opciones!

Lo que importa además de la velocidad del reloj es la arquitectura interna del procesador. Las implicaciones de eso se complican y no hay una manera sucinta de especificar “lo que importa” en este sentido. Sin embargo, hay programas de referencia que se pueden usar para medir las diferencias de rendimiento en diferentes arquitecturas de CPU. Aquí hay un sitio web donde puede buscar y comparar las calificaciones de rendimiento de modelos de CPU específicos.

Cuando se trata de la velocidad de la CPU, hay un par de factores

Velocidad del reloj, instrucciones por reloj (IPC), recuento de núcleos y latencia

Ahora digamos que tiene un FX-4350 , un quad core bastante barato con una base de 4.2 GHz. Ahora, si comparamos eso con un E5-2620 V4 , un núcleo de octa “bastante barato” (relativamente barato comparado con otros octa núcleos de Intel) con una base de 2.1 GHz. Eso es la mitad de la velocidad del reloj pero el doble del número de núcleos, ¿no deberían funcionar igual en un mundo donde se escala a la perfección? No No todos los GHz son creados igualmente.

El E5-2620 V4 está basado en la arquitectura Broadwell de 14nm. ¿Y eso significa? Significa que tiene un IPC mucho más alto que el FX-4350, por lo que tendría un mejor desempeño. (Y el hecho de que cada núcleo en el FX-4350 comparte sus recursos con otro núcleo) Y, como regla general, cada CPU Intel de la 2ª generación y superior, con un tiempo razonable, va a superar a cualquier CPU AMD en un solo núcleo actuación.

Ahora, ¿cómo afecta la latencia a todo esto? Puede tener toda la potencia de procesamiento del mundo, pero si el procesador pasa el 99% del tiempo esperando información, no será tan rápido, ¿verdad?

Experiencia de vida aquí, y mis compatriotas son acertados en:

Solía ​​tener una computadora 486 SX 33MHz, y mi madre solía tener una 386 DX 33MHz. Ok, entonces, ¿cómo se relaciona esto? … Recuerda el V6 y la analogía de los 4 cilindros, el mismo concepto:

ambos chips tienen la misma velocidad, y en la superficie el DX debería tener la ventaja porque tenía el chip matemático (DX = chip matemático, SX / SLX = no chip matemático) … Pero debido al hecho de que el 486 fue rediseñado, y la arquitectura en el chip era diferente, y las velocidades de reloj eran diferentes en el hardware, mientras que las computadoras tenían una velocidad de reloj de 33MHz, el 486 SX era más como un 386 DX 40 o 50. Mientras que las velocidades de reloj también se superponían, entre generaciones, Las nuevas generaciones fueron más poderosas que las anteriores.

El número de núcleos en la CPU también importa. Cuantos más núcleos tengas, más podrá tu computadora realizar múltiples tareas. Si la CPU tiene ECC es bueno. La mayoría de las personas no necesitan ECC. ECC evita la pérdida de datos para la CPU. Menos núcleos es mejor para juegos

Lo más importante, para simplificarlo enormemente, es Instrucciones por Reloj. Esta es la cantidad de “trabajo” que la CPU puede realizar por ciclo de reloj. Esta es la razón por la que el Pentium 4 no se ajustó bien, tenía un IPC bastante bajo.