Cree una CPU para juegos de cuatro núcleos rápida
En una reciente inmersión profunda en el hardware, observamos cómo los núcleos de la CPU y el caché afectan el rendimiento del juego. Para hacer esto, usamos tres procesadores Intel Core y comparamos su rendimiento de escalado de núcleo y descubrimos que en los juegos de hoy en día, obtienes la mayor parte de lo que obtienes al actualizar de un Core i5-10600K a un Core i7-10700K o incluso a un Core i9- 10900K La mejora del rendimiento se debe en gran medida a la mayor capacidad de caché L3.
Este es un análisis interesante, ya que la mayoría de las personas que actualizan sus componentes Intel de generaciones anteriores (como el Core i7-8700K) al Core i9-10900K más nuevo y observan un gran aumento en el rendimiento de los juegos tienden a pensar que se debe al aumento del 67 % en los núcleos. pero en gran parte esto se debe a un aumento del 67 % en la memoria caché L3, al menos para los juegos más exigentes de la actualidad.
Después de esta prueba, muchos de ustedes se preguntaron qué diferencia haría la capacidad de caché L3 cuando solo 4 núcleos estaban activos, y se preguntaron si la ganancia sería mayor. Así que volvimos y volvimos a probar la configuración de 4 núcleos y 8 hilos, agregando tres juegos más y un cuarto procesador, el 4C/8T Core i3-10105F.
Dado que el modelo Core i3 está bloqueado, no podemos usar el reloj de 4,5 GHz; en su lugar, el 10105F funciona a 4,2 GHz, que es la frecuencia de todos los núcleos para las especificaciones, por lo que ejecutará la parte K-SKU a un 7 % menos . El Core i3-10325 podría encajar mejor en esta prueba, pero no pudimos obtener uno a tiempo para esta prueba. Si bien la parte Core i3 está en desventaja, aún debería ser una adición interesante considerando las limitaciones más limitadas del caché L3 de 6 MB.
La CPU de cuatro núcleos más rápida que Intel ha producido hasta la fecha es la Core i7-7700K, o una de las Comet Lake Core i3 con frecuencia más alta como la Core i3-10325, ambas con 8 MB de caché L3, o más de 2 MB que 10105F. Por lo tanto, será interesante ver qué tipo de ganancia podemos obtener con una CPU de cuatro núcleos con 20 MB de caché L3, podemos lograr 10900K al deshabilitar seis núcleos para esa parte.
Para armar esta prueba, usamos una placa base Gigabyte Z590 Aorus Xtreme con tres CPU Intel K-SKU con velocidad de reloj de 4,5 GHz, un multiplicador de bus de anillo de 45 y memoria de doble canal DDR4-3200 CL14 de doble rango con configuración manual de todos los principales , temporizaciones secundarias y terciarias. El Core i3-10105F usa las mismas especificaciones de memoria.
La mayoría de las pruebas se realizaron con la Radeon RX 6900 XT, ya que es la tarjeta gráfica para juegos de 1080p más rápida que puede comprar, aunque hemos incluido algunos resultados de la RTX 3090 para ver la sobrecarga de Nvidia, que sospechamos afectará la configuración de cuatro núcleos. .
punto de referencia
Comenzaremos con Rainbow Six Siege, donde anteriormente vimos la diferencia de rendimiento más dramática entre las capacidades de caché. Por ejemplo, con todas las CPU bloqueadas en 6 núcleos, observamos un aumento masivo del 18 % en la memoria caché L3 de 12 MB a 20 MB.
Luego, con solo 4 núcleos habilitados, el headroom de 10600K a 10900K en realidad se reduce al 13%, que es mucho más pequeño que lo que ve con 6 núcleos habilitados. Esto nos da una pista de que una caché L3 más grande se vuelve menos efectiva para mejorar el rendimiento porque hay menos núcleos disponibles.
Esto se ilustra mejor con el Core i3-10105F, que es solo un 9 % más lento que el 10600K, teniendo en cuenta que su reloj es un 7 % más bajo, por lo que presumiblemente al menos la mitad del margen se debe a la diferencia de velocidad del reloj. Vale la pena señalar que cuando se usa el 10900K con solo 4 núcleos activados, el rendimiento del Core i3 de 4 núcleos se puede mejorar en un 24 %. Este es un gran aumento ya que ambas CPU usan la misma arquitectura Comet Lake, la única diferencia es un cambio de frecuencia de reloj del 7% y la capacidad de caché L3, que es más de 3x para la parte i9.
El punto aquí es que no todos los núcleos se crean de la misma manera, e incluso si los núcleos son físicamente iguales, las diferencias en la capacidad de caché tendrán un impacto. Rellenar más caché en la CPU sigue siendo bueno para la actividad de solo 4 núcleos, pero no es tan eficiente como los 6 núcleos que hemos visto.
A continuación tenemos Assassin’s Creed Valhalla, un título fuertemente ligado a la GPU, especialmente cuando se usa el preajuste de calidad «Ultra», incluso con la Radeon RX 6900 XT a 1080p. Como resultado, los puntos de referencia dependen casi por completo de la GPU, y solo el Core i3 muestra una ligera caída del 1% en el rendimiento, lo que sugiere que el rendimiento del tiempo de cuadro no es tan bueno como el caché L3 de 6 MB, pero tampoco significativamente peor.
Nuevo en esta prueba es Battlefield V. Aquí podemos ver que el caché L3 de 20 MB del 10900K es muy útil, incluso cuando está limitado a 6 núcleos. Reducir a 4 núcleos crea un cuello de botella en la CPU que más caché no puede resolver. Al pasar de 16 MB a 20 MB, el 1% de bajo rendimiento mejoró un 9%, que no es nada, pero fue inferior al 13% de ganancia que vimos con 6 núcleos habilitados.
Ahora, con solo 4 núcleos habilitados, el 10900K está a la par con el stock de 10600K. De hecho, el rendimiento del tiempo de cuadro fue mejor, mejorando el mínimo del 1 % en un 12 %. Cuando se trata de un 1 % de bajo rendimiento, el Core i3 tiene un poco de dificultad, cayendo a 71 fps, que es un 19 % más lento que el 10600K y un 30 % más lento que el 10900K. Nuevamente, esta es una diferencia increíble que depende casi por completo de la diferencia en la capacidad de caché L3.
Los resultados de F1 2022 son similares a los que hemos visto hasta ahora, con la falta de caché L3 que tiene un mayor impacto en los 6 núcleos, aunque vimos algunas diferencias cuando los 4 núcleos estaban activos. El 10700K fue solo un 3 % más lento que el 10900K, y el 10600K fue otro 3 % más lento que el 10700K. La escala allí es bastante consistente. La parte del Core i3, aunque un 8% más lenta que la 10600K, es un 11% más lenta si nos fijamos en el 1% de resultado bajo.
Podemos estimar que hasta ~5 % de margen de maniobra podría deberse a las diferencias en las velocidades de los relojes y, si ese es el caso, la escala sigue estando más o menos en línea con lo que hemos visto en los K-SKU.
Hitman es un juego que hace un uso intensivo de la CPU, y con 6 núcleos habilitados, podemos ver un aumento del rendimiento del 9 % de 12 MB a 20 MB de caché L3. Con solo 4 núcleos habilitados, ese margen se reduce, esta vez en un 6%. Luego vemos una caída del 9 % en el rendimiento del 10600K al 10105F.
Horizon Zero Dawn se parece mucho a Assassin’s Creed Valhalla en que es principalmente un título vinculado a GPU, incluso a 1080p y 6900 XT. Por lo tanto, la configuración de 4 núcleos no es mucho más lenta que la que vimos con 6, 8 y 10 núcleos habilitados. El segmento Core i3 también se desempeñó bien en relación con los modelos Core i5, i7 e i9 de gama alta.
Cyberpunk 2077 es un juego que hace un uso intensivo de la CPU y verá grandes beneficios al actualizar a un procesador moderno de 6 núcleos como el Core i5-10600K. Dicho esto, si el 10600K estuviera equipado con un caché L3 de 20 MB, este título sería un 13 % más rápido cuando se observa un rendimiento bajo del 1 %. Dado que la configuración de 10900K es un 12 % más rápida que la de 10600K, este margen se mantiene bastante constante cuando solo se habilitan 4 núcleos.
Curiosamente, la configuración de 10600K de 4 núcleos fue solo un 6 % más rápida que el Core i3-10105F en promedio, pero un 19 % más rápida que el 1 % de bajo rendimiento, que es donde el Core i3 realmente tuvo problemas a 64 fps.
Al observar la sección del Core i3, vemos una gran diferencia de rendimiento del 56 % entre la frecuencia de fotogramas baja del 1 % y la frecuencia de fotogramas promedio, mientras que el 10600K solo ve un margen de maniobra del 39 %, lo que sugiere un rendimiento de tiempo de fotogramas más consistente.
En particular, el 10900K con solo 4 núcleos activos funcionó muy bien, brindando un rendimiento fluido y constante, aunque un 25 % más lento que las configuraciones de 6, 8 y 10 núcleos. El 10105F sufrió un tartamudeo significativo, que nuevamente se reflejó en el bajo rendimiento del 1% más débil. Por lo tanto, si bien un quad core de 10.ª generación con caché L3 puede jugar sin problemas, sigue siendo significativamente más lento que 6 núcleos, y el uso de 8 núcleos no muestra ninguna mejora en el rendimiento promedio de la velocidad de fotogramas o el rendimiento del tiempo de fotogramas.
El siguiente es Shadow of the Tomb Raider, otro juego que hace un uso intensivo de la CPU, pero nuevamente, con solo 4 núcleos habilitados, las CPU de 10.ª generación no pueden aprovechar el caché L3 adicional que pueden con 6 núcleos. No fue hasta que la caché L3 se configuró en 6 MB con la parte Core i3 que el rendimiento comenzó a degradarse, una caída del 16 % en un rendimiento bajo del 1 % en comparación con 10600K.
Probado con RTX 3090
Cuando finalizamos nuestras pruebas de cuatro núcleos, pensamos que sería interesante volver a ejecutar algunas de ellas con la GeForce RTX 3090. Con 6 núcleos habilitados en SoTR, el 10600K es un 13 % más lento que usar el 10900K Radeon y GeForce son un 15 % más lentos, por lo que no hay mucho cambio.
Luego, con 4 núcleos habilitados, el 10600K es un 4 % más lento que el 10900K de Radeon, y vemos resultados completamente diferentes con el RTX 3090. Aquí, la velocidad de fotogramas promedio del 10600K es un 14 % más lenta que la del 10900K, con un mínimo del 13 % más lento. Este es el resultado de la sobrecarga adicional de Nvidia al usar la CPU para la mayor parte de su programación de GPU.
Sin embargo, es la parte del Core i3 la que realmente se ve afectada por la programación del software, lo que reduce el bajo rendimiento del 1% a solo 54 fps, lo que lo hace un 28% más lento que el 10600K, en comparación con el 16% más lento anterior. Los resultados de 4 núcleos en Hitman, Cyberpunk 2077, Battlefield V, etc. probablemente serían más importantes si usáramos el RTX 3090 para todas nuestras pruebas.
También probamos Watch Dogs Legion con GPU de gama alta Radeon y GeForce. Antes de usar Radeon, no notamos mucha diferencia con la parte K-SKU, los resultados fueron casi los mismos con 6 núcleos habilitados, luego 8 núcleos proporcionaron solo un pequeño impulso. Sin embargo, 4 núcleos degrada significativamente el rendimiento. Por ejemplo, el 10600K fue un 17 % más lento con 4 núcleos habilitados y vemos márgenes similares para el 10700K y el 10900K. Dicho esto, el rendimiento es similar entre las diversas configuraciones de 4 núcleos, incluso la parte del Core i3 se mantiene estable.
El uso del RTX 3090 tiene poco efecto en los resultados de 4 núcleos. El 10600K con solo 4 núcleos habilitados fue un 19 % más lento que la configuración estándar de 6 núcleos. Pero, sorprendentemente, los márgenes con 6 y 8 núcleos habilitados son bastante diferentes, y parece que el caché juega un papel más importante cuando se instala el RTX 3090, presumiblemente porque la CPU tiene que hacer más trabajo.
También es interesante que no vemos la misma escala con 4 núcleos habilitados, pero parece que hay muy pocos núcleos para aprovechar la mayor capacidad de caché L3.
lo que aprendimos
Esta es una mirada interesante al rendimiento de la CPU, pero probablemente no sea lo que muchos de ustedes esperaban. Creemos que con menos núcleos, el caché L3 más grande del 10900K jugará un papel más importante, pero ese no parece ser el caso en la mayoría de los casos.
Obviamente, para los juegos de gama media y alta, el quad-core está oficialmente fuera. Lo sabemos desde hace un tiempo, por lo que AMD e Intel dejaron de fabricar procesadores de cuatro núcleos de gama media. Sin embargo, para los sistemas de gama baja, los núcleos cuádruples seguirán funcionando bien, pero debe aclararse que cuando decimos núcleo cuádruple nos referimos a un procesador de 4 núcleos/8 subprocesos que admite subprocesos múltiples simultáneos.
Por ejemplo, en juegos exigentes como Battlefield V, Shadow of the Tomb Raider y Cyberpunk 2077, el rendimiento del tiempo de cuadro se verá afectado, pero en la mayoría de los juegos, si usa una GPU económica como Radeon RX 5500 XT, GeForce GTX 1650 Súper, o lo que sea más lento, un quad core decente alcanzará niveles de rendimiento aceptables.
Un límite de fotogramas de 60 fps ayudará a suavizar nuestras velocidades de fotogramas en juegos como Cyberpunk 2077, ya que reduce la carga de la CPU y la variación de fotograma a fotograma. Entonces, si tiene problemas con la tartamudez, intente limitar su velocidad de fotogramas a un nivel más sostenible, ya que eso ayudará.