Mas isso aí depende também, porque se for jogo que tem tasks pesadas, essas tasks que não são divisíveis, é o processador com IPC mais baixo que irá dar essas travadas.
Eu já postei esse vídeo aqui uma duas vezes, mas sempre vale lembrar:
O teste é melhor ainda porque é feito com o mesmo CPU, observem que batem o mesmo desempenho multithread em testes sintéticos. Mas a configuração com maior clock e menos núcleos tem desempenho melhor também numa aplicação muito bem otimizada para multithread.
E por que isso acontece? Ora, o núcleo a 4 ghz ele dá conta de lidar com 2 tasks que apenas um núcleo daria conta no de maior números.
Tente imaginar a seguinte situação, você tem um armário, com gavetas. E você tem itens de tamanhos maiores e tamanhos menores. Mas os dois armários são do mesmo tamanho. É mais fácil encaixar no armário de menor gavetas todos os itens que encaixar no armário de mais gavetas. Se você não consegue colocar todos os itens no armário de mais gavetas, ele vai ficar parcialmente não preenchido. E é isso que gera essa ociosidade nos processadores que tem muitas threads.
E por isso que eu disse, maior uso é bom. Com placas de vídeo é mais fácil fracionar todo o trabalho que a GPU é capaz de fazer, daí mesmo aumentando significamente os cuda cores, você tem uso de 100%, se tivéssemos algo semelhante com processadores, aí sim, a Intel poderia fazer com esse mesmo silício uma CPU de 40 E-Cores que ela iria superar o 12900k. Só o fato dela não fazer isso já nos mostra que essa busca alucinante por mais núcleos é um tanto exagerada. Núcleo tem que entrar para somar, se ao socar mais e mais núcleos houver perda de IPC, não vale a pena acrescentar.