Detalhes Nvidia Denver para “desempenho PC-class” em móveis

Um dos destaques do primeiro dia deste ano Hot Chips, uma conferência anual sobre tecnologia de chip, foi Nvidia inauguração de Denver, uma CPU personalizado usado em uma próxima versão do processador Tegra K1.

Há; duas versões do Tegra K1. A versão de 32 bits tem um quatro Cortex-A15 núcleos de CPU rodando a até 2,3 GHz, 32KB de instrução e dados caches L1 e 2MB de cache L2. Este chip está disponível agora e é usado em um punhado de dispositivos, incluindo o tablet Shield, a Xiaomi MiPad vendidos na China eo; Acer Chromeboook 13 anunciou hoje cedo. A segunda tem dois núcleos Denver CPU personalizada com base na instrução de 64 bits ARMv8 conjunto de execução de até 2.5GHz, 128K de L1 cache de instrução cache de dados de 64K L1, e 2MB de cache L2. Ambos usam a mesma GPU Kepler com 192 núcleos CUDA. Os dois chips são pinos compatível, o que deve tornar mais fácil para os dispositivos que funcionam com um ou ambos projetar.

A idéia por trás Denver, de acordo com Darrell Boggs, diretor de arquitetura de CPU e Arquiteto principal da Nvidia, é para proporcionar um desempenho PC-classe em dispositivos móveis compatíveis com o hardware ARM maciça e ecossistema de software. Para garantir este nível de desempenho, Denver tem um 7-wide arquitetura superescalar, o que significa que pode executar sete instruções por ciclo de clock em comparação com 3 instruções por ciclo de relógio com a A15, e usa a pré-busca hardware “agressivo”, uma técnica comumente usada para colocar os dados mais próximos da CPU antes de ser necessária para acelerar as coisas.

O rugas mais surpreendente é que a Nvidia está usando o que chama de otimização de código dinâmico para ainda mais o desempenho impulso. O processador pega o código ARM frequentemente reutilizados, converte-lo em micro-código otimizado e prende-lo em um 128MB dedicada de cache de esculpida na memória principal do sistema para oferecer o desempenho da execução fora de ordem sem a penalidade de potência associado a ele. Nvidia afirma que pode proporcionar o dobro do desempenho do hardware de nível básico através da conversão de código ARM ao código otimizado. Outros tentaram tradução binária antes e falhou – mais notavelmente Transmeta, que tentou desafiar Intel com a sua Crusoe chip, mas móvel Boggs disse que “muitas destas coisas que nós fixos em nossa implementação.”

Uma das outras surpresas é que esta versão do K1, ao contrário de outros processadores Tegra, não tem um baixo consumo de energia “core companheiro” para economizar energia na luz ou fundo cargas de trabalho. Em vez disso Nvidia adicionou um novo estado de energia que mantém o estado, mas reduz a potência abaixo da tensão mínima de funcionamento. O sistema pode entrar e sair deste estado CC4 muito rapidamente, como acontece com porta de clock, mas aproxima as economias de energia de gating poder, que é mais lento.

Nvidia mostrou os primeiros resultados de benchmark público para a Tegra K1 baseada em Denver contra processadores móveis high-end atuais, incluindo Snapdragon da Qualcomm (MSM8974), A7 Cyclone da Apple no iPhone 5s, e um Atom Bay Trail SOC (o Celeron N2910), bem como o Celeron 2955U baseia-core Haswell usado em muitos Chromebooks. O desempenho foi normalizado ao Tegra K1 baseada-A15 atual. O processador de Denver “significativamente superou” o processador baseado em ARM e Bay Trail em todos os pontos de referência, e entregou um nível de desempenho semelhante ao de 1.4GHz dual-core-on Haswell alguns Denver é mais rápido e em outros o processador de núcleo tem a borda.

A versão Denver de Tegra K1 está programado para ser lançado ainda este ano. Em uma vez Nvidia estava esperando para estender Denver todo o caminho até em servidores e supercomputadores, mas em junho a empresa disse que estava furando com móbil por agora.

Intel lança processadores de 7ª geração para empurrar 4K UHD para as massas

Visão e neurais redes impulsionar a demanda por chips mais potentes

Nvidia lança GPU virtual de monitoramento, análise

AMD contra-ataca contra a Intel dominância com Zen

Processadores; Intel lança processadores de 7ª geração para empurrar 4K UHD para as massas; transformadores; Visão e redes neurais impulsionar a demanda por chips mais potentes; Data Centers; Nvidia lança monitoramento GPU virtual, análise de Hardware; AMD contra-ataca contra a Intel dominância com Zen