A NVIDIA anuncia uma nova classe de supercomputadores de inteligência artificial com grande capacidade de memória. Criado para permitir o desenvolvimento de modelos gigantes de última geração para aplicações de linguagem generativas de IA, sistemas de recomendação e cargas de trabalho de análise de dados.
Leia Mais:
- Saiba como a inteligência artificial está ajudando os profissionais de marketing
- Google lança ‘AI experimental’ para gerar músicas
- Universal Music pede aos serviços de streaming bloqueio de inteligência artificial às suas músicas
O espaço de memória compartilhada da NVIDIA DGX GH200 utiliza a tecnologia de interconexão NVLink com o NVLink Switch System para combinar 256 superchips GH200, permitindo que funcionem como uma única GPU. Estima-se que os supercomputadores estejam disponíveis até o final do ano.
“IA generativa, grandes modelos de linguagem (LLMs) e sistemas de recomendação são os motores digitais da economia moderna”, diz Jensen Huang, fundador e CEO da NVIDIA. “Os supercomputadores de IA DGX GH200 integram as tecnologias de computação e rede aceleradas mais avançadas da NVIDIA para expandir a fronteira da IA.”
“Cada vez mais a NVIDIA vem investindo em soluções mais potentes para supercomputadores. Isso segue a tendência de mercado devido à demanda crescente por poder computacional avançado e aceleração de inteligência artificial”, reforça Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.
Uma nova ferramenta de pesquisa para pioneiros da IA
Google Cloud, Meta e Microsoft estão entre os primeiros a obter acesso a DGX GH200 para explorar seus recursos para cargas de trabalho de IA generativas. A NVIDIA também pretende fornecer o design como um modelo para provedores de serviços em nuvem e outros hiperescaladores, para que possam personalizá-lo ainda mais para sua infraestrutura.
“A construção de modelos generativos avançados requer abordagens inovadoras para a infraestrutura de IA”, afirma Mark Lohmeyer, vice-presidente de computação do Google Cloud. “A nova escala NVLink e a memória compartilhada dos Superchips Grace Hopper abordam os principais gargalos da IA em larga escala e estamos ansiosos para explorar seus recursos para o Google Cloud e nossas iniciativas de IA generativa.”
“À medida que os modelos de IA crescem, eles precisam de uma infraestrutura poderosa que possa ser dimensionada para atender às demandas crescentes”, ressalta Alexis Björlin, vice-presidente de infraestrutura, sistemas de IA e plataformas aceleradas da Meta. “O design Grace Hopper da NVIDIA procura fornecer aos pesquisadores a capacidade de explorar novas abordagens para resolver seus maiores desafios.”
Novo supercomputador NVIDIA Helios para pesquisa e desenvolvimento avançados
A NVIDIA está construindo seu próprio supercomputador IA baseado em DGX GH200 para potencializar o trabalho de seus pesquisadores e equipes de desenvolvimento. Batizado de NVIDIA Helios, o supercomputador contará com quatro sistemas DGX GH200.
Cada sistema no supercomputador Helios será interconectado com a rede NVIDIA Quantum-2 InfiniBand com largura de banda de até 400 Gb/s para aumentar a taxa de transferência de dados para treinar grandes modelos de IA. Ainda incluirá 1.024 Grace Hopper Superchips e deverá estar online até o final do ano.
Integrado e construído especificamente para modelos gigantes
Os supercomputadores DGX GH200 incluem softwares NVIDIA para fornecer uma solução completa e pronta para uso para as maiores cargas de trabalho de IA e análise de dados. O software NVIDIA Base Command™ oferece gerenciamento de fluxo de trabalho de IA, gerenciamento de cluster de nível empresarial, bibliotecas que aceleram computação, armazenamento e infraestrutura de rede e software de sistema otimizado para executar cargas de trabalho de IA.
Também está incluso o NVIDIA AI Enterprise, a camada de software da plataforma NVIDIA AI. Ele fornece mais de 100 estruturas, modelos pré-treinados e ferramentas de desenvolvimento para simplificar o desenvolvimento e a implantação da inteligência artificial de produção, incluindo IA generativa, visão computacional, IA de fala e muito mais.