Explorando as novas fronteiras da Computação em Nuvem com os Aceleradores AMD

17 Abril 2024
Najnowsze akceleratory MI300X firmy AMD zyskują popularność wśród operatorów chmury

Operadores de nuvem especializados em gerenciar unidades de processamento gráfico (GPUs) e outras infraestruturas de inteligência artificial intensivas em energia estão cada vez mais recorrendo aos aceleradores da AMD em vez das ofertas da Nvidia.

Uma dessas operadoras, a TensorWave, recentemente iniciou a integração de sistemas com os novos aceleradores AMD Instinct MI300X. A empresa planeja alugar esses chips a preços mais baixos em comparação com os aceleradores da Nvidia.

Os mais recentes aceleradores AMD têm despertado interesse significativo devido às suas vantagens. Eles estão prontamente disponíveis para compra em comparação com os produtos concorrentes da Nvidia, proporcionando à TensorWave acesso a uma grande quantidade por meio de suas habilidades de negociação.

Até o final de 2024, a TensorWave pretende instalar 20.000 aceleradores MI300X em suas duas instalações. Além disso, a empresa planeja introduzir sistemas de resfriamento líquido no próximo ano para desempenho aprimorado.

Os circuitos integrados AMD também são mais rápidos do que o altamente procurado Nvidia H100. O MI300X supera o H100 em especificações, ostentando maior capacidade de memória e throughput de dados. Ele foi apresentado durante o evento Advancing AI da AMD em dezembro de 2024 e relata ser 32% mais rápido do que o Nvidia H100.

Em comparação com o concorrente H100, o chip AMD apresenta capacidade de memória HBM3 maior de 192 GB, possibilitando um throughput de dados de 5,3 TB/s. Em contraste, o H100 possui uma capacidade de memória de 80 GB e throughput de 3,35 TB/s.

Embora os aceleradores AMD estejam ganhando popularidade, alguns usuários ainda questionam seu desempenho em comparação com os produtos da Nvidia. A TensorWave planeja implantar nós MI300X usando a tecnologia RoCE (RDMA sobre Ethernet Convergido) para acelerar os processos de implantação.

Os planos de longo prazo da TensorWave incluem a implementação de uma solução de gerenciamento de recursos mais avançada, conectando até 5.750 GPUs e petabytes de memória de alto throughput usando a tecnologia FabreX baseada em PCIe 5.0 da GigaIO. Este projeto será financiado por meio de um crédito seguro de acelerador de GPU, um método também utilizado por outras empresas de data center.

Iniciativas semelhantes foram empreendidas por outros players do setor, com a Lambda garantindo um crédito de US$ 500 milhões e a CoreWeave obtendo US$ 2,3 bilhões para expansão de infraestrutura. A TensorWave pretende anunciar notícias semelhantes ainda este ano.

Para obter mais informações sobre os aceleradores AMD e suas aplicações em inteligência artificial, visite o site da AMD.

FAQ

O que são aceleradores AMD?
Aceleradores AMD são unidades avançadas de processamento projetadas para aprimorar o desempenho de processamento gráfico e tarefas de inteligência artificial.

Como os aceleradores AMD diferem dos aceleradores Nvidia?
Os aceleradores AMD oferecem vantagens como disponibilidade para compra e especificações superiores, incluindo maior capacidade de memória e throughput de dados em comparação com os produtos da Nvidia.

Quais tecnologias a TensorWave planeja implementar para otimizar o desempenho dos aceleradores AMD?
A TensorWave planeja utilizar a tecnologia RoCE (RDMA sobre Ethernet Convergido) para acelerar os processos de implantação e avaliar a eficiência dos aceleradores AMD.

The source of the article is from the blog hashtagsroom.com

Don't Miss

Xbox TV App Launches on Amazon Fire Sticks, Providing Game Streaming Without a Console

Aplicativo Xbox TV é lançado na Amazon Fire Stick, permitindo streaming de jogos sem um console

A Microsoft continua sua missão de expandir o jogo em
Five Innovative Features from GTA Chinatown Wars that Would Enhance GTA 6

Cinco Novas Inovações que Podem Revolucionar o GTA 6

À medida que a expectativa aumenta para o tão aguardado