Esqueça HDs e SSDs, o armazenamento de DNA pode ser a única resposta para nossos problemas de dados
Estamos em rota de colisão com o desastre de armazenamento de dados, pois a demanda supera a capacidade disponível
Um novo relatório esclareceu a extensão do dilema enfrentado pelas organizações à medida que a demanda por capacidade de armazenamento de dados continua a disparar.
Publicado em conjunto pela Fujitsu e Twist Bioscience, ambas operando no mercado de armazenamento de arquivos, o relatório prevê que a diferença entre a capacidade de armazenamento disponível e a demanda excederá 7,8 milhões de petabytes até 2030.
Nesse cenário, as empresas não terão escolha a não ser excluir grandes faixas de dados antigos para dar espaço aos novos, o que é suficiente para causar um arrepio na espinha de qualquer empresa com aspirações em áreas como inteligência artificial.
Dilema de dados
À medida que o volume de dados produzidos pela atividade da Internet, dispositivos digitais e sensores de IoT continua a se expandir em uma taxa agressiva, as empresas estão ficando sem tempo para resolver um problema crítico: onde colocar tudo.
Embora as unidades de disco rígido (HDs) e as unidades de estado sólido (SSDs) façam um excelente trabalho ao armazenar e fornecer as quantidades de dados que os servidores e os dispositivos clientes precisam para funcionar, nenhum deles é adequado para armazenar informações em massa e por longos períodos.
Quando se trata de armazenamento arquivístico, a fita magnética Linear Tape-Open (LTO) é a principal, com o menor custo por capacidade de qualquer tecnologia. A geração atual de fitas, LTO-9, tem capacidade nativa de 18 TB e pode ser comprada por apenas US$ 150 (ou aproximadamente US$ 8,30/TB).
De acordo com o relatório, as grandes empresas terão que investir pesadamente em fitas e outras mídias de arquivamento, pois o volume de dados produzidos pelas operações comerciais continua aumentando. A alternativa seria descartar dados antigos, mas fazê-lo seria perder seu valor potencial como fonte de insights; os produtos de IA mais avançados são normalmente informados pelos maiores e mais completos conjuntos de dados.
“Acreditamos que a maioria desses [novos] dados corporativos serão não estruturados, 'frios', acessados com pouca frequência e terão que ser mantidos a um custo mínimo”, explicou o autor do relatório Jon Monroe, que diz que a disseminação dos gastos com armazenamento precisará refletir esse fato.
No entanto, embora econômica, a fita também tem seus pontos fracos; os dados só podem ser acessados serialmente, dificultando a localização de arquivos específicos, e as empresas também precisam migrar para novas fitas de forma semi-regular para evitar a perda de dados.
À luz dessas questões, os pesquisadores estão buscando novas tecnologias de armazenamento ultradensa e ultradurável. Alguns candidatos diferentes surgiram, mas um conceito parece particularmente promissor: DNA.
Armazenamento de DNA
O DNA, o material fundamental dos organismos vivos, é composto de quatro blocos de construção molecular: adenina (A), guanina (G), citosina (C) e timina (T). Esses compostos se conectam em pares (A-T e G-C) para formar os degraus da famosa escada de dupla hélice.
Essa estrutura pode ser utilizada como uma forma extremamente densa e durável de armazenamento de dados, convertendo 1s e 0s binários no alfabeto genético de quatro letras. Descobriu-se que um único grama de DNA é capaz de armazenar 215 PB (220.000 TB) de dados.
“A DNA tem a promessa de oferecer os três mágicos em armazenamento: densidade ultra-alta, custo razoável e sustentabilidade”, disse Emily Leproust, CEO e cofundadora da Twist Bioscience, que está investindo pesadamente na concretização da tecnologia.
“Esperamos que novas mídias sejam necessárias para atender a demanda de armazenamento não atendida de mais de US$ 7 bilhões projetada nos próximos anos”.
Tal como está, a tecnologia permanece inutilizável em escala, como resultado do tempo necessário para gravar dados no DNA e vários outros desafios. Naturalmente, o relatório também precisa ser visto com uma pitada de sal, produzido como foi por duas organizações com interesses escusos no aumento dos gastos com armazenamento arquivístico.
No entanto, não há como negar que o aumento da capacidade das tecnologias tradicionais de armazenamento de dados não está conseguindo acompanhar a taxa de produção de dados, o que significa que uma reorientação da pilha de armazenamento é inevitável.
“Os datacenters do futuro precisarão de tudo o que as indústrias de SSD, HD e fitas podem fabricar e fornecer, além de exigir novas tecnologias de armazenamento de DNA e óptico e talvez outras tecnologias de armazenamento corporativo, para preservar de maneira econômica e confiável os artefatos inestimáveis de nossa, história corporativa e cultural”, acrescentou Monroe.
“Os desafios de disponibilidade e sustentabilidade, combinados com os custos de gerenciamento de nosso universo de dados de vários milhões de petabytes em períodos de tempo cada vez mais longos, criarão novos casos de uso para tecnologias de armazenamento antigas e exigirão a criação de novos, mais econômicos e eficientes em termos de energia e tecnologias de armazenamento”.
Comentários
Postar um comentário