Software Defined Storage e suas vantagens

Software Defined Storage (SDS) é uma arquitetura de armazenamento que utiliza um sistema para prever e gerenciar a capacidade de provisionamento de dados em servidores físicos. Na prática, a estrutura de arquivos fica organizada numa interface que permite ao usuário administrar uma grande quantidade de dados de forma unificada, otimizando a capacidade de armazenagem de seus datacenters. 

 

Além das facilidades de gestão de dados e recursos, essa forma de coordenar a infraestrutura de armazenamento é importante para reduzir custos. Pesquisas apontam que o crescimento anual da quantidade de dados é de aproximadamente 40%, sendo que os orçamentos de tecnologia da informação estáveis não são suficientes para acompanhar esta expansão.   

Por isso tornou-se urgente a busca por alternativas mais econômicas para guardar e orquestrar ativos digitais. Caminhando nesta direção, o software defined storage - em tradução livre: “armazenamento definido por programas” - emergiu como uma alternativa plástica e estável, que aplica um plano de controle, separando o hardware de provisionamento físico (plano de dados) da lógica de gestão de armazenamento de dados.   

Os produtos dessa tecnologia são ideais para identificar a necessidade de aumento da capacidade simultaneamente ao aumento da demanda, otimizando investimentos em hardwares de armazenamento tradicionais. 

O SDS permite uma gestão proativa e flexível, ao passo que seu modelo de aquisição e custos de armazenamento são bastante competitivos. 

Ceph  

Ceph é um sistema SDS open source projetado para ser executado em máquinas genéricas e de baixo custo, portanto, não requer componentes de hardware patenteados. Além de ser uma alternativa muito mais acessível para implementação, ainda facilita a substituição de máquinas que venham a apresentar falhas ou que simplesmente tornem-se obsoletas.   

O software surgiu como um projeto de pesquisa de PhD em sistemas de armazenamento na Universidade da Califórnia. Em março de 2010, já era possível encontrar o Ceph no kernel principal do Linux, o que fez dele um recurso atrativo para ser distribuído de forma escalável.  

Sob uma perspectiva simplificada, o ecossistema Ceph pode ser dividido em quatro segmentos principais: clientes (usuários dos dados), servidores de metadados (aqueles que guardam em cache e sincronizam conjuntos de dados para viabilizar o controle de versão), um cluster de armazenamento de objetos (conjunto de diferentes máquinas para guardar dados) e, finalmente, os monitores do cluster (que exercem as funções de monitoramento de todo cenário).  

As bibliotecas do Ceph, por sua vez, fornecem acesso direto ao sistema de armazenamento de três formas diferentes:  

  • Baseado em objetos – Os dados não são colocados em uma hierarquia de diretórios e vivem em um espaço simples, porém inteligente, e são capazes de executar o mapeamento de objetos para blocos;  
  • Por blocos – Dados são fragmentados e replicados automaticamente num cluster; 
  • Sistema de arquivos – Os dados são armazenados tendo como parâmetro a hierarquia ​​estabelecida pelo tipo de aplicativo à que pertence.   

 Essa flexibilidade é valiosa para empresas que executam aplicações com diferentes necessidades de interface de armazenamento, não sendo restritiva a um único tipo de sistema de arquivos, mas contemplando todos eles numa dinâmica de gerenciamento centralizado.  

Toda essa lógica de funcionamento entrega aumento no desempenho e capacidade dos servidores principalmente porque da forma como é conduzida, a alocação dos recursos de hardware é realizada de forma automatizada, tendo em vista o uso e carga de trabalho, eliminando ociosidades e direcionando os arquivos para o sistema mais adequado de aprovisionamento.   

Outros recursos que merecem ser mencionados são as capturas instantâneas, que podem ser criadas em qualquer subdiretório no Ceph e incluem todo o seu conteúdo. Também vale a pena citar que o Ceph permite executar contabilidade de arquivos e capacidade no nível do subdiretório, que reporta o tamanho do armazenamento e o número de arquivos neste, bem como todos os seus conteúdos abrigados.  

Além disso, cabe salientar que estes mesmos insights oferecidos pelo Ceph para gerenciamento de dados podem ser aplicados em contextos que requeiram o mesmo tipo de respostas, como a gestão de redes e construção de nuvens robustas, por exemplo.   

Muito embora o Ceph não seja único no espaço de sistemas de arquivos distribuídos, é único na maneira como administra e automatiza um grande ecossistema de armazenamento e por isso vale muito apena considerá-lo na hora de reformatar seu ambiente storage.  

Afinal de contas, não precisamos ir muito longe para entender que se a estratégia de armazenamento de hardware é definida com base nas necessidades sinalizadas pelo software, pouparemos muito tempo; ao passo que se o custo com as máquinas é significativamente menor e têm desempenho otimizado, certamente economizaremos muito dinheiro.