Ceph: uma plataforma para a TI dos novos tempos
O SDS Ceph, que você vai conhecer melhor nesse artigo, é uma tendência do universo Cloud e Edge Computing. Siga a leitura para entender como aproveitar o que esse sistema de open source tem a agregar ao seu negócio.
O volume de dados armazenados, distribuídos e processados pelas empresas cresce exponencialmente a cada ano. A digitalização dos negócios permitiu a mudança para um modelo de trabalho remoto, além de uma redução expressiva na quantidade de papel – e consequentemente no corte de árvores – que envolvem os processos de negócio.
O “Digital First” tem sido a maior tendência nas estratégias empresariais atuais e isso significa que a taxa de crescimento do volume de dados manipulados só tende a aumentar. Bom, se essa já é uma tendência que as equipes de infraestrutura de TI das empresas precisam ter no radar, imagine então provedores de serviços gerenciados e de cloud computing (MSP/CSP)?
MSP e CSP tem milhares, ou até mesmo dezenas de milhares de empresas consumindo seus serviços de edge e cloud computing. Para oferecer mais flexibilidade e controle nesse cenário hiperescalável de armazenamento de dados, foi desenvolvida a tecnologia de armazenamento definido por software (software defined storage – SDS).
Além de conviver com o cenário atual, o SDS prepara os provedores de cloud computing para o novo jogo de edge computing. Falamos de um cenário em que a infraestrutura de TI precisa estar adequada à internet 5G e as características da web 3.0, o novo paradigma associado à utilização da rede mundial de computadores.
O que é Ceph?
Resumidamente, o Ceph é um sistema de armazenamento definido por software (SDS) baseado no princípio de código aberto e que abstrai a camada de hardware. Trata-se de uma solução projetada para rodar em hardware comercial off-the-shelf (COTS); independentemente de estar associada à ao tradicional RAID por hardware (redudant array of inexpensive disks), pois a redundância é aplicada no software.
O Ceph foi criado por Sage Weil, durante seus estudos de doutorado na Universidade da Califórnia e, num processo de melhoria contínua, esse protótipo de sistemas de arquivos se tornou uma plataforma de armazenamento de código aberto totalmente funcional.
Para entender melhor o quanto softwares como o Ceph colaboram para que a sua estrutura de armazenamento se torne menos complexa e altamente superior em desempenho, basta voltar um pouco no tempo. Se falarmos de um momento em que o setor de TI das empresas precisou começar a pensar em armazenamento, a infraestrutura necessária era bastante simples. Havia as Single Large Expensive Drives (SLEDs ou JBOD – just a bunch of disk) e era possível armazenar todos os dados nelas.
Mas logo se tornou necessário encorpar os elementos de hardware, surgindo os arrays redundantes de discos de baixo custo (RAID) e as novas necessidades não pararam, o que determinou um novo estágio. Mesmo que os discos rígidos fossem substituídos por solid-state drives (SSD), não estavam integrados as tecnologias mais modernas, como nuvem e containers. Nisso é que sistemas SDS como o Ceph evoluíram, abstraindo o hardware a partir da inteligência de software.
Trata-se, de uma solução para armazenamento definido por software, onde você utiliza hardware padrão para prover serviços de armazenamento de blocos, arquivos e objetos para seus clientes finais. Isso com a perspectiva do MSP/CSP: Armazenamento hiperescalável, confiável e boa relação custo-benefício.
A visão operacional
Quando se fala em armazenamento definido por software – o conceito norteador da tecnologia em foco nesse artigo – falamos justamente de separar software de armazenamento de seu hardware. É uma arquitetura que, além de ser mais flexível e controlável, permite uma infraestrutura de armazenamento dos dados escalável.
Viabiliza resolver as barreiras de IOPs (I/Os por segundo), que levavam o mercado a ter que adquirir controladoras RAID caríssimas; proprietárias para cada sistema de armazenamento. Isso trazia um problema de lock-in com determinado fornecedor (ou fornecedores), além de ineficiências logísticas e de custo. Nesta dinâmica de “ilhas de armazenamento” muitas vezes o MSP/CSP se deparava com capacidade ociosa em fornecedor “x”, e a necessidade de maior capacidade no fornecedor de equipamentos “y”.
As taxas de IOPs de sistemas SDS superam em muitas vezes aquelas de sistemas RAID, pois é possível configurar para leitura ou gravação simultânea um número muito maior de nós de rede SDS do que nos discos RAID. Adicionalmente, a partir da interface que controla o gerenciamento de dados na plataforma SDS, como o Ceph, os serviços de armazenamento de bloco, arquivo e objeto já estão prontos para o consumo das VMs e sistemas de usuários finais.
O principal diferencial do Ceph é a metodologia Object Store, armazenando cada pedaço de dados em um namespace plano e não hierárquico e relacionado a um “unique identifier”. Além disso, os detalhes do arquivo, seus metadados, são armazenados junto com o próprio dado. O sistema SDS desacopla dados do hardware de armazenamento físico, usando camadas de abstração de software. É uma base que fornece escalabilidade inigualável, recursos aprimorados de gerenciamento de falhas, e integração pronta para tecnologias Cloud Native.
O software deposita as informações geradas pela sua empresa no Ceph Block Device (CBD), uma unidade virtual, que pode ser anexada a bare-metal ou a servidores baseados em máquinas virtuais Linux. Quanto à gestão da dinâmica de armazenamento, o sistema se baseia no Ceph Reliable Autonomic Distributed Object Store (RADOS), que facilita o armazenamento de recursos de bloco, como snapshots e replicação.
Nessa estrutura, cada objeto é tratado individualmente como unidade de arquivo posteriormente agregada a pools de objetos, que ganham namespaces distintos. Nos grupos, há definições específicas quanto à forma de armazenamento, a regra de mapeamento e os níveis de replicação, bem como à dinâmica de distribuição das réplicas no cluster de armazenamento.
Por fim, o cluster de armazenamento Ceph é composto de object storage daemons/devices (OSDs). E aqui se explica um dos grandes segredos da plataforma. É a chance de o mesmo cluster armazenar vários pools de armazenamento que torna o processo altamente escalável e muito mais acessível.
Os principais recursos
- Provisionamento fino de armazenamento em bloco para otimização do uso do disco;
- Leituras e gravações parciais ou completas e transações atômicas;
- Codificação de replicação e eliminação para proteção de dados;
- Histórico de snapshots, clonagem e suporte a layers;
- Suporte à linha de comando (CLI) e sistemas POSIX;
- Mapeamentos de key-factor a nível do objeto;
- Compatibilidade da API Swift e AWS S3 Object;
- A plataforma Ceph pode ser acessada de diferentes maneiras: a partir de interfaces em bloco, como armazenamento de blocos, ou ainda como dispositivo de bloco;
Motivos para aderir ao Ceph
Depois de conhecer melhor as funcionalidades de ponta oferecidas pelo Ceph, não podemos deixar de tratar dos benefícios. Chegou a hora de entender as razões que levam MSP e CSP do mundo todo a optar pela plataforma:
- O Ceph é flexível, escalável e robusto;
- Falamos de um software que comprovadamente, melhora a relação custo-benefício da infraestrutura de TI ;
- Por fornecer interfaces para vários tipos de armazenamento em um único cluster, não se fazem necessárias as várias soluções de armazenamento ou qualquer hardware especializado;
- É um software que permite aplicações em casos de uso de nuvem pública, privada, híbrida e muit-cloud;
- Suporta cargas de trabalho de big data, computação cognitiva, machine learning e mídia avançada;
- A comunidade que contribui para o desenvolvimento e melhoria contínua do Ceph inclui empresas das mais reconhecidas nos segmentos de informática e tecnologia
Está interessado em conhecer mais sobre esse sistema de código aberto, que tem colaborado com a arquitetura de nuvem de organizações e corporações das mais diversas áreas, desde o setor acadêmico até os próprios provedores de nuvem?
O time da SC Clouds é altamente capacitado em SDS Ceph para dar um impulso de competitividade que o seu negócio busca atingir. Marque já uma conversa com nossos especialistas em Ceph e Open Source Gerenciado.