Monitoração – Essência de qualquer alta disponibilidade

Nagios é uma ferramenta muito interessante (e eficiente) para monitorar serviços e servidores. Por outro lado, pode ser uma tarefa árdua e trabalhosa para alguns. Precisam ser investidas algumas horas em cima de vários arquivos de configurações para poder colocá-lo em funcionamento. Nós da Intercom vimos o quanto isso pode tirar a eficiência do Nagios para os nossos clientes, pois hoje todos têm horror a qualquer serviço ou aplicação sem interface gráfica. Por isso apresentamos o Nagios Web Config.

O Nagios Web Config é um software que serve para configurar os hosts, serviços, grupos de hosts, comandos e todas as demais configurações do Nagios (exceto a configuração inicial do mesmo) de forma visual e prática utilizando para isso o seu browser. Por isso mesmo, ele já foi planejado para ser implementado na própria sidebar do Nagios, o que facilita ainda mais seu uso.

E como ele trabalha ? Ao ir adicionando/deletando/editando as configurações ele vai armazenando as mesmas em um DB MySQL. Depois você pode solicitar que ele escreva as configurações e ele próprio irá gerar os arquivos necessários sem que haja necessidade de editá-los manualmente. Além disso, como os dados ficam num DB caso você precise reinstalar o servidor (ou por exemplo decida colocar o Nagios em outro servidor), não haverá necessidade de refazer todas as configurações.

 

Para quem ainda não conhece, o Nagios Web Config é uma excelente ferramenta que permite configurar o Nagios através do browser, tornando essa tarefa muito mais rápida e agradável.

 

Outro amigo dos profissionais que trabalham com o Nagios realizando monitoração é o  nagstamon. Este é um software que permite que você controle múltiplos servidores Nagios diretamente no seu desktop, sem a necessidade de uso do browser. Ele pode residir no systray ou pode ser visualizado como uma barra de status flutuante, resumindo ou exibindo todos os alarmes existentes. Além disso, ele possibilita a conexão aos servidores pelo seu menu de contexto, possui alarmes sonoros e também permite o uso de expressões regulares e categorias para realização de filtros, entre tantos outros recursos.

Leia a lista completa de recursos e baixe o software aqui.

Juntamente com o Nagiosweb essa é uma ferramenta essencial para administradores de servidores Nagios.

 

 

Se você tem um nagios, talvez verificar os hosts pelo painel do próprio não seja tão eficiente quanto utilizar o Nagstamon.

Claro que você pode configurar o Nagios pra enviar email, sms etc. Mas se você não olha freneticamente todos os emails que chegam e também não liga muito para os sms que chegam, você instala esse nagstamon e ele fica no canto no Painel da sua máquina, e então atualiza constantemente e mostra os alarmes que estão rodando pra você.

Olha só um exemplo simples que ta aqui na minha máquina agora:

E quando você passa a barra por cima do Warning, ele mostra mais detalhes:

Pra instalar esse cara no Debian por exemplo: basta executar um aptitude install nagstamon. É possível compilá-lo utilizando o tar.gz também contido no sourceforge.

 

Depois de instalado vá em Aplicativos -> Sistema e abra o programa.

Aparecerá uma tela como essa:

Não vou detalhar, pois o que se deve inserir em cada campo é bem sugestivos.

E fim! Só dar o OK e nem precisa olhar email nem nada, porque os alarmes irão piscar direto no seu painel!

Pra quem usa firefox, existem plugins para ver alarmes como este.

 

Voxblue – Migração de Infraestrutura Cloud

Recentemente, a Intercom executou uma migração típica “cloud/cloud”: mudamos uma estrutura de servidores Linux anteriormente hospedados na Linode.com para Amazon Web Services, para a empresa Voxblue.

A Voxblue possui um conjunto de ferramentas Internet voltadas para comunicação empresarial via email e redes sociais. Atua no segmento corporativo. Anteriormente, hospedava seus servidores Linux na Linode.com, que é um provedor de serviços Linux VPS/Cloud com excelente reputação técnica e no atendimento, e apresentava custos razoáveis.

A migração foi precedida por minucioso estudo de viabilidade. Os recursos técnicos de “cloud computing” – CPU, memória, espaço de disco, banda de Internet, snapshots, backups, balanceadores, DNS, etc., foram avaliados e dimensionados de forma equivalente. Um ambiente de testes foi montado com AWS, idêntico ao ambiente existente na Linode.com, para testar as funcionalidades das aplicações Voxblue. Um detalhado plano foi definido para execução da migração na data de corte estabelecida.

A principal razão para a migração foi econômica. A Linode.com oferece vários pacotes de serviços pré-determinados (número de CPUs, quantidade de memória, espaço de disco, volume de tráfego mensal – veja os planos aqui), com pagamento antecipado mensal, e oferece descontos de 10% para assinaturas pré-pagas de 1 ano, e 15% para 2 anos. Mas a Amazon Web Services oferece um desconto vencedor: para Instâncias Reservadas por 3 anos com pagamento antecipado, o desconto chega a 75%!  Tendo um plano agressivo de crescimento da Voxblue nos próximos 36 meses, manter a plataforma estável e operacional num mesmo provedor de “cloud computing” por 3 anos é uma boa decisão de planejamento. O resultado desta migração é uma redução de custo operacional de datacenter da ordem de 80%, liberando recursos que serão injetados para pesquisa e desenvolvimento de novos produtos.

 

Cloud Computing – Falhas e Recuperação de Desastres

Na região norte do estado da Virgínia, EUA, a Amazon Web Services mantém duas “zonas de disponibilidade” em dois datacenters. “Zonas de disponibilidade” são definidas como “localidades físicas distintas que são projetadas para ficarem isoladas uma das outras quando há falhas”. Em 29 de Junho passado, uma pesada tempestade atingiu esta região e derrubou a energia elétrica pública. Em um dos datacenters, o chaveamento automático para gerador de backup falhou por causa de uma sobretensão, o que causou quedas de inúmeras instâncias EC2 e bug inédito de software no “Elastic Load Balancer”, resultando em indisponibilidade de até 6 horas.

Além de problemas com eventos do tempo (estado atmosférico), “cloud computing” ainda é baseado em equipamentos físicos, e eles também falham. Por isso, provedores e usuários de “cloud computing” devem sempre ter planos de recuperação de desaster (DR).

Já é prática comum para grandes provedores de “cloud computing” distribuir recursos entre  datacenters físicos distintos e regiões geográficas distintas. Recentemente o conceito de “cloud balancing” começa a ganhar popularidade, pois permite que tráfego e carga de processamento seja distribuído e assumido por múltiplos datacenters distintos, trazendo como benefício a melhora na redundância e disponibilidade para seus usuários.

Mas usuários que dependem de “cloud computing” para fazer negócios devem sempre planejar a recuperação de desastres e a continuidade dos seus negócios. Contratar provedores de “cloud computing” independentes ou distribuir sua aplicação em várias regiões geográficas distintas são alternativas que devem ser consideradas seriamente, apesar dos seus maiores custos de operação adicionais.