Teclado com tecla azul escrita anomaly detection
Automatize a detecção de problemas de rede com machine learning

O aprendizado de máquina é um aliado poderoso para detectar problemas ou anomalias em grandes ambientes conectados.

Machine learning (aprendizado de máquina) é uma das áreas que mais avançou tecnologicamente nos últimos anos. O tópico da inteligência artificial vem transformando várias áreas da ciência e da nossa sociedade, gerando grande interesse.

De cinco anos para cá, o Google registrou um aumento de mais de 1.428% em buscas utilizando o termo machine learning. Uma pesquisa no Google Scholar pelo mesmo termo já retorna mais de 4 milhões de artigos.

Esse interesse não vem à toa. A tecnologia tem inúmeras aplicações, como assistentes de voz em smartphones, filtros de spam, detecção de fraudes, predições para mercados de valores, detecção de doenças e outros diagnósticos médicos e, como veremos neste artigo, detecção de anomalias em grandes redes de computadores.

Desafios no monitoramento de rede

Ser capaz de detectar variações potencialmente problemáticas e agir com base nesse conhecimento é essencial para garantir a saúde e segurança da rede. Anomalias nesses ambientes podem sinalizar uma série de problemas, entre eles:

  • Falhas de configuração em ativos de rede;

  • Sobrecarga de equipamentos e aplicações;

  • Balanceamento de carga entre nós;

  • Ataques de força bruta.

Porém, analisar a quantidade absurda de transações de um ambiente computacional e identificar anomalias em meio a elas é uma tarefa extremamente desafiadora e, na maioria das vezes, demorada.

Desafiadora, porque mudanças sutis ao longo do tempo, por exemplo, podem passar despercebidas em uma análise humana, sendo notadas apenas quando já é tarde demais. Ou ainda, um comportamento anômalo na rede hoje pode ser normal no fim do mês.

Demorada, porque para se ter um panorama do que está acontecendo ou prestes a acontecer, é preciso fazer um comparativo com eventos de períodos anteriores. Como saber se a leitura atual de uma métrica é compatível com o esperado no mesmo período do dia ou semana anterior?

É aqui que entra o aprendizado de máquina. Algoritmos de machine learning podem ser empregados para transformar a imensa quantidade de dados de rede (wire data) em conhecimento, ajudando a identificar e evitar problemas no ambiente.

Detecção de anomalias de rede com machine learning

A inteligência artificial nos permite automatizar a identificação de eventos que fogem do padrão, mesmo nas mais extensas e complexas estruturas de rede. Para isto, é preciso indicar uma métrica chave para ser analisada pelo algoritmo.

O algoritmo é treinado para compreender o comportamento da métrica selecionada, gerando o conhecimento necessário para apontar o que é ou não anômalo. Esse treinamento pode se basear em um intervalo específico de tempo, ou em um processo de aprendizado constante que acompanha a evolução da sua rede.

Gráfico representando detecção de anomalias de rede com machine learning

Em ambos os casos, o conhecimento adquirido gera uma baseline dinâmica que prevê como a métrica deve se comportar ao longo do tempo. Assim, toda vez que houver um comportamento inesperado, podemos ser alertados em tempo real (imagem acima) e agir em tempo hábil para solucionar/evitar problemas na operação.

É importante salientar que a eficácia do algoritmo depende da qualidade e quantidade dos dados utilizados no treinamento. Até o momento, wire data têm sido a fonte mais rica de informações para este fim, oferecendo uma entrada completa e contínua de informações. Esta combinação de recursos (coleta e análise de wire data, machine learning e sistema de alarmes inteligentes) é encontrada nas soluções mais avançadas de Wire Data Analytics, como o Zerum Falcon.

Conclusão

Utilizando modernos algoritmos de machine learning, conseguimos prever o comportamento de métricas importantes de rede. O aprendizado acumulado gera o que chamamos de baseline dinâmica. Com o monitoramento contínuo dessas métricas, podemos gerar alarmes sempre que surgirem leituras fora do esperado e evitar maiores problemas, automatizando de forma simples o oneroso processo de monitoramento.