O que é Machine Learning?

Como seres humanos temos a habilidade de aprender e nos tornar melhores nas tarefas que nos propomos a fazer através das experiências. Se ao nascer não sabemos nada, vamos desenvolvendo diversas capacidades ao longo da vida, mas o que isso tem a ver com o título? Os computadores podem fazer o mesmo. O Machine Learning (aprendizado de máquina) reúne estatísticas e ciência da computação para instruir computadores a realizar diferentes funções, mesmo sem serem necessariamente programados para fazer isso.

As máquinas procuram padrões estatísticos para definir o que se encaixa como um rótulo ou outro, se você alimenta a memória com imagens de carros e motos, definindo cada uma com seu respectivo rótulo, o padrão de identificação será seguido mesmo em novas imagens não categorizadas por você, desde que o computador já tenha organizado as informações e variações numericamente. Para que o computador trace com perfeição a linha ótima entre as diferentes categorias, é necessário que seja abastecido com um grande número de dados, melhorando o algoritmo e suas previsões.

O Machine Learning já é amplamente utilizado, está na tecnologia de reconhecimento facial, no reconhecimento de fala para texto (como visto no artigo sobre Inteligência Artificial), nos filtros de spam no e-mail, em compras online, recomendações de próximos vídeos a assistir, detecção de fraudes em cartões, diagnósticos médicos, entre outros.

 

Como fazer a máquina aprender com dados?

machine learning

Se você tem, por exemplo, o valor de uma casa pequena, em torno de R$ 70.000,00, e de outra grande em torno de R$ 160.000,00, como fazer com que a máquina estime o valor de uma casa média? Passos:

  • Construa um plano cartesiano com as variáveis tamanho da casa em “X” e preço da casa em “Y”;
  • Adicione exemplos de casas, com seus respectivos tamanhos e preços, para criar pontos no plano;
  • Como o computador não pode simplesmente visualizar os pontos no plano e traçar uma reta, deve-se traçar uma reta e calcular as distâncias entre os pontos e ela, chamando essa diferença de “erros”;
  • Instrua o computador para repetir o procedimento até reduzir o erro total o máximo possível, então a reta estará ajustada;
  • O computador traça uma regressão linear, ou regressão logística em casos avançados, e acha o ponto que indica o preço da casa média, em torno de R$ 120.000,00 por exemplo;
  • Utilize o método estatístico mais recomendado para a solução de aprendizado de máquina que quer implantar na sua organização, dependendo da forma de agrupamento dos pontos, pode ser um círculo, parábola ou mesmo um polinômio cúbico.

O método de criação da aprendizagem de máquina consiste em definir as regras para que o computador analise os dados, baseando-se no algoritmo de classificação Naive Bayes, sendo assim você deve:

  • Definir a característica de classificação a ser utilizada que melhor separa sua amostra entre os rótulos desejados (ex: tem rodas);
  • Analisar a presença estatística dessa característica na sua amostra, ou seja, se do total da amostra que tem a característica X, 80%, ou qualquer outra porcentagem, pode ser definido como determinado rótulo, a probabilidade da característica X definir o elemento amostral como tal rótulo é de 80% (ex: de todos os elementos da amostra que têm rodas, 80% são motos);
  • Repita a definição para demais características e suas respectivas porcentagens;
  • Crie árvores de decisão, se possível, baseando-se nos dados para criar perguntas que direcionam o elemento para a melhor classificação;
  • Combine esses recursos para definição dos rótulos de novos elementos amostrais que a máquina encontrar.

Mas, se você acredita que ir além dessas instruções e clusterizar (segmentação), incorporar soluções de redes neurais e máquinas de vetores de suporte ao seu machine learning não é a melhor solução, seja por complexidade ou falta de tempo, existem outras maneiras de aderir à tecnologia.

Soluções no mercado

Reduzir custos e aumentar a produtividade com a aprendizagem de dados é possível não só com a criação de soluções de Machine Learning locais, mas também com grandes empresas que já fornecem esse tipo de solução:

Microsoft Azure: ao contratar o Azure Machine Learning, é possível implementar o modelo na produção da sua organização em questão de minutos, sendo utilizado como serviço web, pode ser acessado de qualquer dispositivo, em qualquer lugar, e com base em qualquer fonte de dados. É uma ferramenta colaborativa do tipo “arrastar e soltar”, que você pode usar para criar, testar e implantar soluções de análise preditiva em seus dados, como explicado acima.

Contando com uma gama de soluções, a Microsoft disponibiliza também tutoriais para usuários avançados ou novos na ciência da computação, facilitando o trabalho do seu departamento de TI. Você pode testar a solução gratuitamente aqui, ou então contratar o serviço padrão com taxa de R$ 33,17 por usuário/mês, sendo obrigatória a assinatura do Azure nesse caso.

IBM Watson: talvez a solução mais reconhecida no mercado, o IBM Watson tem diversos casos de sucesso. Pode aprender com número de dados pequeno, desde que com qualidade, garante a propriedade sobre as previsões que a tecnologia oferece à sua organização e reimagina o processo de entrega para que seu fluxo de carga de trabalho seja mais inteligente. Você pode iniciar o teste gratuito neste link, o preço não é divulgado.

As informações nesse post foram úteis para o seu aprendizado? Se precisar de ajuda, escreva para a gente!

Ver referência

Leia também...