Tudo sobre Aprendizado de Máquina (Machine Learning)
Esta introdução ao aprendizado de máquina fornece uma visão geral de sua história, definições importantes, aplicações e preocupações dentro das empresas hoje.
O que é aprendizado de máquina?
O aprendizado de máquina é um ramo da inteligência artificial (IA) e da ciência da computação que se concentra no uso de dados e algoritmos para imitar a maneira como os humanos aprendem e melhorar a precisão ao longo do tempo.
Um deles, Arthur Samuel, cunhou o termo “aprendizado de máquina” em seus estudos sobre o jogo de damas. O autoproclamado grande mestre das damas, Robert Nealey, jogou em um computador IBM 7094 em 1962, mas perdeu para o computador. Esse feito pode parecer trivial comparado ao que é possível hoje, mas é considerado um marco importante no campo da inteligência artificial.
Nas últimas duas décadas, os avanços tecnológicos no poder de armazenamento e processamento tornaram possíveis produtos inovadores baseados na aprendizagem automática, como o motor de recomendação da Netflix e os carros autónomos.
O aprendizado de máquina é uma parte importante do crescente campo da ciência de dados. Usando métodos estatísticos, algoritmos são treinados para classificar ou prever e descobrir informações importantes em projetos de mineração de dados. Esses insights orientam a tomada de decisões de aplicativos e negócios para impactar de maneira otimizada as principais métricas de crescimento. À medida que o big data continua a se expandir e crescer, a demanda por cientistas de dados aumentará. Eles precisarão de dados para ajudar a identificar as questões de negócios mais relevantes e responder a essas perguntas.
Os algoritmos de aprendizado de máquina geralmente são criados usando estruturas que aceleram o desenvolvimento de soluções, como por exemplo o TensorFlow (Google) e PyTorch (BSD-3).
Machine Learning vs. Deep Learning vs. Redes Neurais
Como o aprendizado profundo e o aprendizado de máquina tendem a ser usados de forma intercambiável, vale a pena observar as pequenas diferenças entre os dois. Aprendizado de máquina, aprendizado profundo e redes neurais são todos subcampos da inteligência artificial. No entanto, as redes neurais são, na verdade, um subcampo do aprendizado de máquina, e o aprendizado profundo é um subcampo das redes neurais.
A diferença entre aprendizado profundo e aprendizado de máquina é como cada algoritmo aprende. O aprendizado de máquina "profundo" pode usar conjuntos de dados rotulados (também conhecidos como aprendizado supervisionado) para informar seus algoritmos, mas não requer necessariamente conjuntos de dados rotulados. O aprendizado profundo pode ingerir formas brutas de dados não estruturados, como texto ou imagens, e pode determinar automaticamente o conjunto de recursos que distinguem diferentes classes de dados umas das outras. Isso remove parte da intervenção humana necessária e permite o uso de conjuntos de dados maiores. Você pode pensar em aprendizado profundo como "aprendizado de máquina escalável".
O aprendizado de máquina (clássico ou "não profundo") é mais dependente da intervenção humana para aprender. Especialistas humanos determinam o conjunto de recursos para entender as diferenças entre entradas de dados, geralmente exigindo dados mais estruturados para aprender.
Uma rede neural, ou rede neural artificial (ANN), consiste em camadas de nós, incluindo uma camada de entrada, uma ou mais camadas ocultas e uma camada de saída. Cada nó ou neurônio artificial é conectado a outro nó e possui pesos e limiares associados. Se a saída de qualquer nó único estiver acima de um limite especificado, esse nó será ativado, enviando os dados para a próxima camada da rede. Caso contrário, o nó não encaminhará os dados para a próxima camada de rede. A "profundidade" do aprendizado profundo refere-se simplesmente ao número de camadas em uma rede neural. Uma rede neural que consiste em mais de três camadas (incluindo entrada e saída) pode ser considerada como um algoritmo de aprendizado profundo ou uma rede neural profunda. Uma rede neural com apenas três camadas é apenas uma rede neural básica.
O aprendizado profundo e as redes neurais são creditados com o progresso acelerado em áreas como visão computacional, processamento de linguagem natural e reconhecimento de fala.
Veja a postagem do blog “AI vs. Machine Learning vs. Deep Learning vs. Redes Neurais: Qual é a diferença?” para um olhar mais atento sobre como os diferentes conceitos se relacionam.
Como funciona o aprendizado de máquina
Dividimos o sistema de aprendizado de um algoritmo de aprendizado de máquina em três partes principais:
- Um processo de decisão: em geral, os algoritmos de aprendizado de máquina são usados para fazer uma previsão ou classificação. Com base em alguns dados de entrada, que podem ser rotulados ou não, seu algoritmo produzirá uma estimativa sobre um padrão nos dados.
- Uma função de erro: Uma função de erro avalia a previsão do modelo. Se houver exemplos conhecidos, uma função de erro pode fazer uma comparação para avaliar a precisão do modelo.
- Um processo de otimização de modelo: se o modelo puder se ajustar melhor aos pontos de dados no conjunto de treinamento, os pesos serão ajustados para reduzir a discrepância entre o exemplo conhecido e a estimativa do modelo. O algoritmo repetirá esse processo de “avaliação e otimização”, atualizando os pesos de forma autônoma até que um limite de precisão seja atingido.
Métodos de aprendizado de máquina
Os modelos de aprendizado de máquina podem ser divididos em três categorias principais:
- Aprendizado de máquina supervisionado - O aprendizado supervisionado, é definido pelo uso de conjuntos de dados rotulados para treinar algoritmos para classificar dados ou prever resultados com precisão. À medida que os dados de entrada são inseridos no modelo, o modelo ajusta seus pesos adequadamente. Isso ocorre como parte do processo de validação cruzada para garantir que o modelo evite superajuste ou subajuste. O aprendizado supervisionado ajuda as organizações a resolver uma variedade de problemas do mundo real em grande escala, como a classificação de spam em uma pasta separada de sua caixa de entrada. Alguns métodos usados no aprendizado supervisionado incluem redes neurais, naïve bayes, regressão linear, regressão logística, floresta aleatória e máquina de vetor de suporte (SVM).
- Aprendizado de máquina não supervisionado - O aprendizado não supervisionado, usa algoritmos de aprendizado de máquina para analisar e agrupar conjuntos de dados não rotulados. Esses algoritmos descobrem padrões ocultos ou agrupamentos de dados sem a necessidade de intervenção humana. A capacidade desse método de descobrir semelhanças e diferenças nas informações o torna ideal para análise exploratória de dados, estratégias de vendas cruzadas, segmentação de clientes e reconhecimento de imagens e padrões. Também é usado para reduzir o número de recursos em um modelo por meio do processo de redução de dimensionalidade. A análise de componentes principais (PCA) e a decomposição de valor singular (SVD) são duas abordagens comuns para isso. Outros algoritmos usados no aprendizado não supervisionado incluem redes neurais, agrupamento k-means e métodos de agrupamento probabilístico.
- Aprendizagem semi-supervisionada - O aprendizado semissupervisionado oferece um meio termo entre aprendizado supervisionado e não supervisionado. Durante o treinamento, ele usa um conjunto de dados rotulado menor para orientar a classificação e a extração de recursos de um conjunto de dados maior e não rotulado. O aprendizado semissupervisionado pode resolver o problema de não ter dados rotulados suficientes para um algoritmo de aprendizado supervisionado. Também ajuda se for muito caro rotular dados suficientes.
O que é aprendizagem profunda?
Aprendizagem profunda é um ramo do aprendizado de máquina que usa redes neurais artificiais para se aproximar da inteligência humana. Inspirada pelos neurônios humanos, a aprendizagem profunda usa a teoria dos grafos para organizar algoritmos ponderados em camadas de vértices e arestas. Os algoritmos da aprendizagem profunda são ótimos em processar dados não estruturados, como imagens ou linguagem.
Tecnicamente, para ser classificada como profunda, a rede neural precisa conter camadas ocultas entre as camadas de entrada e saída da perceptron, que é a estrutura base de uma rede neural. Essas camadas são consideradas ocultas porque não têm conexão com o mundo exterior. Exemplos de arquiteturas de aprendizagem profunda incluem:
- Redes neurais sem realimentação ou redes neurais feedforward (FF): os dados trafegam em uma direção desde a camada de entrada, passando pelas camadas ocultas, até a camada de saída; todos os vértices estão conectados e os dados nunca retomam o ciclo nas camadas ocultas. A rede feedforward é usada na compactação de dados e no processamento básico de imagens.
- Redes neurais recorrentes (RNN, Recurrent Neural Networks): um tipo de rede feedforward que adiciona um tempo de espera às camadas ocultas, o que permite o acesso à informações anteriores durante uma iteração corrente. Esse loop de feedback se aproxima da memória, o que torna as RNNs adequadas para processamento de linguagem. Um bom exemplo disso é o texto preditivo que se baseia em palavras usadas com mais frequência para personalizar as sugestões.
- Redes neurais convolucionais (CCN, Convolutional neural networks): convolução é uma operação matemática em duas funções que produz uma terceira, descrevendo como uma é modificada pela outra. Usada principalmente para reconhecimento e classificação de imagens, as CNNs são os “olhos” da inteligência artificial. As camadas ocultas em uma CNN agem como filtros matemáticos usando a soma ponderada para identificar arestas, cores, contraste e outros elementos de um pixel.
Aprendizado de máquina vs. aprendizagem profunda
A aprendizagem profunda é considerada um subgrupo do aprendizado de máquina. A principal diferença entre algoritmos da aprendizagem profunda e do aprendizado de máquina é o uso de redes neurais artificiais. E a principal característica que faz uma rede neural ser considerada profunda é a presença de camadas ocultas entre as camadas de entrada e saída que constituem uma perceptron básica.
Benefícios da aprendizagem profunda
Os algoritmos da aprendizagem profunda são adequados para processar dados não estruturados, desde que haja capacidade de processamento para isso. Isso dá à aprendizagem profunda uma vantagem sobre algoritmos de aprendizado de máquina quando se trata de aprendizagem não supervisionada e por reforço. Os recentes avanços em inteligência artificial são decorrentes do aumento da viabilidade das redes neurais de aprendizagem profunda, graças às melhorias na capacidade de processamento e armazenamento de dados.
Aprendizado de máquina de reforço
O aprendizado de máquina de reforço é um modelo de aprendizado de máquina semelhante ao aprendizado supervisionado, mas o algoritmo não é treinado usando dados de amostra. Este modelo aprende à medida que avança usando tentativa e erro. Uma sequência de resultados bem-sucedidos será reforçada para desenvolver a melhor recomendação ou política para um determinado problema.
Algoritmos comuns de aprendizado de máquina
Vários algoritmos de aprendizado de máquina são comumente usados. Esses incluem:
- Redes neurais: As redes neurais simulam o funcionamento do cérebro humano, com um grande número de nós de processamento vinculados. As redes neurais são boas em reconhecer padrões e desempenham um papel importante em aplicativos, incluindo tradução de linguagem natural, reconhecimento de imagem, reconhecimento de fala e criação de imagem.
- Regressão linear: Este algoritmo é usado para prever valores numéricos, com base em uma relação linear entre diferentes valores. Por exemplo, a técnica pode ser usada para prever preços de casas com base em dados históricos da área.
- Regressão logística: esse algoritmo de aprendizado supervisionado faz previsões para variáveis de resposta categórica, como respostas “sim/não” a perguntas. Ele pode ser usado para aplicações como classificação de spam e controle de qualidade em uma linha de produção.
- Agrupamento: usando o aprendizado não supervisionado, os algoritmos de agrupamento podem identificar padrões nos dados para que possam ser agrupados. Os computadores podem ajudar os cientistas de dados identificando diferenças entre itens de dados que os humanos negligenciaram.
- Árvores de decisão: as árvores de decisão podem ser usadas tanto para prever valores numéricos (regressão) quanto para classificar dados em categorias. As árvores de decisão usam uma sequência ramificada de decisões vinculadas que podem ser representadas com um diagrama de árvore. Uma das vantagens das árvores de decisão é que elas são fáceis de validar e auditar, ao contrário da caixa preta da rede neural.
- Florestas aleatórias: em uma floresta aleatória, o algoritmo de aprendizado de máquina prevê um valor ou categoria combinando os resultados de várias árvores de decisão.
Casos de uso de aprendizado de máquina do mundo real
Aqui estão alguns exemplos onde o aprendizado de máquina é utilizado todos os dias:- Reconhecimento de fala: também é conhecido como reconhecimento automático de fala (ASR), reconhecimento de fala por computador ou conversão de fala em texto, e é uma capacidade que usa o processamento de linguagem natural (NLP) para traduzir a fala humana em um formato escrito. Muitos dispositivos móveis incorporam o reconhecimento de fala em seus sistemas para conduzir a pesquisa por voz, por exemplo o Siri.
- Atendimento ao cliente: Atendimento ao cliente: os chatbots online estão substituindo os agentes humanos ao longo da jornada do cliente, mudando a maneira como pensamos sobre o envolvimento do cliente em sites e plataformas de mídia social. Os chatbots respondem a perguntas frequentes (FAQs) sobre tópicos como remessa ou fornecem conselhos personalizados, produtos de venda cruzada ou sugestões aos usuários. Os exemplos incluem agentes virtuais em sites de comércio eletrônico; bots de mensagens, chats de bancos entre outros.
- Visão computacional: essa tecnologia de IA permite que os computadores obtenham informações significativas de imagens digitais, vídeos e outras entradas visuais e, em seguida, executem a ação apropriada. Alimentada por redes neurais convolucionais, a visão computacional tem aplicações em marcação de fotos em mídias sociais, imagens de radiologia na área da saúde e carros autônomos na indústria automotiva.
- Mecanismos de recomendação: usando dados de comportamento de consumo anteriores, os algoritmos de IA podem ajudar a descobrir tendências de dados que podem ser usadas para desenvolver estratégias de vendas cruzadas mais eficazes. Essa abordagem é usada por varejistas on-line para fazer recomendações de produtos relevantes aos clientes durante o processo de finalização da compra.
- Negociação automatizada de ações: projetadas para otimizar portfólios de ações, as plataformas de negociação de alta frequência orientadas por IA fazem milhares ou até milhões de negociações por dia sem intervenção humana.
- Detecção de fraude: Bancos e outras instituições financeiras podem usar aprendizado de máquina para detectar transações suspeitas. O aprendizado supervisionado pode treinar um modelo usando informações sobre transações fraudulentas conhecidas. A detecção de anomalias pode identificar transações que parecem atípicas e merecem uma investigação mais aprofundada.
Desafios do aprendizado de máquina
À medida que a tecnologia de aprendizado de máquina se desenvolveu, ela certamente tornou nossas vidas mais fáceis. No entanto, a implementação do aprendizado de máquina nas empresas também levantou uma série de preocupações éticas sobre as tecnologias de IA. Alguns deles incluem:
- Singularidade tecnológica - Embora esse tópico atraia muita atenção do público, muitos pesquisadores não estão preocupados com a ideia da IA superar a inteligência humana em um futuro próximo. A singularidade tecnológica também é chamada de IA forte ou superinteligência. O filósofo Nick Bostrum define superinteligência como “qualquer intelecto que supera amplamente os melhores cérebros humanos em praticamente todos os campos, incluindo criatividade científica, sabedoria geral e habilidades sociais”. Apesar do fato de a superinteligência não ser iminente na sociedade, a ideia dela levanta algumas questões interessantes quando consideramos o uso de sistemas autônomos, como carros autônomos. É irreal pensar que um carro sem motorista nunca sofreria um acidente, mas quem é responsável nessas circunstâncias? Ainda devemos desenvolver veículos autônomos ou limitamos essa tecnologia a veículos semiautônomos que ajudam as pessoas a dirigir com segurança? O júri ainda está decidindo sobre isso, mas esses são os tipos de debates éticos que estão ocorrendo à medida que novas e inovadoras tecnologias de IA se desenvolvem.
- Impacto da IA nos empregos - Embora grande parte da percepção pública da inteligência artificial se concentre na perda de empregos, essa preocupação provavelmente deve ser reformulada. Com cada nova tecnologia disruptiva, vemos que a demanda do mercado por funções de trabalho específicas muda. Por exemplo, quando olhamos para a indústria automotiva, muitos fabricantes, como a GM, estão mudando para se concentrar na produção de veículos elétricos para se alinhar com as iniciativas verdes. A indústria de energia não vai desaparecer, mas a fonte de energia está mudando de uma economia de combustível fóssil para uma elétrica. De maneira semelhante, a inteligência artificial deslocará a demanda por empregos para outras áreas. Será necessário haver indivíduos para ajudar a gerenciar os sistemas de IA. Ainda será necessário haver pessoas para lidar com problemas mais complexos nas indústrias que provavelmente serão afetadas pelas mudanças na demanda de trabalho, como atendimento ao cliente. O maior desafio com a inteligência artificial e seu efeito no mercado de trabalho será ajudar as pessoas a fazer a transição para novas funções que serão criadas.
- Privacidade - A privacidade tende a ser discutida no contexto de privacidade de dados, proteção de dados e segurança de dados. Essas preocupações permitiram que os formuladores de políticas avançassem mais nos últimos anos. Por exemplo, em 2016, a legislação GDPR foi criada para proteger os dados pessoais de pessoas na União Europeia e no Espaço Econômico Europeu, dando aos indivíduos mais controle de seus dados. Nos Estados Unidos, estados individuais estão desenvolvendo políticas, como a Lei de Privacidade do Consumidor da Califórnia (CCPA), que foi introduzida em 2018 e exige que as empresas informem os consumidores sobre a coleta de seus dados. Legislação como essa forçou as empresas a repensar como armazenam e usam informações de identificação pessoal (PII). Como resultado, os investimentos em segurança tornaram-se uma prioridade cada vez maior para as empresas, pois buscam eliminar quaisquer vulnerabilidades e oportunidades de vigilância, hacking e ataques cibernéticos.
- Preconceito e discriminação - Instâncias de preconceito e discriminação em vários sistemas de aprendizado de máquina levantaram muitas questões éticas em relação ao uso de inteligência artificial. Como podemos nos proteger contra preconceito e discriminação quando os próprios dados de treinamento podem ser gerados por processos humanos tendenciosos? Embora as empresas normalmente tenham boas intenções para seus esforços de automação, a Reuters destaca algumas das consequências imprevistas da incorporação da IA nas práticas de contratação. A Harvard Business Review levantou outras questões pontuais sobre o uso de IA nas práticas de contratação, como quais dados você deve usar ao avaliar um candidato para uma função. Preconceito e discriminação também não se limitam à função de recursos humanos; eles podem ser encontrados em vários aplicativos, desde software de reconhecimento facial até algoritmos de mídia social. À medida que as empresas se tornam mais conscientes dos riscos da IA, elas também se tornam mais ativas nessa discussão sobre a ética e os valores da IA.
- Responsabilidade - Como não há legislação significativa para regular as práticas de IA, não há nenhum mecanismo real de aplicação para garantir que a IA ética seja praticada. Os incentivos atuais para que as empresas sejam éticas são as repercussões negativas de um sistema antiético de IA no resultado final. Para preencher a lacuna, estruturas éticas surgiram como parte de uma colaboração entre especialistas em ética e pesquisadores para governar a construção e distribuição de modelos de IA na sociedade. No entanto, neste momento, estes servem apenas para orientar. Algumas pesquisas mostram que a combinação de responsabilidade distribuída e falta de previsão sobre possíveis consequências não conduz à prevenção de danos à sociedade.
Comentários
Postar um comentário