O que é a Visão Computacional para o seu negócio?
Visão computacional é um conceito que vem sendo muito falado nos últimos anos. Essa é uma área da inteligência artificial e machine learning focada na análise de imagens e vídeos para automação de tarefas que dependem da visão humana e do fornecimento de dados agregados para possíveis análises de Business Intelligence. As aplicações de visão computacional auxiliam o gestor a tomar decisões corretas e imediatas.
Visão Computacional e aprimoramento constante
Por meio da análise de imagens e vídeos fornecidos previamente, os algoritmos de visão computacional aprendem a identificar o que a inteligência artificial enxerga e fornecem dados dos mais variados tipos para realizar análises e automatizar tarefas. Assim como uma pessoa é treinada para realizar diversas atividades de forma eficiente, errando e aprendendo com seus erros, os algoritmos de visão computacional fazem o mesmo.
Quando o resultado fornecido pela visão computacional não atinge o esperado, é possível informar onde o algoritmo errou para que na próxima vez ele acerte. Esse procedimento é chamado de treinamento constante. Quem faz essa correção é uma pessoa, e é possível distribuir essa função para uma massa de usuários de um aplicativo por meio de feedbacks.
O uso de visão computacional pode ser dos mais variados, desde a implementação na palma da sua mão por meio do seu celular, ou até algo mais robusto, como em um sistema de aplicações em nuvem.
Independentemente de onde a tecnologia seja implementada e da sua finalidade, suas possibilidades são gigantescas. A dimensão do poder computacional para os processamentos dos dados está em nuvem, em um toque dos dedos, sem a necessidade de realizar uma ampla reformulação das aplicações já existentes das empresas e dos seus servidores.
A escalabilidade das aplicações de visão computacional em nuvem permite manter uma alta disponibilidade do serviço mesmo com alto tráfego de usuários, além de facilitar a integração da tecnologia em aplicações já existentes como sistemas legados, aplicativos Android e iOS, aplicações webs e sites, chatbots, sistema de envio de SMSs, CRM’s e diversas outras plataformas.
Visão Computacional em processos de otimização de cadastros em serviços digitais
No vídeo acima, você pôde conferir um checkbot de visão computacional em operação para identificar o usuário através de sua imagem. Este procedimento visa facilitar a checagem das pessoas de maneira fácil e rápida.
Otimizar as etapas de cadastros de clientes nos serviços digitais oferecidos pelas empresas é algo crucial para garantir que o cadastro seja finalizado e que a empresa conquiste mais um cliente satisfeito. Redução do tempo, organização e facilidade de uso são alguns dos principais pontos a se atentar ao desenvolver esses processos.
Como é mostrado no vídeo, podemos utilizar a visão computacional para extrair dados da carteira nacional de habilitação fornecida em uma imagem e realizar a validação da foto presente no documento com uma selfie do dono. Ao reconhecer dados como nome, CPF e data de nascimento, é possível utilizar esses dados para autopreencher campos de forma automática em um processo de cadastro, garantindo que os dados estão corretos por meio da validação da selfie fornecida. Caso seja detectada uma dúvida se a pessoa da selfie é a dona no documento, é possível informar uma pessoa para realizar essa checagem manualmente.
Todo esse processamento leva menos de três segundos, utilizando plataformas em nuvem para o tratamento das informações de forma segura e fácil integração com aplicações já existentes.
Visão Computacional proporcionando acessibilidade e insights
Reconhecer objetos em imagens é outra possibilidade que a visão computacional proporciona. Por meio do reconhecimento de padrões, os algoritmos informam quais objetos estão presentes nas imagens, fornecendo o nome do objeto, a localização que ele está presente na imagem e o percentual de certeza das informações.
Outra possibilidade de visão computacional desses algoritmos é a de descrever imagens em formato de texto para deficientes visuais. Imagine que uma empresa forneça um serviço digital onde os clientes manipulam imagens – é possível identificar que em uma imagem haja, por exemplo, duas pessoas, um guarda sol e uma cadeira de praia, descrevendo algo como: “Duas pessoas na praia sob um guarda sol”. Desta forma, o serviço seria acessível para esse novo grupo de usuários por meio de leitores de telas.
A visão computacional identifica quantas pessoas passaram por determinada região de uma loja, cruzando dados de data, hora e gênero para gerar insights. Neste caso, é possível alimentar dashboards na ferramenta PowerBI para acompanhamento do tráfego da loja e realizar a criação de mapas de calor, fornecendo aos gestores as informações necessárias para realizar qualquer modificação no layout da loja nos departamentos em que não estão recebendo pessoas o suficiente.
Chatbot com visão computacional
Mais uma possibilidade de visão computacional foi abordada pela Programmer’s, desta vez através de sua subsidiária americana Actminds. Uma aplicação foi desenvolvida para uma agência de marketing, com foco em reconhecimento de objetos em fotografias de famosos, tais como óculos e relógios, onde a análise que era feita manualmente, tornou-se muito mais veloz e eficiente financeiramente.
Este aumento de velocidade pelo reconhecimento automático de visão computacional gerou um diferencial fundamental em relação à concorrência, ofertas para fabricantes e divulgação de produtos de marca sendo utilizados por famosos. No evento Gartner Symposium/ITxpo 2017, demonstramos como esta tecnologia funciona na apresentação “Actminds’ Bots: How Enterprise Bots and AI are Conquering the Real World”.
Aos 13 minutos e 20 segundos da apresentação, foi solicitado ao chatbot através da Cortana (assistente virtual integrada ao Windows 10), imagens de pessoas utilizando relógios e óculos. Depois desse comando, o chatbot procurou por tweets com imagens de pessoas vestindo os objetos solicitados, enviando-as para o solicitante no Facebook Messenger. Por meio de visão computacional foi possível localizar os objetos presentes nas imagens e filtrá-las de acordo com o que o usuário desejava ver no momento. A figura abaixo demonstra a visão computacional do chatbot ao observar as imagens.
A utilização de visão computacional para otimização dos processos de negócio que dependem da visão humana é uma tarefa complexa de ser realizada, na qual é preciso identificar suas possíveis aplicações em cada contexto e sua viabilidade.
Escolher as ferramentas e tecnologias é essencial para garantir o sucesso da solução, além de possuir uma massa de dados para realizar o treinamento customizado da aplicação. Quando essas barreiras são ultrapassadas e a implementação da visão computacional é feita de acordo com a necessidade do negócio, os resultados e benefícios são garantidos. Que tal saber mais sobre recursos e dados?
Lucas Micheloni Antevere é Analista Desenvolvedor na Programmer’s.