Como Utilizar a Análise de Sentimento para Administrar sua Reputação
Um olhar sobre as possibilidades oferecidas por técnicas tradicionais de Inteligência Artificial utilizadas para administrar a sua reputação na mídia.
Este é o segundo post da nossa série sobre técnicas utilizadas por Inteligência Artificial para administrar a sua reputação na mídia. Leia o post anterior da série aqui.
Neste post iremos falar sobre a análise de sentimento – uma técnica muito comum de Inteligência Artificial que pode ajudar a sua organização a identificar menções relevantes da sua marca online.
A análise de sentimento é extremamente útil no contexto de monitoramento de mídia já que, mesmo que você já tenha uma detecção automática das menções da sua marca, ainda é difícil conseguir identificar quais destas requerem sua atenção, especialmente quando a sua marca gera milhares de menções diariamente.
Começaremos com uma breve descrição do que é a análise de sentimento, seguida de uma explicação sobre técnicas modernas de Inteligência Artificial utilizadas na análise de sentimento.
O Que é a Análise de Sentimento?
A análise de sentimento é uma coleção de técnicas utilizadas para automaticamente detectar as opiniões e emoções subjetivas sendo expressadas por alguma fonte em relação a algum assunto, usando um linguajar natural. Por exemplo, a área de avaliação online de produtos e serviços é um caso claro de onde a análise de sentimento pode ser útil, já que a fonte e o assunto “foco” são facilmente identificados, sendo eles, neste caso, o autor e o produto ou serviço sendo avaliado, respectivamente.
Considere, por exemplo, a seguinte avaliação da app Hypefactors, levantada do site de avaliações capterra.com:
A Interface e processo de configuração são realmente simples. A equipe de atendimento ao cliente é extremamente prestativa e o set-up foi completado em apenas um dia.
Neste caso, a opinião subjetiva expressada pelo autor à respeito da Hypefactors é positiva, o que pode ser indicado pelas frases “interface e processo de configuração simples” e “equipe de atendimento ao cliente extremamente prestativa.”
A análise de sentimento é uma questão complexa. Sistemas simples, que operam na base de regras, falham com frequência graças a grande variação que faz parte da linguagem, quando usada naturalmente. Considere, por exemplo, a simples frase
O filme é surpreendente, com diversas reviravoltas perturbadoras.
Um sistema de análise de sentimento de sucesso precisa ser capaz de entender que a palavra “perturbadoras”, que normalmente é negativa, está sendo usada de forma positiva quando aparece no contexto de resenhas de filmes. Além disso, temos as complexidades de negação (“Eu não odeio aquele filme”) e do uso de sarcasmo. Levando tudo isso em consideração, podemos entender que conseguir criar uma lista simples de regras que determina o sentimento de uma frase é praticamente impossível.
É por essas razões que a maior parte dos sistemas modernos tem como base uma abordagem estatística, que busca aprender o que um sentimento positivo, negativo ou neutro realmente significa. Técnicas com essa abordagem são conhecidas coletivamente como machine learning, ou aprendizado automatizado.
Técnicas de Aprendizado Automatizado para Análise de Sentimento
Utilizando um grande conjunto de resenhas e designações de sentimento associadas à elas, é possível treinar um sistema de aprendizado automatizado a reconhecer indicadores linguísticos de sentimento, e usar os mesmos para estimar corretamente se o sentimento de qualquer resenha é negativo, neutro ou positivo.
A maior parte dos sistemas de análise de sentimento modernos tem como base uma técnica de aprendizado automatizado chamada de aprendizado supervisionado. Neste paradigma de aprendizagem o sistema é criado por um processo conhecido como treinamento, ou training, no qual um algoritmo de treinamento é aplicado à um grande conjunto de entrada de dados (texto, neste caso) e aos resultados associados desejados. O resultado do treinamento é um modelo. Este processo está ilustrado abaixo.
O modelo é um mapeamento, que vai do texto até o seu significado mais provável. Uma vez que o modelo estiver treinado ele pode ser utilizado para classificar novos dados, que ainda não tem significado atribuído, sem a contribuição de humanos.
Hoje em dia, modelos de “deep learning” (ou aprendizagem profunda) são os mais comumente utilizados na área de aprendizagem supervisionada com enfoque em questões de processamento de linguagem natural, como por exemplo a análise de sentimento. Aprendizagem profunda é uma definição abrangente que inclui diversas técnicas diferentes que tem como característica em comum o fato de que o modelo consiste de uma série de transformações não-lineares vetor-à-vetor dos dados inseridos, até que o resultado da transformação de vetor final seja utilizada como input em um algoritmo de classificação.
O algoritmo de treinamento para modelos de aprendizagem profunda é conhecido como backpropagation. Ele funciona através do ajuste de parâmetros significativos nas camadas de transformação de vetor do modelo, e na camada de classificação, de forma a aumentar a precisão do modelo em relação aos dados inseridos. Em outras palavras, o modelo aprende a reconhecer padrões que evidenciam sentimento negativo, neutro ou positivo nos dados de treinamento.
Neste post nós discutimos a análise de sentimento como uma ferramenta de administração de reputação. Nós observamos como a análise de sentimento pode, em alguns casos, te alertar à respeito de menções que tem sentimento negativo ou positivo. Nós também discutimos porquê a construção de um sistema de análise de sentimento pode gerar vários desafios, graças às variações e diversidade naturais presentes na linguagem.
Conclusão
No próximo post desta série nós iremos discutir como a Hypefactors está melhorando a tecnologia de ponta de análise de sentimento, abordando e lidando com as limitações da análise de sentimento na administração de reputação.