As Limitações da Análise de Sentimento Quando Administrando a sua Reputação
Uma explicação sobre o porquê a análise de sentimento é inadequada para a administração da sua reputação na mídia.
Este é o terceiro post da nossa série sobre técnicas utilizadas por Inteligência Artificial para administrar a sua reputação na mídia. Leia o post anterior da série aqui. No nosso último post discutimos análise de sentimento, e como ela pode te ajudar com a administração da sua reputação na mídia. Neste post falaremos sobre as limitações da análise de sentimento no contexto de administração de reputação.
Graças à abundância de dados relacionados às avaliações que estão disponíveis online, a maior parte dos sistemas de aprendizado automatizados focados em análise de sentimento já são, atualmente, treinados para usar informações referentes a essa área. Por consequência, a maior parte das ferramentas de software para monitoramento de mídia e administração de reputação oferecem uma análise de sentimento automática à partir das menções da sua marca, utilizando modelos automatizados treinados para usar os dados relacionados à avaliações.
Dito isto, estes sistemas de análise de sentimento também têm diversas e sérias limitações quando exercendo seu trabalho como ferramentas para a administração de reputação. Primeiramente, opiniões e emoções subjetivas que são expressadas à respeito da sua marca representam apenas uma fração da informação que você considera relevante quando administrando a reputação da sua organização. Muitas vezes as menções online sobre a sua marca terão um impacto na sua reputação, independente da presença ou não de sentimento sendo expressado no texto.
Afirmações Neutras em Sentimento que têm Impacto Positivo ou Negativo na sua Reputação
Considere, por exemplo, a seguinte frase, levantada de um artigo noticioso sobre o vazamento de óleo da Deepwater Horizon em 2010:
Os resíduos de óleo que permanecem alteraram os componentes essenciais da vida no oceano, reduzindo a biodiversidade das áreas mais próximas do vazamento, que ocorreu quando uma plataforma de perfuração da BP explodiu em Abril de 2010, matando 11 trabalhadores e derramando cerca de 4 milhões de barris de óleo na região do Golfo.
O sentimento da frase acima é praticamente neutro: nenhuma emoção ou opinião, positiva ou negativa, está sendo diretamente expressada pelo autor ou por outras fontes presentes. Ela é simplesmente uma declaração dos fatos. Porém, os fatos que estão sendo noticiados claramente terão um impacto negativo na reputação da British Petroleum (BP) e, obviamente, seria extremamente prático se a plataforma de administração de reputação da marca pudesse alertá-los sobre este tipo de menção. A análise de sentimento tradicional é fundamentalmente inútil neste tipo de situação.
Sentimento Direcionado Incorretamente
Como exemplo, considere a frase a seguir, levantada de um artigo noticioso falando sobre uma incidente em 2017, no qual um passageiro da United Airlines foi removido a força de um vôo superlotado:
Já que o foco do sentimento de uma avaliação é facilmente identificado no contexto de uma avaliação, a maior parte dos sistemas automatizados de aprendizado que foram treinados utilizando dados vindos dessa área não se esforçam para distinguir entre diferentes focos de sentimento. Por isso, a análise oferecida por esses modelos, quando aplicada a dados que não se encaixam no âmbito habitual de “avaliação”, como por exemplo notícias ou dados de mídias sociais, não é detalhada o suficiente para ser útil em termos de administração de reputação.
Após mais um período de indignação, (até o Presidente Trump descreveu o tratamento do passageiro pela United Airlines como “horrível”), a United emitiu um novo pedido de desculpas, que foi percebido como mais sincero, e incluía uma declaração do [CEO da United], prometendo que um incidente assim nunca ocorreria de novo na United Airlines.
Tanto a United Airlines quanto Donald Trump foram mencionados nesta frase. Um sistema de análise de sentimento que não faz distinção entre sentimentos expressos sobre diferentes “alvos” provavelmente classificaria esta frase como uma frase que denota sentimento negativo, graças à presença de palavras como “horrível” e “indignação”. Isso seria correto se o foco considerado fosse a United Airlines, mas não se o foco fosse Donald Trump. Como consequência, um sistema de administração de reputação que atribui sentimento, independentemente de qual alvo está sendo considerado, forneceria informações incorretas sobre Donald Trump, neste caso.
Sistemas de análise de sentimento treinados a partir de dados referentes à área de avaliação são, frequentemente, menos precisos quando aplicados a dados de outras áreas, como por exemplo notícias ou mídias sociais. Isto ocorre graças às diferenças nas formas de expressão sendo utilizadas: jornalistas geralmente não expressam sentimento da mesma forma que um crítico, e ambos se expressam de formas diferentes de uma pessoa expressando sentimento através de uma postagem em um canal de mídia social. Por consequência, os padrões que um sistema automatizado, que foi treinado a partir de dados de avaliação, aprendeu a reconhecer e utilizar como evidência para estimar sentimento nessa área, geralmente não serão úteis na hora de estimar sentimento em outras áreas.
A Linguagem de Avaliações é Diferente da Linguagem Usada em Notícias e Mídias Sociais
O que é ainda mais complicado é que a maior parte dos dados de avaliação online está em Inglês. Para organizações globais, uma administração de reputação de sucesso requer o monitoramento de meios de comunicação em muitos idiomas. Para utilizar sistemas de análise de sentimento que foram treinados exclusivamente com dados em Inglês, medidas específicas devem ser tomadas. Estas medidas envolvem, muitas vezes, a tradução de todos os artigos noticiosos e posts de mídia social, o que pode ser extremamente oneroso financeiramente, ou elas envolvem o uso de métodos de ponta, que permitem que o sistema treinado transfira o que já foi aprendido de um idioma para o outro. Como consequência, a maior parte de sistemas de administração de reputação dispõem análise de sentimento apenas para fontes em um pequeno número de idiomas.
Conclusão
Neste post abordamos os limites da análise de sentimento na área de administração de reputação na mídia. Observamos que a análise de sentimento produz apenas uma pequena fatia do total de informações que você precisa para administrar a reputação da sua marca na mídia de forma efetiva. Também discutimos o fato de que muitos sistemas de mensuração de sentimento não diferenciam entre diferentes “alvos” dentro do mesmo texto, e que sistemas de análise de sentimento que têm como base dados de análise o idioma Inglês frequentemente geram avaliações de baixa qualidade quando aplicados à área de notícias ou mídia social.
No próximo post iremos discutir como a Hypefactors está trabalhando no desenvolvimento de soluções que superam estas limitações.