Bing Liu, Sentiment Analysis. Mining Opinions, Sentiments, and Emotions, 381 p., Bibliogr., Index, 2015, Cambridge University Press, $37,88 (ebook)
Voici un manuel universitaire et professsionnel d'analyse des émotions, des sentiments et des opinions exprimées, déclarées dans des textes. Que pense-t-on d'un produit, d'un candidat, d'un film, d'un service après-vente... Cette analyse, partiellement automatique, répond à une préoccupation primordiale des annonceurs et des agences de publicité ; ils en attendent une contribution essentielle à l'évaluation de l'impact des campagnes publicitaires : agrément, crédibilité, notoriété positive ou négative telles que l'on peut les observer dans les blogs, sur les réseaux sociaux, les critiques de produits (reviews), les courriers, les avis de consommateurs, les réponses aux enquêtes en ligne ("enquêtes de satisfaction", plus que d'insatisfaction d'ailleurs !), etc.
Sur le marché des médias et du marketing, la demande d'analyse du sentiment suit logiquement le développement du e-commerce et des réseaux sociaux, porté par les smartphones qui donnent l'occasion de recommandations, d'appréciations et de partages de toutes sortes. Le moment de l'émotion est prioritaire pour le ciblage publicitaire (cf., par exemple, MediaBrix) et pour le comportement du téléspectateur (cf. vans qui prétend donner la température instantanée d'une émission).
L'offre de données massives alimente et dynamise une demande de traitements qui conduisent au développement de ce secteur nouveau des sciences sociales, aux confins de l'informatique (NLP, machine learning) et de la linguistique. De nombreuses entreprises ont investi ce domaine de recherche et commercialisent des analyses de sentiment. La question de la pertinence et de la validité de ces analyses est fréquemment posée par les utilisateurs, souvent dubitatifs : l'enjeu est important puisqu'il s'agit, à l'aide des résultats de l'analyse de sentiments, d'orienter la stratégie d'une marque (brand equity), d'une entreprise, d'une politique... L'analyse de sentiment va au-delà des signes classiques (like, emoji, nombre de followers, etc.) considérés comme indicateurs premiers d'engagement du consommateur sur les médias sociaux puisqu'elle s'appuie sur des discours spontanés en langue naturelle (sur l'expression des sentiments par emojis, voir PLOS / one). Or rien n'est plus difficile à analyser rigoureusement que les productions langagières.
L'auteur, qui a déjà beaucoup écrit sur ce domaine, est Professeur de sciences informatiques à l'université d'Illinois. Son ouvrage, pragmatique, passe en revue les principaux éléments constitutifs de l'analyse du sentiment et les méthodologies courantes en partant de la structuration des données (catégorisation, classification, annotation). Il examine l'approche basée sur le lexique (lexicon-based approach :"sentiment lexicon", "sentiment words" comme indicateurs), l'apprentissage étant supervisé ou non.
L'analyse des sentiments repose sur une classification des textes afin d'en extraire le sentiment, la polarité. Il faut structurer les données, en dégager des caractéristiques constitutives (features) ; l'analyse s'appuie entre autres sur les sentiment words, les adjectifs, les sentiment shifters. Elle peut aussi recourir à la sémantique (compositional semantics) qui associe à des ensembles de mots des règles syntaxiques de composition.
Le manuel, précis, complet, guide les lecteurs, pas à pas, dans les moindres détails des multiples méthodologies et des outils d'analyse, étape par étape. L'ensemble, doté d'une bibliographie, riche et récente, constitue un bilan utile des recherches du domaine. La majorité des exemples mobilisés portent sur des produits ou des appareils ce qui est moins malaisé que sur des marques ou sur des positionnements politiques.
Au cours de l'exposé, de nombreux problèmes sont évoqués qui soulignent les limites de l'analyse des sentiments : par exemple, celui des phrases sarcastiques que l'on ne peut désambiguiser que par l'analyse des contextes. Le traitement des négations peut poser problème également ou encore les nuances introduites par les modalisations (actes de langage tels que croire douter, espérer, penser, craindre...) : on parle alors de "sentiment shifters". Enfin, ne perdons pas de vue la sensibilité des résultats au type de training data utilisées (représentativité des données ?), voire à l'étiquetage des données.
L'apparente sophistication des procédés d'analyse, de décorticage et décomposition des textes et de leur synthèse (score) ne parvient pas à dissimuler les simplifications premières sur lesquelles repose l'analyse du sentiment, notamment l'exploitation figée du lexique. Le langage est changeant, historiquement et géographiquement déterminé : il n'est pas d'universel. N'oublions jamais la dimension socio-linguistique des énoncés analysés : le capital langagier (i.e. culturel) n'intervient-il pas comme une modalisation générale des énoncés ?
A terme, l'analyse des émotions et des sentiments pour le marketing passera sans doute des énoncés plus ou moins longs aux photographies, aux vidéo et donc aux expressions corporelles (gestes, hexis, visage). L'évolution des médias sociaux anticipe ce basculement du texte au bénéfice de l'image, plus ou moins légendée (cf. "L'intelligence artificielle des passions de l'âme"). Les recherches en deep learning s'y emploient.
Conclusion ? Ouvrage utile, sérieux, important pour les praticiens, précieux pour discuter les limites de l'analyse des sentiments et de son exploitation commerciale, pour inviter à la circonspection et à la prudence dans l'exploitation des résultats. Quant à l'importance du sentiment, on sait ce qu'en disait Pascal : "Tout notre raisonnement se réduit à céder au sentiment" (Pensées, 470).
Aucun commentaire:
Enregistrer un commentaire