Normal view MARC view ISBD view

Analyse des sentiments : système autonome d'exploration des opinions exprimées dans les critiques cinématographiques / par Grzegorz Dziczkowski ; sous la direction de Robert Mahl

Auteur principal : Dziczkowski, Grzegorz, 1980-...Auteur secondaire : : Mahl, Robert, Directeur de thèseAuteur secondaire collectivité : École nationale supérieure des mines, Paris, Organisme de soutenancePublication : 2008Description : 1 vol. (156 p.) ; 30 cmClassification : 004 ; 620Résumé : Cette thèse décrit l'étude et le développement d'un système conçu pour l'évaluation des sentiments des critiques cinématographiques. Un tel système permet : - la recherche automatique des critiques sur Internet, - l'évaluation et la notation des opinions des critiques cinématographiques, - la publication des résultats. Afin d'améliorer les résultats d'application des algorithmes prédicatifs, l'objectif de ce système est de fournir un système de support pour les moteurs de prédiction analysant les profils des utilisateurs. Premièrement, le système recherche et récupère les probables critiques cinématographiques de l'Internet, en particulier celles exprimées par les commentateurs prolifiques. Par la suite, le système procède à une évaluation et à une notation de l'opinion exprimée dans ces critiques cinématographiques pour automatiquement associer une note numérique à chaque critique ; tel est l'objectif du système. La dernière étape est de regrouper les critiques (ainsi que les notes) avec l'utilisateur qui les a écrites afin de créer des profils complets, et de mettre à disposition ces profils pour les moteurs de prédictions. Pour le développement de ce système, les travaux de recherche de cette thèse portaient essentiellement sur la notation des sentiments ; ces travaux s'insérant dans les domaines de opinion mining et d'analyse des sentiments. Notre système utilise trois méthodes différentes pour le classement des opinions. Nous présentons deux nouvelles méthodes ; une fondée sur les connaissances linguistiques et une fondée sur la limite de traitement statistique et linguistique. Les résultats obtenus sont ensuite comparés avec la méthode statistique basée sur le classificateur de Bayes, largement utilisée dans le domaine. Il est nécessaire ensuite de combiner les résultats obtenus, afin de rendre l'évaluation finale aussi précise que possible. Pour cette tâche nous avons utilisé un quatrième classificateur basé sur les réseaux de neurones. Notre notation des sentiments à savoir la notation des critiques est effectuée sur une échelle de 1 à 5. Cette notation demande une analyse linguistique plus profonde qu'une notation seulement binaire : positive ou négative, éventuellement subjective ou objective, habituellement utilisée. Cette thèse présente de manière globale tous les modules du système conçu et de manière plus détaillée la partie de notation de l'opinion. En particulier, nous mettrons en évidence les avantages de l'analyse linguistique profonde moins utilisée dans le domaine de l'analyse des sentiments que l'analyse statistique.; This thesis describes the study and development of a system designed for the evaluation of sentiments within cinema reviews. Such a system offers : – an automatic search of reviews on the Internet, – the valuation and the attribution of marks to the opinions given by cinema critics, – the publication of the. In order to improve the application results of predictive algorithms the objective of this system is to supply a support system for the prediction engines analysing users profiles. Firstly the system seeks and fetches likely reviews by cinema reviewers on the internet, particularly those who are prolific. Then the system will evaluate and attribute a mark to the opinion expressed in the cinema reviews and automatically associate a numerical mark to each review ; this is the objective of the system. The final stage is to regroup the reviews (as well as the marks) with the user who wrote them so as to create complete profiles and to propose these profiles the prediction engines. For the development of this system research for this thesis was based principally on the marking of sentiments, this work is in the realm of Opinion Mining and Sentiment Analysis. Our system uses three dierent methods for the classification of opinions. We present here two new methods ; one founded on pure linguistic knowledge and the other on a combination of statistic and linguistic analysis. Subsequently the results are compared using the statistical method based on Bayes' classifier frequently used in this domain. The ensuing results are then combined in order to make the final evaluation as precise as possible. For this task we used a fourth classifier based on the neuron network. Between one and five points are attributed to reviews. This mark requires a deeper linguistic analysis than the binary notation- positive/negative which may be objective or subjective and which is habitually used. This thesis gives a general account of all the system modules which we have created and a detailed analysis of the one dedicated to opinion marking. We wish to show the advantages of deep linguistic analysis which is less commonly used than statistical analysis in the domain of sentiment analysis.Bibliographie: Bibliographie 120 réf..Thèse : .Sujet - Nom d'actualité : Linguistique -- Informatique -- Thèses et écrits académiques ;Recherche de l'information -- Thèses et écrits académiques ;Statistique -- Thèses et écrits académiques ;Catégorisation (linguistique) -- Thèses et écrits académiques ;Traitement automatique du langage naturel -- Thèses et écrits académiques Sujet : CATEGORISATION ;Traitement automatique des langues naturelles ;Analyse statistique ;Analyse linguistique ;Recherche information ;Analyse des sentiments
Current location Call number Status Notes Date due Barcode
Bib. Paris
EMP 160.165 CCL.TH.1251 Available Thèse en ligne sur Pastel EMP51705D
Centre de recherche en informatique
08-DZI Sur demande Thèse en ligne sur Pastel CRI06091D

Bibliographie 120 réf.

Thèse de doctorat Informatique, temps réel, robotique et automatique Paris, ENMP 2008

Cette thèse décrit l'étude et le développement d'un système conçu pour l'évaluation des sentiments des critiques cinématographiques. Un tel système permet : - la recherche automatique des critiques sur Internet, - l'évaluation et la notation des opinions des critiques cinématographiques, - la publication des résultats. Afin d'améliorer les résultats d'application des algorithmes prédicatifs, l'objectif de ce système est de fournir un système de support pour les moteurs de prédiction analysant les profils des utilisateurs. Premièrement, le système recherche et récupère les probables critiques cinématographiques de l'Internet, en particulier celles exprimées par les commentateurs prolifiques. Par la suite, le système procède à une évaluation et à une notation de l'opinion exprimée dans ces critiques cinématographiques pour automatiquement associer une note numérique à chaque critique ; tel est l'objectif du système. La dernière étape est de regrouper les critiques (ainsi que les notes) avec l'utilisateur qui les a écrites afin de créer des profils complets, et de mettre à disposition ces profils pour les moteurs de prédictions. Pour le développement de ce système, les travaux de recherche de cette thèse portaient essentiellement sur la notation des sentiments ; ces travaux s'insérant dans les domaines de opinion mining et d'analyse des sentiments. Notre système utilise trois méthodes différentes pour le classement des opinions. Nous présentons deux nouvelles méthodes ; une fondée sur les connaissances linguistiques et une fondée sur la limite de traitement statistique et linguistique. Les résultats obtenus sont ensuite comparés avec la méthode statistique basée sur le classificateur de Bayes, largement utilisée dans le domaine. Il est nécessaire ensuite de combiner les résultats obtenus, afin de rendre l'évaluation finale aussi précise que possible. Pour cette tâche nous avons utilisé un quatrième classificateur basé sur les réseaux de neurones. Notre notation des sentiments à savoir la notation des critiques est effectuée sur une échelle de 1 à 5. Cette notation demande une analyse linguistique plus profonde qu'une notation seulement binaire : positive ou négative, éventuellement subjective ou objective, habituellement utilisée. Cette thèse présente de manière globale tous les modules du système conçu et de manière plus détaillée la partie de notation de l'opinion. En particulier, nous mettrons en évidence les avantages de l'analyse linguistique profonde moins utilisée dans le domaine de l'analyse des sentiments que l'analyse statistique.

This thesis describes the study and development of a system designed for the evaluation of sentiments within cinema reviews. Such a system offers : – an automatic search of reviews on the Internet, – the valuation and the attribution of marks to the opinions given by cinema critics, – the publication of the. In order to improve the application results of predictive algorithms the objective of this system is to supply a support system for the prediction engines analysing users profiles. Firstly the system seeks and fetches likely reviews by cinema reviewers on the internet, particularly those who are prolific. Then the system will evaluate and attribute a mark to the opinion expressed in the cinema reviews and automatically associate a numerical mark to each review ; this is the objective of the system. The final stage is to regroup the reviews (as well as the marks) with the user who wrote them so as to create complete profiles and to propose these profiles the prediction engines. For the development of this system research for this thesis was based principally on the marking of sentiments, this work is in the realm of Opinion Mining and Sentiment Analysis. Our system uses three dierent methods for the classification of opinions. We present here two new methods ; one founded on pure linguistic knowledge and the other on a combination of statistic and linguistic analysis. Subsequently the results are compared using the statistical method based on Bayes' classifier frequently used in this domain. The ensuing results are then combined in order to make the final evaluation as precise as possible. For this task we used a fourth classifier based on the neuron network. Between one and five points are attributed to reviews. This mark requires a deeper linguistic analysis than the binary notation- positive/negative which may be objective or subjective and which is habitually used. This thesis gives a general account of all the system modules which we have created and a detailed analysis of the one dedicated to opinion marking. We wish to show the advantages of deep linguistic analysis which is less commonly used than statistical analysis in the domain of sentiment analysis

Powered by Koha