ODREĐIVANJE KVALITETA POJEDINAČNIH JELA IZ RECENZIJA RESTORANA UPOTREBOM SENTIMENT ANALIZE

  • Marija Joksimović
Ključne reči: analiza teksta, klasifikacija teksta, procesiranje prirodnog jezika, sentiment analiza, recenzije restorana

Apstrakt

U ovom radu predstavljeno je jedno rešenje za izdvajanje delova teksta iz korisničkih recenzija koji predstavljaju nosilac sentimenta za određeno jelo i klasifikaciju tih delova teksta prema osećanju koje je u njima iskazano na pozitivno, negativno ili neutralno korišćenjem metoda mašinskog učenja. Segmenti teksta recenzija koji sadrže pominjanje hrane su formirani na osnovu leksičkih veza između reči i na njih su primenjene određene tehnike pretprocesiranja. Potom je izvršena sentiment analiza upotrebom nekoliko modela mašinskog učenja. Svi podaci su prikupljeni sa sajta Donesi.com i ručno anotirani. Korišćeni modeli su evaluirani.

Reference

[1] www.donesi.com
[2] Jason Huggins, et al, 2004. Selenium,
https://www.seleniumhq.org
[3] Leonard Richardson 2014, BeautifulSoup4
https://www.crummy. com/software/BeautifulSoup
[4] Ljubesic, Nikola, Tomaz Erjavec and Darja Fiser. “Corpus-Based Diacritic Restoration for South Slavic Languages.” LREC (2016).
[5] Ljubesic, Nikola and Tomaz Erjavec. “Corpus vs. Lexicon Supervision in Morphosyntactic Tagging: the Case of Slovene.” LREC (2016).
[6] Ljubesic, Nikola, Filip Klubicka, Zeljko Agic and Ivo-Pavao Jazbec. “New Inflectional Lexicons and Training Corpora for Improved Morphosyntactic Annotation of Croatian and Serbian.” LREC (2016).
[7] Agic, Zeljko and Nikola Ljubesic. “Universal Dependencies for Croatian (that work for Serbian, too).” BSNLP@RANLP (2015).
[8] Fišer, D., Ljubešić, N. & Erjavec, T. Lang Resources & Evaluation (2018). https://doi.org/10.1007/s10579-018-9425-z
[9] Milosevic, Nikola “Stemmer for Serbian Language. ” CoRR abs/ 1209.4471 (2012): n. pag.
[10] Universal Dependencies,
https://universaldependencies.org/#language-u
[11] GridSearchCV, Scikit-learn
https://scikit-learn.org/stable/modules/generated/-sklearn.model_selection.Grid-SearchCV.html
[12] Leung K. M. (2007). “Naive Bayesian Classifier”,
Polytechnic University, Department of Computer Science, Finance and Risk Engineering.
[13] Support Vector Machines (SVM), Statsoft,
http://www.statsoft.com/Textbook/Support-Vector-Machines
[14] Breiman L. (2001) “Random Forests, Machine
Learning”, Vol. 45. Issue 1, pp. 5-32.
[15] Logistic Regression Scikit-learn,
https://scikit-learn.org/stable/modules/generated/-sklearn.linear_model.Logistic-Regression.html
Objavljeno
2020-02-22
Sekcija
Elektrotehničko i računarsko inženjerstvo