ANALIZA ALGORITAMA ZA VEKTORSKU REPREZENTACIJU TEKSTA

  • Milan Stanković
Ključne reči: enkapsulacija, vektorsko predstavljanje reči, duboko mašinsko učenje, glove, word2vec, skipgram, cbow

Apstrakt

Obrada teksta odnosno NLP (Natural Language Processing) predstavlja atraktivnu oblast u oblasti računarske inteligencije. U ovom radu će biti predstavljeno više načina za pretvaranje teksta u vektore. Postoje dve velike kategorije, prva se zasniva na statističkim metodama a druga na korišćenju neuronskih mreža. Prednost vektorske predstave je mogućnost da se takvi vektori porede ili dalje lakše koriste u nekoj od metoda mašinskog učenja. Vektorska reprezentacija održava deo semantike, tako da predstavlja pogodnu metodu za reprezentaciju i poređenje kompleksnijeg teksta.

Reference

[1] Quoc Le, Tomas Mikolov, ``GloVe: Global Vectors for Word Representation'', Computer Science Department, Stanford University, Stanford, CA 94305, 2014.
[2] Quoc Le, Tomas Mikolov, ``Distributed Representations of Sentences and Documents'', Google Inc, 1600 Amphitheatre Parkway, Mountain View CA 94043, May 2014.
[3] Mikolov, Tomas & Chen, Kai & Corrado, G.s & Dean, Jeffrey. (2013). Efficient Estimation of Word Representations in Vector Space. Proceedings of Workshop at ICLR. 2013.
Objavljeno
2019-12-28
Sekcija
Elektrotehničko i računarsko inženjerstvo