JEZIK ZA PODRŠKU EKSTRAKCIJI PODATAKA IZ NESTRUKTURIRANIH IZVORA SA VEBA

  • Filip Frank
Ključne reči: DSL, struganje, Scrapy, textX, ekstrakcija, Python

Apstrakt

U ovom radu opisan je DSL (eng. Domain Specific Language) za ekstraktovanje podataka sa veba, napisan uz pomoć textX biblioteke i Python programskog jezika..

Reference

[1] Wikipedia, „World Wide Web,“ [Na mreži]. Available: https://en.wikipedia.org/wiki/World_Wide_Web. [Poslednji pristup 10 October 2018].
[2] H. Brody, The Ultimate Guide to Web Scraping, 2017.
[3] S. vanden Broucke i B. Baesens, Practical Web Scraping for Data Science, Apress, Berkeley, CA, 2018.
[4] I. Dejanovic, „Jezici specifični za domen,“ [Na mreži]. Available: http://www.igordejanovic.net/courses/jsd.html. [Poslednji pristup 3. oktobar 2018].
[5] Scrapy, „Scrapy 1.5 documentation,“ [Na mreži]. Available: https://doc.scrapy.org/en/latest. [Poslednji pristup 4. oktobar 2018].
[6] I. Dejanovic, „Arpeggio Documentation,“ [Na mreži]. Available: http://www.igordejanovic.net/Arpeggio. [Poslednji pristup 6. oktobar 2018].
[7] I. Dejanovic, „Arpeggio,“ [Na mreži]. Available: http://www.igordejanovic.net/courses/tech/arpeggio.html. [Poslednji pristup 6. oktobar 2018].
[8] Jinja2, „Jinja2 Documentation,“ [Na mreži]. Available: http://jinja.pocoo.org/docs/2.10/api. [Poslednji pristup 7. oktobar 2018].
Objavljeno
2019-05-24
Sekcija
Elektrotehničko i računarsko inženjerstvo