Истраживач сарадник Едвин Пакоци


Недостаје слика

Едвин Пакоци

Истраживач сарадник


Телефон021/475-0204
E-mail
Академско звањеИстраживач сарадник
КанцеларијаЛабораторија за телекомуникације 224

Едвин Пакоци је рођен 14. маја 1988. године у Зрењанину. Завршио је основну школу „Други октобар“ 2003. године као ђак генерације, а затим је похађао „Зрењанинску гимназију“ (природно-математички смер) и завршио је 2007. године, поново као ђак генерације. У току средње школе освојио је по једно прво (2004. године) и треће место (2006. године) на републичким такмичењима из математике, као и по једно друго и треће место у појединачној конкуренцији на математичком турниру средњих школа „Архимедес“.

Школске 2007/08. године уписао је Факултет техничких наука на Универзитету у Новом Саду, одсек за енергетику, електронику и телекомуникације. Специјализовао се за смер за комуникационе технологије и обраду сигнала 2008. године, а за усмерење за обраду сигнала 2010. године. У току основних академских студија одрадио је двомесечну стручну праксу на Техничком универзитету Илменау у Немачкој. Дипломирао је на основним студијама у септембру 2011. године, одбранивши бечелор рад на тему „Детекција поплављеног земљишта на сателитским сликама применом Бајесових класификатора“ са највишом оценом, док му је укупна просечна оцена на основним студијама била 9,96. Уписао је мастер студије на усмерењу за обраду сигнала исте године. Мастер студије завршио је у јулу 2012. године са просечном оценом 10,00, а мастер рад на тему „Синтеза говора на бази скривених Марковљевих модела за српски језик“ одбранио је уз највишу оцену. Тиме је стекао звање дипломирани инжењер електротехнике и рачунарства - мастер. Добитник је Пупинове награде Матице српске (трећа награда) 2014. године за свој мастер рад. Такође је добитник стипендије Фонда за младе таленте у школској 2010/11. и 2011/12. години, као и награда за остварени успех у свакој години студија, као и за целокупно студирање.

Априла 2012. године запослио се у предузећу АлфаНум - говорне технологије из Новог Сада као програмер. Радио је на развоју технологија за препознавање и синтезу говора за српски и сродне јужнословенске језике. Као директан резултат његовог рада у АлфаНум-у је развијен први синтетизатор говора за српски језик на бази скривених Марковљевих модела, који је и био тема његовог мастер рада. У јесен 2012. године уписао је докторске студије на Факултету техничких наука, на студијској групи за енергетику, електронику и телекомуникације. Убрзо је поднео захтев за избор у звање истраживач-приправник на Факултету. Од краја 2013. године званично је запослен на Факултету. Пошто су били испуњени сви услови за звање истраживач-сарадник, одмах је покренут и поступак за избор у то звање. Од 2014. године има звање истраживач-сарадник и ради на Факултету на развоју система за препознавање говора, анотацију говорних база, као и детекцију и препознавање говорника, са запаженим резултатима. Између осталог, учествовао је у креирању и обради говорне базе за препознавање говора на великим речницима на српском језику, развоју декодера на бази дубоких неуралних мрежа за препознавање говора на великим речницима, развоју и имплементацији функција и алата у склопу апликације "Axon Voice Assistant" за Андроид платформу, развоју процедуре за детекцију говорних сегмената у аудио сигналу за мобилне телефоне, имплементацији скупа модула и процедура за висококвалитетну анотацију произвољне говорне базе, као и на развоју система за детекцију жељених говорника у телефонским снимцима.

Од 2012. до краја 2018. године био је аутор или коаутор на 13 радова са међународних конференција категорија М33 и М34, као и 7 радова са домаћих конференција категорије М63. Такође је учествовао у изради једне монографије категорије М14, а осим тога је и коаутор једног рада у часопису међународног значаја категорије М23, као и два рада у часописима националног значаја категорије М52. Аутор или коаутор је два техничка решења која се примењују на међународном нивоу категорије М81, два техничка решења категорије М82, једног техничког решења категорије М84 (значајно унапређени производ) и пет техничких решења категорије М85 (нови производ – прототип), а осим тога је сувласник једног патента на националном нивоу категорије М94.

Истраживач сарадник
01.12.2013.
Тренутно нема историјских података о чланству запосленог!
НазивУ Установи
Детекција поплављеног земљишта на сателитским сликама применом Бајесових класификатора

Диплома

Електротехничко и рачунарско инжењерство

Факултет техничких наука

2011

Синтеза говора на бази скривених Марковљевих модела за српски језик

Мастер рад

Електротехничко и рачунарско инжењерство

Факултет техничких наука

2012

Критеријум продукцијеОпис
(М14) Монографска студија/поглавље у књизи М12 или рад у тематском зборнику међународног значајаСечујски М., Пекар Д., Мак Р., Пакоци Е., Јаковљевић Н., Делић В., Поповић Б.: A comparison of decision tree based approaches to the modelling of prosodic features in Serbian, у: Verbal Communication Quality, Interdisciplinary Research II, 2013, Београд: Центар за унапређење животних активности, пп. 75-90, ISBN 978-86-81879-46-7
(М23) Рад у међународном часописуОстрогонац С., Пакоци Е., Сечујски М., Мишковић Д.: Morphology-based vs Unsupervised Word Clustering for Training Language Models for Serbian, у: Acta Polytechnica Hungarica, Journal of Applied Sciences, 2018, Будимпешта: Универзитет Обуда, ISSN 1785-8860, у штампи
(М33) Саопштење са међународног скупа штампано у целиниПоповић Б., Пакоци Е., Пекар Д.: End-to-End Large Vocabulary Speech Recognition for the Serbian Language, Springer-Verlag, Lecture Notes in Artificial Intelligence, 2017, Vol. 10458, пп. 343-352, 19. конференција Speech and Computer SPECOM, Хетфилд, 12-16 септембар, 2017, ISBN 978-3-319-66428-6
(М33) Саопштење са међународног скупа штампано у целиниПоповић Б., Острогонац С., Пакоци Е., Јаковљевић Н., Делић В.: Deep Neural Network Based Continuous Speech Recognition for Serbian Using the Kaldi Toolkit, Springer-Verlag, Lecture Notes in Artificial Intelligence, 2015, Vol. 9319, пп. 186-192, 17. конференција Speech and Computer SPECOM, Атина, 20-24. септембар, 2015, ISBN 978-3-319-23131-0
(М33) Саопштење са међународног скупа штампано у целиниПекар Д., Мишковић Д., Сузић С., Пакоци Е., Делић В.: Axon Voice Assistant - An Android-Based Smartphone Application in Serbian, 11. конференција ETAI, Охрид: Society for Electronics, Telecommunications, Automation and Informatics of the Republic of Macedonia, 26-28. септембар, 2013, пп. 1-6, ISBN 978-9989-630-68-2
(М33) Саопштење са међународног скупа штампано у целиниОстрогонац С., Сузић С., Бојанић М., Пакоци Е.: Speech Resources for a Serbian LVCSR System, 21. Телекомуникациони форум TELFOR, Београд: IEEE, Telecommunications Society, 26-28. новембар, 2013, пп. 478-481, ISBN 978-1-4799-1419-7
(М33) Саопштење са међународног скупа штампано у целиниПакоци Е., Мак Р., Острогонац С.: Subjective Assessment of Text-to-Speech Synthesis Systems for the Serbian Language, 20. Телекомуникациони форум TELFOR, Београд: IEEE, Telecommunications Society, 20-22. новембар, 2012, пп. 732-735, ISBN 978-1-4673-2983-5
(М33) Саопштење са међународног скупа штампано у целиниПоповић Б., Пакоци Е., Пекар Д.: A Comparison of Language Model Training Techniques in a Continuous Speech Recognition System for Serbian, Springer-Verlag, Lecture Notes in Artificial Intelligence, 2018, Vol. 11096, пп. 522-531, 20. конференција Speech and Computer SPECOM, Лајпциг, 18-22 септембар, 2018, ISBN 978-3-319-99578-6
(М33) Саопштење са међународног скупа штампано у целиниПакоци Е., Поповић Б., Пекар Д.: Language Model Optimization for a Deep Neural Network Based Speech Recognition System for Serbian, Springer-Verlag, Lecture Notes in Artificial Intelligence, 2017, Vol. 10458, пп. 483-492, 19. конференција Speech and Computer SPECOM, Хетфилд, 12-16 септембар, 2017, ISBN 978-3-319-66428-6
(М33) Саопштење са међународног скупа штампано у целиниПакоци Е., Поповић Б., Јаковљевић Н., Пекар Д., Yassa F.: A Phonetic Segmentation Procedure Based on Hidden Markov Models, Springer-Verlag, Lecture Notes in Artificial Intelligence, 2016, Vol. 9811, пп. 67-74, 18. конференција Speech and Computer SPECOM, Будимпешта, 23-27. август, 2016, ISBN 978-3-319-43958-7
(М33) Саопштење са међународног скупа штампано у целиниПоповић Б., Пакоци Е., Пекар Д.: Advanced Voice Activity Detection on Mobile Phones by Using Microphone Array and Phoneme-Specific Gaussian Mixture Models, 14. конференција Symposium on Intelligent Systems and Informatics SISY, 2016, Суботица: IEEE, SMC Technical Committee on Computational Cybernetics, 29-31. август, 2016, пп. 45-48, ISBN: 978-1-5090-2866-5
(М33) Саопштење са међународног скупа штампано у целиниПоповић Б., Пакоци Е., Јаковљевић Н., Кочиш Г., Пекар Д.: Voice Assistant Application for the Serbian Language, 23. Телекомуникациони форум TELFOR, Београд: IEEE, Telecommunications Society, 24-25. новембар, 2015, пп. 858-861, ISBN 978-1-5090-0054-8
(М33) Саопштење са међународног скупа штампано у целиниПакоци Е., Јаковљевић Н., Поповић Б., Мишковић Д., Пекар Д.: Speaker Detection Using Phoneme Specific Hidden Markov Models, Springer-Verlag, Lecture Notes in Computer Science, 2014, Vol. 8773, пп. 410-417, 16. конференција Speech and Computer SPECOM, Нови Сад, 5-9. октобар, 2014, ISBN 978-3-319-11580-1
(М34) Саопштење са међународног скупа штампано у изводуПоповић Б., Пакоци Е., Јаковљевић Н., Пекар Д., Острогонац С.: A Robust Voice Activity Detection in Voice Assistant Application, 3. конференција International Acoustics and Audio Engineering Conference TAKTONS, Нови Сад: РТВ Војводине, AES, Dirigent Acoustics, Факултет техничких наука Нови Сад, 18-21. новембар, 2015, пп. 38-39, ISBN: 978-86-7892-758-4
(М52) Рад у часопису националног значајаПакоци Е., Поповић Б., Пекар Д.: Improvements in Serbian Speech Recognition Using Sequence-Trained Deep Neural Networks, у: SPIIRAS Proceedings, 2018, Vol. 3, No. 58, пп. 53-76, ISSN 2078-9181
(М52) Рад у часопису националног значајаСузић С., Острогонац С., Пакоци Е., Бојанић М.: Building a Speech Repository for a Serbian LVCSR System, у: TELFOR Journal, 2014, Vol. 6, No. 2, пп. 109-114, ISSN 1821-3251
(М63) Саопштење са скупа националног значаја штампано у целиниПакоци Е., Поповић Б., Пекар Д.: Fast Sequence-Trained Deep Neural Network Models for Serbian Speech Recognition, 11. конференција Дигитална обрада говора и слике DOGS, Нови Сад: Факултет техничких наука (Нови Сад), Електротехнички факултет (Београд), Електронски факултет (Ниш), 22-25 новембар, 2017, пп. 25-28, ISBN 978-86-7892-993-9
(М63) Саопштење са скупа националног значаја штампано у целиниПоповић Б., Пакоци Е., Острогонац С., Пекар Д.: Large Vocabulary Continuous Speech Recognition for Serbian Using the Kaldi Toolkit, 10. конференција Дигитална обрада говора и слике DOGS, Нови Сад: Факултет техничких наука (Нови Сад), Електротехнички факултет (Београд), Електронски факултет (Ниш), 5-9. октобар, 2014, пп. 31-34, ISBN 978-86-7892-633-4
(М63) Саопштење са скупа националног значаја штампано у целиниПоповић Б., Пакоци Е., Јаковљевић Н., Пекар Д.: Experiments With Regression Trees for Speaker Adaptation in Continuous Speech Recognition, 10. конференција Дигитална обрада говора и слике DOGS, Нови Сад: Факултет техничких наука (Нови Сад), Електротехнички факултет (Београд), Електронски факултет (Ниш), 5-9. октобар, 2014, пп. 47-50, ISBN 978-86-7892-633-4
(М63) Саопштење са скупа националног значаја штампано у целиниПакоци Е., Мак Р.: HMM-Based Speech Synthesis for the Serbian Language, 56. Конференција за електронику, телекомуникације, рачунарство, аутоматику и нуклеарну технику ETRAN, Златибор: Друштво за ETRAN, 11-14. јун, 2012, пп. TE4.7:1-4, ISBN 978-86-80509-67-9
(М63) Саопштење са скупа националног значаја штампано у целиниМак Р., Пакоци Е.: Use of Global Variance for the Enhancement of HMM-Based Speech Synthesis, 56. Конференција за електронику, телекомуникације, рачунарство, аутоматику и нуклеарну технику ETRAN, Златибор: Друштво за ETRAN, 11-14. јун, 2012, пп. TE4.6:1-4, ISBN 978-86-80509-67-9
(М81) Нови производ или технологија уведени у производњу - међународни нивоМишковић Д., Пекар Д., Сечујски М., Пакоци Е.: SpeechLabel – алат за фонетско и прозодијско лабелирање говорних база, http://www.ftn.uns.ac.rs/n1062251031/speechlabel---alat-za-fonetsko-i-prozodijsko-labeliranje-govornih-baza-podataka, корисници: АлфаНум - говорне технологије д.о.о. (Нови Сад, Србија), Speech Morphing System, Inc (Campbell, CA, USA), 2015
(М81) Нови производ или технологија уведени у производњу - међународни нивоПакоци Е., Поповић Б., Пекар Д., Јаковљевић Н.: Скуп модула и процедура за висококвалитетну анотацију говорних база података, http://www.ftn.uns.ac.rs/n1062251030/skup-modula-i-procedura-za-visokokvalitetnu-anotaciju-govornih-baza-podataka, корисници: АлфаНум - говорне технологије д.о.о. (Нови Сад, Србија), Speech Morphing System, Inc. (Campbell, CA, USA), 2015
(М82) Нова производна линија, нови материјал, индустријски прототип,Мишковић Д., Вујновић Седлар Н., Острогонац С., Бојанић М., Мак Р., Пакоци Е.: Систем за аутоматско анкетирање (anDialer), http://www.ftn.uns.ac.rs/1740741199/sistem-za-automatsko-anketiranje--andialer-, корисник: АлфаНум - говорне технологије д.о.о. (Нови Сад, Србија), 2012
(М82) Нова производна линија, нови материјал, индустријски прототип,Поповић Б., Пакоци Е., Пекар Д., Делић В.: Напредна детекција говорних сегмената на мобилном телефону применом микрофонског низа и декодера“, http://www.ftn.uns.ac.rs/n1871597686%/napredna-detekcija-govornih-segmenata-na-mobilnom-telefonu-primenom-mikrofonskog-niza-i-dekodera, корисник: АлфаНум - говорне технологије д.о.о. (Нови Сад, Србија), 2016
(М84) Битно побољшан постојећи производ или технологијаПоповић Б., Пакоци Е., Пекар Д., Делић В.: Побољшање перформанси система за гласовно позивање (VoiceDial) применом Chain декодера, http://www.ftn.uns.ac.rs/995788631/poboljsanje-performansi-sistema-za-glasovno-pozivanje--voicedial--primenom-chain-dekodera-, корисник: АлфаНум - говорне технологије д.о.о. (Нови Сад, Србија), 2017
(М85) Прототип, нова метода, софтвер, стандардизован или атестиран инструмент,Поповић Б., Пакоци Е., Јаковљевић Н., Мишковић Д., Сузић С., Делић В.: Axon говорни асистент - апликација за управљање мобилним телефоном путем гласа на српском језику, http://www.ftn.uns.ac.rs/n4670117/axon-govorni-asistent---aplikacija-za-upravljanje-mobilnim-telefonom-putem-glasa-na-srpskom-jeziku, корисник: АлфаНум - говорне технологије д.о.о. (Нови Сад, Србија), 2015
(М85) Прототип, нова метода, софтвер, стандардизован или атестиран инструмент,Пакоци Е., Вујновић Седлар, Н., Острогонац С., Мак Р.: Wavfilt – апликација за модификовање аудио датотека, http://www.ftn.uns.ac.rs/n4670115/wavfilt---aplikacija-za-modifikovanje-audio-datoteka, корисник: АлфаНум - говорне технологије д.о.о. (Нови Сад, Србија), 2015
(М85) Прототип, нова метода, софтвер, стандардизован или атестиран инструмент,Сузић С., Пекар Д., Мак Р., Пакоци Е., Делић В.: Систем за аутоматско креирање транскрибоване говорне базе (anSpeechCollector), http://www.ftn.uns.ac.rs/n4670235/sistem-za-automatsko-kreiranje-transkribovane-govorne-baze, корисник: Факултет техничких наука и АлфаНум - говорне технологије д.о.о. (Нови Сад, Србија), 2014
(М85) Прототип, нова метода, софтвер, стандардизован или атестиран инструмент,Пакоци Е., Мак Р., Острогонац С., Јаковљевић Н., Сечујски М.: Синтетизатор говора на бази скривених Марковљевих модела за српски језик, http://www.ftn.uns.ac.rs/n1524171304/sintetizator-govora-na-bazi-skrivenih-markovljevih-modela-za-srpski-jezik, корисник: АлфаНум - говорне технологије д.о.о. (Нови Сад, Србија), 2012
(М85) Прототип, нова метода, софтвер, стандардизован или атестиран инструмент,Јаковљевић Н., Мишковић Д., Пакоци Е., Мак Р., Поповић Б.: Декодер за препознавање континуалног говора на великим речницима, http://www.ftn.uns.ac.rs/n1524171306/dekoder-za-prepoznavanje-kontinualnog-govora-na-velikim-recnicima, корисник: АлфаНум - говорне технологије д.о.о. (Нови Сад, Србија), 2012
(М92) Реализовани патент, сој, сорта или раса, архитектонско, грађевинско или урбанистичко ауторско делоПекар Д., Поповић Б., Пакоци Е., Мишковић Д., Делић В., Сечујски М.: Дубоке неуронске мреже на серверу у комбинацији са локалним декодером за препознавање говора (Cloud-Based Deep Neural Networks Combined with Local Speech Recognition Decoder), АлфаНум - говорне технологије д.о.о. (Нови Сад, Србија), 2018, број пријаве P-2016/0452, објављен у Гласнику интелектуалне својине, број 1/2018
ЗвањеУжа научна областВисокошколска установаДатум избора
Истраживач сарадникТелекомуникације и обрада сигналаФакултет техничких наука27.11.2016.
Истраживач сарадникТелекомуникације и обрада сигналаФакултет техничких наука01.12.2013.