×
Универзитет у Новом Саду

Предмет: Рачунарска анализа текста (17.E2524)

Основне информације:
 
Категорија Теоријско-методолошки
Ужа научна област Примењене рачунарске науке и информатика
ЕСПБ 6

Упознавање студентата са концептима и техникама рачунарске анализе текста (Text Mining, TM) и екстракције информација (Information Extraction, IE). Оспособљавање студената за примену техника, метода и алата из области рачунарске анализе текста и екстракције информација.

Познавање концепата, техника и алата за анализу и истраживање текста. Студент је обучен да врши обраду и пред-процесирање неструктурираних текстуалних података; примењује основне технике обраде природних језика; креира моделе за класфикацију текста и екстракцију информација; пројектује и одржава text mining системе.

Основни концепти и преглед области рачунарске анализе текста и екстракције информација. Пред-процесирање текста. Лексичка, синтаксна и семантичка анализа. Употреба метода машинског учења у анализи текста: класификација и кластеровање текстуланих докумената. Пробабилистички модели за екстракцију информација: модели максималне ентропије (Maximum Entropy Models, ME), скривени модели Маркова (Hidden Markov Models, HMM), условна случајна поља (Conditional Random Fields, CRF). Методе екстракције информација засновне на правилима (rule-based information extraction). Аутоматска екстракција термина. Аутоматска екстракција и семантичка анотација именованих ентиета из текста. Аутоматска сажимање текска. Системи за за аутоматско одговарање на питања. Визуализација текстуалних података. Екстракција информација из пословних извештаја. Аутоматско препознавање ставова и емоција из текста (opinion and sentiment mining). Екстракција информација у биологији и медицини.

Облици извођења наставе су: предавања, рачунарске вежбе, израда домаћих задатака, и консултације. На предавањима се, коришћењем потребних дидактичких средстава, излажу садржаји предмета и стимулише се активно учешће студената постављањем питања. Практични део градива студенти савладавају на рачунарским вежбама кроз задатке које решавају уз помоћ асистента или самостално и кроз самосталну израду домаћих задатака

Аутори Назив Година Издавач Језик
Benjamin Bengfort, Rebecca Bilbro, Tony Ojed Applied Text Analysis with Python: Enabling Language-Aware Data Products with Machine 2018 O'Reilly Media Енглески
Ronen Feldman, James Sanger The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data 2006 Cambridge University Press Енглески
Sholom M. Weiss, Nitin Indurkhya, Tong Zhang, Fred Damerau Text Mining: Predictive Methods for Analyzing Unstructured Information 2004 Springer Енглески
Yoav Goldberg Neural Network Methods in Natural Language Processing 2017 Morgan & Claypool Publishers Енглески
Li Deng, Yang Liu Deep Learning in Natural Language Processing 2018 Springer Енглески
Предметна активност Предиспитна Обавезна Број поена
Предметна активност
Предметни пројекат
Предиспитна
Да
Обавезна
Да
Број поена
50.00
Предметна активност
Усмени део испита
Предиспитна
Не
Обавезна
Да
Број поена
50.00

Предавања

Рачунарске вежбе