СУМАРИЗАЦИЈА НАУЧНИХ РАДОВА НА СРПСКОМ ЈЕЗИКУ ПРИМЕНОМ NLP МЕТОДА

  • Наташа Ивановић
Ključne reči: Аутоматска сумаризација текста, NLP, Sequence-to-Sequence модели, Трансформер модели, TextRank алгоритам

Apstrakt

У раду је представљен систем за сумаризацију научних радова на српском језику применом NLP метода са циљем да се посао истраживача олакша кроз аутоматско генерисање апстракта. Решење је имплементирано кроз два модула – фаза екстракције (TextRank алгоритам) и фаза апстракције (Sequence-to-Sequence модели), где се трансформер модел показао као најбољи избор.

Reference

[1] Tas, O., & Kiyani, F. (2007). A survey automatic text summarization. PressAcademia Procedia, 5(1), 205-213.
[2] Cachola, I., Lo, K., Cohan, A., & Weld, D. S. (2020). TLDR: Extreme summarization of scientific documents. arXiv preprint arXiv:2004.15011.
[3] Mihalcea, R., & Tarau, P. (2004, July). Textrank: Bringing order into text. In Proceedings of the 2004 conference on empirical methods in natural language processing (pp. 404-411).
[4] Keneshloo, Y., Shi, T., Ramakrishnan, N., & Reddy, C. K. (2019). Deep reinforcement learning for sequence-to-sequence models. IEEE transactions on neural networks and learning systems, 31(7), 2469-2489.
[5] Edmundson, H. P. (1969). New methods in automatic extracting. Journal of the ACM (JACM), 16(2), 264-285.
[6] Kosmajac, D., & Kešelj, V. (2019, March). Automatic text summarization of news articles in serbian language. In 2019 18th International Symposium INFOTEH-JAHORINA (INFOTEH) (pp. 1-6). IEEE.
[7] Lin, H., & Ng, V. (2019, July). Abstractive summarization: A survey of the state of the art. In Proceedings of the AAAI conference on artificial intelligence (Vol. 33, No. 01, pp. 9815-9822).
[8] Pilault, J., Li, R., Subramanian, S., & Pal, C. (2020, November). On extractive and abstractive neural document summarization with transformer language models. In Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP) (pp. 9308-9319).
[9] Altmami, N. I., & Menai, M. E. B. (2022). Automatic summarization of scientific articles: A survey. Journal of King Saud University-Computer and Information Sciences, 34(4), 1011-1028.
[10] Shi, T., Keneshloo, Y., Ramakrishnan, N., & Reddy, C. K. (2021). Neural abstractive text summarization with sequence-to-sequence models. ACM Transactions on Data Science, 2(1), 1-37.
[11] Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., ... & Polosukhin, I. (2017). Attention is all you need. Advances in neural information processing systems, 30.
Objavljeno
2024-09-05
Sekcija
Elektrotehničko i računarsko inženjerstvo