SOFTWARE DEVELOPMENT EFFORT ESTIMATION MODEL BASED ON PRE-TRAINED ZERO-SHOT MODELS

Іван Кушнір; Валентина Кирій

doi:10.30837/0135-1710.2026.189.196

Автор(и)

Іван Кушнір Харківський національний університет радіоелектроніки, Україна https://orcid.org/0009-0004-5055-0331
Валентина Кирій Харківський національний університет радіоелектроніки, Україна https://orcid.org/0000-0002-2537-264X

DOI:

https://doi.org/10.30837/0135-1710.2026.189.196

Ключові слова:

управління проєктами, розроблення програмного забезпечення, оцінювання трудовитрат, штучний інтелект, великі мовні моделі, векторизація тексту

Анотація

Управління проєктами створення програмного забезпечення (ПЗ) передбачає планування, виконання та контроль робіт для забезпечення дотримання бюджету й строків. Предметом дослідження є оцінювання трудовитрат, що є одним із найвагоміших завдань, оскільки дає змогу керівникам мінімізувати ризики й оптимально розподілити ресурси. За появи штучного інтелекту (ШІ) й продовження цифрової трансформації ключового значення набуває застосування методів оброблення природної мови (NLP) і великих мовних моделей (LLM). Ці інструменти здатні аналізувати текстові вимоги й користувацькі історії для прогнозування необхідних зусиль. Вони допомагають семантично структурувати складні текстові вимоги й покращувати точність оцінювання. Використання zero-shot-моделей не потребує донавчання на цільових даних, що економить ресурси й забезпечує високу адаптивність. Мета дослідження – розроблення моделі для оцінювання трудовитрат на основі вимог до ПЗ, поданих у різних формах. Це досягається за допомогою таких завдань: розроблення моделі оцінювання трудовитрат на створення ПЗ на основі сучасних попередньо навчених zero-shot-моделей; експериментальне дослідження процесу оцінювання точності запропонованих моделей. Результати. У роботі застосовано публічний набір даних і моделі ШІ, що різняться архітектурою, методами навчання й ліцензійними умовами. Моделі оцінювалися за метриками середньої абсолютної похибки, середньої відносної похибки й кореня середньоквадратичного відхилення. Побудовано модель оцінювання трудовитрат на розроблення ПЗ, яка в процесі експерименту продемонструвала, що точність прогнозування трудовитрат значною мірою залежить від характеру набору даних і стилю формулювання користувацьких історій. Порівняно з узагальненими моделями попередніх досліджень тренування проєктно-специфічних моделей значно підвищує точність прогнозів. Запропонована модель оцінювання трудовитрат на основі zero-shot-векторизації ефективно автоматизує оцінювання користувацьких історій, полегшуючи планування ресурсів на різних етапах життєвого циклу створення ПЗ. Досягнуті результати відкривають перспективи для гнучкого й масштабованого застосування NLP на основі великих мовних моделей у сфері управління проєктами розроблення програмного забезпечення.

Біографії авторів

Іван Кушнір, Харківський національний університет радіоелектроніки

аспірант кафедри електронних обчислювальних машин

Валентина Кирій, Харківський національний університет радіоелектроніки

кандидат економічних наук, доцент, завідувач відділу аспірантури та докторантури

Посилання

Project Management Institute (2017), A Guide to the Project Management Body of Knowledge (PMBOK® Guide), 6th edn. Newtown Square, PA: Project Management Institute.

Project Management Institute Sweden (2024), Artificial Intelligence and Project Management: A Global Chapter-Led Survey 2024, Stockholm: Project Management Institute.

Taboada, I., Daneshpajouh, A., Toledo, N., de Vass, T. (2023), "Artificial Intelligence Enabled Project Management: A Systematic Literature Review", Applied Sciences, Vol. 13(8), p. 5014. DOI: https://doi.org/10.3390/app13085014

Martovytskyi, V., Argunov, V., Ruban, I., Romanenkov, Y. (2023), "Developing a risk management approach based on reinforcement training in forming an investment portfolio", Eastern-European Journal of Enterprise Technologies, Vol. 2(3(122)), pp. 106–116. DOI: https://doi.org/10.15587/1729-4061.2023.277997

Dam, H. K., Tran, T., Grundy, J., Ghose, A., Kamei, Y. (2019), "Towards Effective AI-Powered Agile Project Management", Proceedings of the 2019 IEEE/ACM 41st International Conference on Software Engineering: New Ideas and Emerging Results (ICSE-NIER), Montreal, Canada, 25-31 May. IEEE, pp. 41–44. DOI: https://doi.org/10.48550/arXiv.1812.10578

Serdechnyi, V., Barkovska, O., Kovalenko, A., Havrashenko, A., Martovytskyi, V. (2025), "Research on machine learning methods for detecting objects in difficult shooting conditions", Radioelectronic and Computer Systems, Vol. 2, pp. 64–77. DOI: https://doi.org/10.32620/reks.2025.2.04

Azzeh, M. (2011), "Adjusted case-based software effort estimation using bees optimization algorithm", Knowledge-Based and Intelligent Information and Engineering Systems, pp. 315–324. DOI: https://doi.org/10.1007/978-3-642-23863-5_32

Bardsiri, V. K., Jawawi, D. N. A., Bardsiri, A. K., Khatibi, E. (2013), "LMES: A localized multi-estimator model to estimate software development effort", Engineering Applications of Artificial Intelligence, Vol. 26(10), pp. 2624–2640. DOI: https://doi.org/10.1016/j.engappai.2013.08.005

Jorgensen, M., Shepperd, M. (2006), "A systematic review of software development cost estimation studies", IEEE Transactions on Software Engineering, Vol. 33(1), pp. 33–53. DOI: https://doi.org/10.1109/TSE.2007.256943

Alsaadi, B., Saeedi, K. (2022), "Data-driven effort estimation techniques of agile user stories: a systematic literature review", Artificial Intelligence Review, Vol. 55(7), pp. 5485–5516. DOI: https://doi.org/10.1007/s10462-021-10132-x

Choetkiertikul, M., Dam, H. K., Tran, T., Pham, T., Ghose, A., Menzies, T. (2018), "A deep learning model for estimating story points", IEEE Transactions on Software Engineering, Vol. 45(7), pp. 637–656. DOI: https://doi.org/10.48550/arXiv.1609.00489

Usman, M., Mendes, E., Weidt, F., Britto, R. (2014), "Effort estimation in agile software development: a systematic literature review", Proceedings of the 10th International Conference on Predictive Models in Software Engineering (PROMISE '14), Turin, Italy, 18 September, New York: ACM, pp. 82–91. DOI: https://doi.org/10.1145/2639490.2639503

Fávero, E., Casanova, D., Pimentel, A. (2020), "SE3M: A Model for Software Effort Estimation Using Pre-trained Embedding Models", arXiv. DOI: https://doi.org/10.48550/arXiv.2006.16831

Moharreri, K., Sapre, A. V., Ramanathan, J., Ramnath, R. (2016), "Cost-Effective Supervised Learning Models for Software Effort Estimation in Agile Environments", Proceedings - International Computer Software and Applications Conference, 2, pp. 135–140. DOI: https://doi.org/10.1109/COMPSAC.2016.85

Zhang, C., Tong, S., Mo, W., Zhou, Y., Xia, Y., Shen, B. (2016), "ESSE: an early software size estimation method based on auto-extracted requirements features", Internetware '16: Proceedings of the 8th Asia-Pacific Symposium on Internetware, Beijing, China, 18 September, New York: Association for Computing Machinery, pp. 112–115. DOI: https://doi.org/10.1145/2993717.2993733

Mikolov, T., Chen, K., Corrado, G., Dean, J. (2013), "Efficient estimation of word representations in vector space", arXiv preprint. DOI: https://doi.org/10.48550/arXiv.1301.3781

Floridi, L., Chiriatti, M. (2020), "GPT-3: Its Nature, Scope, Limits, and Consequences", Minds and Machines, 30(4), pp. 681–694. DOI: https://doi.org/10.1007/s11023-020-09548-1

Devlin, J., Chang, M. W., Lee, K., Toutanova, K. (2019), "BERT: Pre-training of deep bidirectional transformers for language understanding", Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers), Minneapolis, Minnesota, 2–7 June, Stroudsburg, PA: Association for Computational Linguistics, pp. 4171–4186. DOI: https://doi.org/10.18653/v1/N19-1423

Jadhav, A., Kaur, M., Akter, F. (2022), "Evolution of software development effort and cost estimation techniques: five decades study using automated text mining approach", Mathematical Problems in Engineering, Vol. 1, 5782587. DOI: https://doi.org/10.1155/2022/5782587

Rossi, B. B., Fontoura, L. M. (2025), "AI-Based Approaches for Software Tasks Effort Estimation: A Systematic Review of Methods and Trends", Proceedings of the 27th International Conference on Enterprise Information Systems (ICEIS), Vol. 2, pp. 144–151. DOI: https://doi.org/10.5220/0013218200003929

Mahmood, Y., Kama, N., Azmi, A., Khan, A. S., Ali, M. (2022), "Software effort estimation accuracy prediction of machine learning techniques: A systematic performance evaluation", Software: Practice and experience, Vol. 52(1), pp. 39–65. DOI: https://doi.org/10.1002/spe.3009

Tenekeci, S., Ünlü, H., Dikenelli, E., Selçuk, U., Soylu, G.K., Demirörs, O. (2024), "Predicting software size and effort from code using natural language processing", in Joint Proceedings of the 33rd International Workshop on Software Measurement and the 18th International Conference on Software Process and Product Measurement (IWSM-MENSURA 2024), Montréal, Canada, September, Aachen: CEUR-WS, Vol. 3852

Sharma, A., Chaudhary, N. (2022), "Analysis of software effort estimation based on story point and lines of code using machine learning", International Journal of Computing and Digital Systems, Vol. 12(1). DOI: https://journal.uob.edu.bh/10.12785/ijcds/1201012

Catak, T., Durdu, P.O., Omurca, S.I. (2024), "Enhancing agile effort estimation: An nlp approach for software requirements analysis", 2024 International Congress on Human-Computer Interaction, Optimization and Robotic Applications (HORA), IEEE, pp. 1–8. DOI: https://doi.org/10.1109/HORA61326.2024.10550870

Atoum, I., Otoom, A. A. (2024), "Enhancing software effort estimation with pre-trained word embeddings: A small-dataset solution for accurate story point prediction", Electronics, Vol. 13(23), p. 4843. DOI: https://doi.org/10.3390/electronics13234843

Fu, M., Tantithamthavorn, C. (2022), "GPT2SP: A transformer-based agile story point estimation approach", IEEE Transactions on Software Engineering, Vol. 49(2), pp. 611–625. DOI: https://doi.org/10.1109/TSE.2022.3158252

Enevoldsen, K. et al. (2025), "MMTEB: Massive Multilingual Text Embedding Benchmark", arXiv preprint. DOI: https://doi.org/10.48550/arXiv.2502.13595

Shahinmoghadam, M., Motamedi, A. (2025), "Benchmarking pre-trained text embedding models in aligning built asset information", Scientific Reports, Vol. 15(1), p. 23866. DOI: https://doi.org/10.1038/s41598-025-09052-5

Lee, J., Chen, F., Dua, S., Cer, D., Shanbhogue, M., Naim, I., Duerig, T. (2025), "Gemini embedding: Generalizable embeddings from gemini", arXiv preprint. DOI: https://doi.org/10.48550/arXiv.2503.07891

OpenAI (2024), OpenAI documentation, available at: https://platform.openai.com/docs/ (last accessed 12.05.2026)

Zhang, X., Thakur, N., Ogundepo, O., Kamalloo, E., Alfonso-Hermelo, D., Li, X., Lin, J. (2022), "Making a MIRACL: Multilingual Information Retrieval Across a Continuum of Languages", arXiv preprint. DOI: https://doi.org/10.48550/arXiv.2210.09984

Zhang, Y., Li, M., Long, D., Zhang, X., Lin, H., Yang, B., Zhou, J. (2025), "Qwen3 Embedding: Advancing Text Embedding and Reranking Through Foundation Models", arXiv preprint. DOI: https://doi.org/10.48550/arXiv.2506.05176

Wang, L., Yang, N., Huang, X., Yang, L., Majumder, R., Wei, F. (2024), "Multilingual e5 text embeddings: A technical report", arXiv preprint. DOI: https://doi.org/10.48550/arXiv.2402.05672

Zhang, X., Zhang, Y., Long, D., Xie, W., Dai, Z., Tang, J., Lin, H., Yang, B., Xie, P., Huang, F., Zhang, M., Li, W., Zhang, M. (2024), "mGTE: Generalized Long-Context Text Representation and Reranking Models for Multilingual Text Retrieval", Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing: Industry Track, Miami, Florida: Association for Computational Linguistics, pp. 1198–1213. DOI: https://doi.org/10.18653/v1/2024.emnlp-industry.103

Lee, J., Dai, Z., Ren, X., Chen, B., Cer, D., Cole, J. R., Naim, I. (2024), "Gecko: Versatile text embeddings distilled from large language models", arXiv preprint. DOI: https://doi.org/10.48550/arXiv.2403.20327