МОДЕЛЬ ОЦІНЮВАННЯ ТРУДОВИТРАТ НА РОЗРОБЛЕННЯ ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ НА ОСНОВІ ПОПЕРЕДНЬО НАВЧЕНИХ ZERO-SHOT-МОДЕЛЕЙ
DOI:
https://doi.org/10.30837/0135-1710.2026.189.196Ключові слова:
управління проєктами, розроблення програмного забезпечення, оцінювання трудовитрат, штучний інтелект, великі мовні моделі, векторизація текстуАнотація
Управління проєктами створення програмного забезпечення (ПЗ) передбачає планування, виконання та контроль робіт для забезпечення дотримання бюджету й строків. Предметом дослідження є оцінювання трудовитрат, що є одним із найвагоміших завдань, оскільки дає змогу керівникам мінімізувати ризики й оптимально розподілити ресурси. За появи штучного інтелекту (ШІ) й продовження цифрової трансформації ключового значення набуває застосування методів оброблення природної мови (NLP) і великих мовних моделей (LLM). Ці інструменти здатні аналізувати текстові вимоги й користувацькі історії для прогнозування необхідних зусиль. Вони допомагають семантично структурувати складні текстові вимоги й покращувати точність оцінювання. Використання zero-shot-моделей не потребує донавчання на цільових даних, що економить ресурси й забезпечує високу адаптивність. Мета дослідження – розроблення моделі для оцінювання трудовитрат на основі вимог до ПЗ, поданих у різних формах. Це досягається за допомогою таких завдань: розроблення моделі оцінювання трудовитрат на створення ПЗ на основі сучасних попередньо навчених zero-shot-моделей; експериментальне дослідження процесу оцінювання точності запропонованих моделей. Результати. У роботі застосовано публічний набір даних і моделі ШІ, що різняться архітектурою, методами навчання й ліцензійними умовами. Моделі оцінювалися за метриками середньої абсолютної похибки, середньої відносної похибки й кореня середньоквадратичного відхилення. Побудовано модель оцінювання трудовитрат на розроблення ПЗ, яка в процесі експерименту продемонструвала, що точність прогнозування трудовитрат значною мірою залежить від характеру набору даних і стилю формулювання користувацьких історій. Порівняно з узагальненими моделями попередніх досліджень тренування проєктно-специфічних моделей значно підвищує точність прогнозів. Запропонована модель оцінювання трудовитрат на основі zero-shot-векторизації ефективно автоматизує оцінювання користувацьких історій, полегшуючи планування ресурсів на різних етапах життєвого циклу створення ПЗ. Досягнуті результати відкривають перспективи для гнучкого й масштабованого застосування NLP на основі великих мовних моделей у сфері управління проєктами розроблення програмного забезпечення.
Посилання
Project Management Institute (2017), A Guide to the Project Management Body of Knowledge (PMBOK® Guide), 6th edn. Newtown Square, PA: Project Management Institute.
Project Management Institute Sweden (2024), Artificial Intelligence and Project Management: A Global Chapter-Led Survey 2024, Stockholm: Project Management Institute.
Taboada, I., Daneshpajouh, A., Toledo, N., de Vass, T. (2023), "Artificial Intelligence Enabled Project Management: A Systematic Literature Review", Applied Sciences, Vol. 13(8), p. 5014. DOI: https://doi.org/10.3390/app13085014
Martovytskyi, V., Argunov, V., Ruban, I., Romanenkov, Y. (2023), "Developing a risk management approach based on reinforcement training in forming an investment portfolio", Eastern-European Journal of Enterprise Technologies, Vol. 2(3(122)), pp. 106–116. DOI: https://doi.org/10.15587/1729-4061.2023.277997
Dam, H. K., Tran, T., Grundy, J., Ghose, A., Kamei, Y. (2019), "Towards Effective AI-Powered Agile Project Management", Proceedings of the 2019 IEEE/ACM 41st International Conference on Software Engineering: New Ideas and Emerging Results (ICSE-NIER), Montreal, Canada, 25-31 May. IEEE, pp. 41–44. DOI: https://doi.org/10.48550/arXiv.1812.10578
Serdechnyi, V., Barkovska, O., Kovalenko, A., Havrashenko, A., Martovytskyi, V. (2025), "Research on machine learning methods for detecting objects in difficult shooting conditions", Radioelectronic and Computer Systems, Vol. 2, pp. 64–77. DOI: https://doi.org/10.32620/reks.2025.2.04
Azzeh, M. (2011), "Adjusted case-based software effort estimation using bees optimization algorithm", Knowledge-Based and Intelligent Information and Engineering Systems, pp. 315–324. DOI: https://doi.org/10.1007/978-3-642-23863-5_32
Bardsiri, V. K., Jawawi, D. N. A., Bardsiri, A. K., Khatibi, E. (2013), "LMES: A localized multi-estimator model to estimate software development effort", Engineering Applications of Artificial Intelligence, Vol. 26(10), pp. 2624–2640. DOI: https://doi.org/10.1016/j.engappai.2013.08.005
Jorgensen, M., Shepperd, M. (2006), "A systematic review of software development cost estimation studies", IEEE Transactions on Software Engineering, Vol. 33(1), pp. 33–53. DOI: https://doi.org/10.1109/TSE.2007.256943
Alsaadi, B., Saeedi, K. (2022), "Data-driven effort estimation techniques of agile user stories: a systematic literature review", Artificial Intelligence Review, Vol. 55(7), pp. 5485–5516. DOI: https://doi.org/10.1007/s10462-021-10132-x
Choetkiertikul, M., Dam, H. K., Tran, T., Pham, T., Ghose, A., Menzies, T. (2018), "A deep learning model for estimating story points", IEEE Transactions on Software Engineering, Vol. 45(7), pp. 637–656. DOI: https://doi.org/10.48550/arXiv.1609.00489
Usman, M., Mendes, E., Weidt, F., Britto, R. (2014), "Effort estimation in agile software development: a systematic literature review", Proceedings of the 10th International Conference on Predictive Models in Software Engineering (PROMISE '14), Turin, Italy, 18 September, New York: ACM, pp. 82–91. DOI: https://doi.org/10.1145/2639490.2639503
Fávero, E., Casanova, D., Pimentel, A. (2020), "SE3M: A Model for Software Effort Estimation Using Pre-trained Embedding Models", arXiv. DOI: https://doi.org/10.48550/arXiv.2006.16831
Moharreri, K., Sapre, A. V., Ramanathan, J., Ramnath, R. (2016), "Cost-Effective Supervised Learning Models for Software Effort Estimation in Agile Environments", Proceedings - International Computer Software and Applications Conference, 2, pp. 135–140. DOI: https://doi.org/10.1109/COMPSAC.2016.85
Zhang, C., Tong, S., Mo, W., Zhou, Y., Xia, Y., Shen, B. (2016), "ESSE: an early software size estimation method based on auto-extracted requirements features", Internetware '16: Proceedings of the 8th Asia-Pacific Symposium on Internetware, Beijing, China, 18 September, New York: Association for Computing Machinery, pp. 112–115. DOI: https://doi.org/10.1145/2993717.2993733
Mikolov, T., Chen, K., Corrado, G., Dean, J. (2013), "Efficient estimation of word representations in vector space", arXiv preprint. DOI: https://doi.org/10.48550/arXiv.1301.3781
Floridi, L., Chiriatti, M. (2020), "GPT-3: Its Nature, Scope, Limits, and Consequences", Minds and Machines, 30(4), pp. 681–694. DOI: https://doi.org/10.1007/s11023-020-09548-1
Devlin, J., Chang, M. W., Lee, K., Toutanova, K. (2019), "BERT: Pre-training of deep bidirectional transformers for language understanding", Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers), Minneapolis, Minnesota, 2–7 June, Stroudsburg, PA: Association for Computational Linguistics, pp. 4171–4186. DOI: https://doi.org/10.18653/v1/N19-1423
Jadhav, A., Kaur, M., Akter, F. (2022), "Evolution of software development effort and cost estimation techniques: five decades study using automated text mining approach", Mathematical Problems in Engineering, Vol. 1, 5782587. DOI: https://doi.org/10.1155/2022/5782587
Rossi, B. B., Fontoura, L. M. (2025), "AI-Based Approaches for Software Tasks Effort Estimation: A Systematic Review of Methods and Trends", Proceedings of the 27th International Conference on Enterprise Information Systems (ICEIS), Vol. 2, pp. 144–151. DOI: https://doi.org/10.5220/0013218200003929
Mahmood, Y., Kama, N., Azmi, A., Khan, A. S., Ali, M. (2022), "Software effort estimation accuracy prediction of machine learning techniques: A systematic performance evaluation", Software: Practice and experience, Vol. 52(1), pp. 39–65. DOI: https://doi.org/10.1002/spe.3009
Tenekeci, S., Ünlü, H., Dikenelli, E., Selçuk, U., Soylu, G.K., Demirörs, O. (2024), "Predicting software size and effort from code using natural language processing", in Joint Proceedings of the 33rd International Workshop on Software Measurement and the 18th International Conference on Software Process and Product Measurement (IWSM-MENSURA 2024), Montréal, Canada, September, Aachen: CEUR-WS, Vol. 3852
Sharma, A., Chaudhary, N. (2022), "Analysis of software effort estimation based on story point and lines of code using machine learning", International Journal of Computing and Digital Systems, Vol. 12(1). DOI: https://journal.uob.edu.bh/10.12785/ijcds/1201012
Catak, T., Durdu, P.O., Omurca, S.I. (2024), "Enhancing agile effort estimation: An nlp approach for software requirements analysis", 2024 International Congress on Human-Computer Interaction, Optimization and Robotic Applications (HORA), IEEE, pp. 1–8. DOI: https://doi.org/10.1109/HORA61326.2024.10550870
Atoum, I., Otoom, A. A. (2024), "Enhancing software effort estimation with pre-trained word embeddings: A small-dataset solution for accurate story point prediction", Electronics, Vol. 13(23), p. 4843. DOI: https://doi.org/10.3390/electronics13234843
Fu, M., Tantithamthavorn, C. (2022), "GPT2SP: A transformer-based agile story point estimation approach", IEEE Transactions on Software Engineering, Vol. 49(2), pp. 611–625. DOI: https://doi.org/10.1109/TSE.2022.3158252
Enevoldsen, K. et al. (2025), "MMTEB: Massive Multilingual Text Embedding Benchmark", arXiv preprint. DOI: https://doi.org/10.48550/arXiv.2502.13595
Shahinmoghadam, M., Motamedi, A. (2025), "Benchmarking pre-trained text embedding models in aligning built asset information", Scientific Reports, Vol. 15(1), p. 23866. DOI: https://doi.org/10.1038/s41598-025-09052-5
Lee, J., Chen, F., Dua, S., Cer, D., Shanbhogue, M., Naim, I., Duerig, T. (2025), "Gemini embedding: Generalizable embeddings from gemini", arXiv preprint. DOI: https://doi.org/10.48550/arXiv.2503.07891
OpenAI (2024), OpenAI documentation, available at: https://platform.openai.com/docs/ (last accessed 12.05.2026)
Zhang, X., Thakur, N., Ogundepo, O., Kamalloo, E., Alfonso-Hermelo, D., Li, X., Lin, J. (2022), "Making a MIRACL: Multilingual Information Retrieval Across a Continuum of Languages", arXiv preprint. DOI: https://doi.org/10.48550/arXiv.2210.09984
Zhang, Y., Li, M., Long, D., Zhang, X., Lin, H., Yang, B., Zhou, J. (2025), "Qwen3 Embedding: Advancing Text Embedding and Reranking Through Foundation Models", arXiv preprint. DOI: https://doi.org/10.48550/arXiv.2506.05176
Wang, L., Yang, N., Huang, X., Yang, L., Majumder, R., Wei, F. (2024), "Multilingual e5 text embeddings: A technical report", arXiv preprint. DOI: https://doi.org/10.48550/arXiv.2402.05672
Zhang, X., Zhang, Y., Long, D., Xie, W., Dai, Z., Tang, J., Lin, H., Yang, B., Xie, P., Huang, F., Zhang, M., Li, W., Zhang, M. (2024), "mGTE: Generalized Long-Context Text Representation and Reranking Models for Multilingual Text Retrieval", Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing: Industry Track, Miami, Florida: Association for Computational Linguistics, pp. 1198–1213. DOI: https://doi.org/10.18653/v1/2024.emnlp-industry.103
Lee, J., Dai, Z., Ren, X., Chen, B., Cer, D., Cole, J. R., Naim, I. (2024), "Gecko: Versatile text embeddings distilled from large language models", arXiv preprint. DOI: https://doi.org/10.48550/arXiv.2403.20327
UA
EN 


