ГІБРИДНІ МОДЕЛІ ШТУЧНОГО ІНТЕЛЕКТУ В ЗАДАЧАХ АВТОМАТИЗОВАНОГО ОЦІНЮВАННЯ ДОСТОВІРНОСТІ РЕЗУЛЬТАТІВ ВАЛІДАЦІЇ ІНФОРМАЦІЙНИХ СИСТЕМ
DOI:
https://doi.org/10.30837/0135-1710.2026.188.033Ключові слова:
гібридні моделі штучного інтелекту, валідація інформаційних систем, графові нейронні мережі, трансформерні моделі, оцінювання достовірності, DgraphFin V2, регресійне моделювання, калібрування ймовірностейАнотація
Предметом дослідження є автоматизоване оцінювання достовірності результатів валідації в інформаційних системах з огляду на структурні залежності між компонентами й семантичний зміст валідаційних артефактів. Мета роботи – підвищення надійності та відтворюваності валідації за допомогою розроблення гібридної моделі штучного інтелекту, що інтегрує графові та семантичні види подання даних для регресійного оцінювання рівня достовірності. Завдання дослідження: аналіз структурних і структурно-семантичних моделей (AST, PDG, CPG, Vul-LMGNN, ECHO, C-PCFG) у контексті валідації інформаційних систем; формулювання математичної постановки задачі оцінювання достовірності; розроблення архітектури гібридної моделі на основі GNN і трансформерного кодувальника; реалізація механізму інтеграції структурної та семантичної модальностей у спільному векторному просторі; експериментальне дослідження на графовому фінансовому наборі даних DgraphFin V2 й порівняння з базовими моделями. Методи дослідження передбачають графові нейронні мережі, трансформерний кодувальник типу BERT/CodeBERT, регресійне моделювання із сигмоїдною активацією, оптимізацію методом Adam та статистичне оцінювання якості й калібрування (MSE, MAE, ECE, R2, Spearman , ROC-AUC). Результати роботи. Запропонована гібридна архітектура забезпечує регресійне оцінювання достовірності в інтервалі [0;1] і демонструє стабільну збіжність без ознак перенавчання, а також кращі значення всіх ключових метрик порівняно з чисто семантичними, чисто структурними та класичними статистичними моделями. Аналіз ваг механізму самоуваги підтвердив коректну ідентифікацію значущих структурних і семантичних залежностей. Висновок: запропонована модель забезпечує більш точне каліброване оцінювання достовірності результатів валідації, що дає змогу автоматизувати відбір ненадійних результатів, зменшити вплив людського фактора й підвищити відтворюваність валідаційних процедур. Перспективним напрямом подальших досліджень є розвиток мультимодальних архітектур із динамічним перерозподілом ваг між модальностями.
Посилання
Wang, K., Yan, M., Zhang, H., Hu, H. (2022), "Unified abstract syntax tree representation learning for cross-language program classification", arXiv preprint arXiv:2205.00424, Ithaca, Cornell University. DOI: https://doi.org/10.48550/arXiv.2205.00424
Homerding, B., Patel, A., Deiana, E. A., Su, Y., Tan, Z., Xu, Z., Godala, B. R., August, D. I., Campanoni, S. (2024), "The parallel semantics program dependence graph", arXiv preprint arXiv:2402.00986, Ithaca, Cornell University. DOI: https://doi.org/10.48550/arXiv.2402.00986
Küchler, A., Banse, C. (2022), "Representing LLVM-IR in a code property graph", arXiv preprint arXiv:2211.05627, Ithaca, Cornell University. DOI: https://doi.org/10.48550/arXiv.2211.05627
Le Anh Quan, V., Thuan Phat, C., Van Nguyen, K., The Duy, P., Pham, V.-H. (2023), "XGV-BERT: Leveraging contextualized language model and graph neural network for efficient software vulnerability detection", arXiv preprint arXiv:2309.14677. DOI: https://doi.org/10.48550/arXiv.2309.14677
Liu, R., Wang, Y., Xu, H., Sun, J., Zhang, F., Li, P., Guo, Z. (2024), "Vul-LMGNNs: Fusing language models and online-distilled graph neural networks for code vulnerability detection", Information Fusion, Vol. 115, Article 102748. DOI: https://doi.org/10.1016/j.inffus.2024.102748
Sun, Y., Yan, J., Lu, L., Zhang, H., Shang, Y. (2025), "Semantic fusion-oriented bi-typed multi-relational heterogeneous graph neural network", IEEE Access, Vol. 13, P. 64584–64593. DOI: https://doi.org/10.1109/ACCESS.2025.3559720
Chen, Y., Ding, Z., Alowain, L., Chen, X., Wagner, D. (2023), "DiverseVul: A new vulnerable source code dataset for deep learning-based vulnerability detection", Proceedings of the 26th International Symposium on Research in Attacks, Intrusions and Defenses (RAID ’23), P. 654–668, New York, Association for Computing Machinery. DOI: https://doi.org/10.1145/3607199.3607242
Zhou, Y., Liu, S., Siow, J., Du, X., Liu, Y. (2019), "Devign: Effective vulnerability identification by learning comprehensive program semantics via graph neural networks", arXiv preprint arXiv:1909.03496, Ithaca, Cornell University. DOI: https://doi.org/10.48550/arXiv.1909.03496
Kim, L., Russell, R. (2018), "Draper VDISC Dataset – Vulnerability Detection in Source Code", OSF (Open Science Framework), Charlottesville, Center for Open Science. Available at: https://osf.io/d45bw
Van Petegem, C., Demeyere, K., Maertens, R., Strijbol, N., De Wever, B., Mesuere, B., Dawyndt, P. (2024), "Mining patterns in syntax trees to automate code reviews of student solutions for programming exercises", arXiv preprint arXiv:2405.01579, Ithaca, Cornell University. DOI: https://doi.org/10.48550/arXiv.2405.01579
Guo, X., Zhang, R., Zhou, L., Lu, X. (2022), "Precise code clone detection with architecture of abstract syntax trees", Lecture Notes in Computer Science. DOI: https://doi.org/10.1007/978-3-031-19211-1_10
Kim, Y., Dyer, C., Rush, A. M. (2019), "Compound probabilistic context-free grammars for grammar induction", arXiv preprint arXiv:1906.10225, Ithaca, Cornell University. DOI: https://doi.org/10.48550/arXiv.1906.10225
Li, J., Pang, G., Chen, L., Namazi-Rad, M.-R. (2023), "HRGCN: Heterogeneous graph-level anomaly detection with hierarchical relation-augmented graph neural networks", arXiv preprint arXiv:2308.14340, Ithaca, Cornell University. DOI: https://doi.org/10.48550/arXiv.2308.14340
Nelipa, O., Kalyta, N. (2025), "Machine learning-driven anomaly detection in information system verification and validation", Grail of Science, No. 51, P. 560–568. DOI: https://doi.org/10.36074/grail-of-science.18.04.2025.077
Yang, T., Hu, L., Shi, C., Ji, H., Li, X., Nie, L. (2021), "HGAT: Heterogeneous graph attention networks for semi-supervised short text classification", ACM Transactions on Information Systems, Vol. 39, No. 3, Article 32, New York, Association for Computing Machinery. DOI: https://doi.org/10.1145/3450352
Santos, N., Minatel, D., Valejo, A. D., Lopes, A. (2024), "Semi-supervised coarsening of bipartite graphs for text classification via graph neural network", Proceedings of DSAA 2024, P. 1–10. DOI: https://doi.org/10.1109/DSAA61799.2024.10722822
Feng, Z., Guo, D., Tang, D., Duan, N., Feng, X., Gong, M., Shou, L., Qin, B., Liu, T., Jiang, D., Zhou, M. (2020), "CodeBERT: A pre-trained model for programming and natural languages", arXiv preprint arXiv:2002.08155, Ithaca, Cornell University. DOI: https://doi.org/10.48550/arXiv.2002.08155
Guo, C., Pleiss, G., Sun, Y., Weinberger, K. Q. (2017), "On calibration of modern neural networks", arXiv preprint arXiv:1706.04599, Ithaca, Cornell University. DOI: https://doi.org/10.48550/arXiv.1706.04599
Huang, X., Yang, Y., Wang, Y., Wang, C., Zhang, Z., Xu, J., Chen, L., Vazirgiannis, M. (2022), "DGraph: A large-scale financial dataset for graph anomaly detection", arXiv preprint arXiv:2207.03579. DOI: https://doi.org/10.48550/arXiv.2207.03579
Nelipa, O., Kalyta, N., Ponomarova, S. (2025), "A machine learning approach to regression suite optimization for verification and validation of information systems", Proceedings of the 15th International Conference on Advanced Computer Information Technologies (ACIT), Sibenik, Croatia, P. 719–722. DOI: https://doi.org/10.1109/ACIT65614.2025.11185751
UA
EN 


