МІЖВИБІРКОВА УЗАГАЛЬНЕНІСТЬ ДЛЯ ВИЯВЛЕННЯ ФЕЙКОВИХ НОВИН ІЗ ВИКОРИСТАННЯМ КОНТРАСТИВНОГО АДАПТАЦІЙНОГО НАВЧАННЯ

Сергій Даценко; Георгій Кучук

doi:10.30837/0135-1710.2026.189.153

Автор(и)

Сергій Даценко Національний технічний університет "Харківський політехнічний інститут", Україна https://orcid.org/0000-0001-9514-0433
Георгій Кучук Національний технічний університет "Харківський політехнічний інститут", Україна http://orcid.org/0000-0002-2862-438X

DOI:

https://doi.org/10.30837/0135-1710.2026.189.153

Ключові слова:

виявлення фейкових новин, міжвибіркова узагальненість, трансформерна мовна модель, трансферне навчання, оброблення природної мови

Анотація

Потреби сучасного промислового бізнесу дедалі частіше стикаються з викликами, пов’язаними з поширенням фейкових новин, які можуть суттєво впливати на репутацію, довіру клієнтів і фінансові показники промислових компаній. Наявні системи виявлення демонструють майже ідеальну точність на окремих еталонних наборах даних, проте зазнають катастрофічної невдачі за умови застосування до інформації з різних джерел, що викликає серйозні сумніви щодо готовності до впровадження в реальних умовах. Предмет дослідження – методи виявлення фейкових новин у структурно різноманітних наборах даних. Метою є розроблення й валідація підходу до виявлення фейкових новин у наборах даних зі структурно різноманітним вмістом із використанням контрастивного адаптаційного навчання, що дасть змогу створити єдину модель на основі трансформера. Завдання дослідження: встановлення базових показників для окремих наборів даних за допомогою мовної моделі DeBERTa-v3-base на трьох різних наборах даних фейкових новин; побудова систематичної матриці перенесення між наборами даних для кількісного оцінювання невдач узагальнення; надання пропозиції та оцінювання контрастивного об’єднаного адаптаційного навчання як підходу адаптації до домену; дослідження з абляцією контрастивних гіперпараметрів. Метод дослідження. Мовна модель DeBERTa-v3-base налаштовується на трьох наборах даних фейкових новин ISOT, LIAR та WELFake. Комбінована навчальна задача інтегрує класифікацію за крос-ентропією з контрольованою контрастивною втратою по об’єднаних наборах даних з використанням збалансованого вибіркового відбору з різних наборів даних. Результати. Матриця перенесення між наборами даних свідчить про катастрофічну невдачу узагальнення: модель, яка досягає 100% F1 на ISOT, демонструє лише 23,9% на WELFake та 40,3% на LIAR. Запропонована контрастивна об’єднана модель створює єдину модель, яка одночасно досягає 97,5% F1 на ISOT, 57,4% на LIAR і 98,4% на WELFake з абсолютним покращенням F1 до 97,9% порівняно з базовими переносами. Висновки. Абляційний аналіз підтверджує, що контрастивна задача має особливу користь у складніших доменах. Контрастне об’єднане адаптаційне навчання створює моделі, придатні для розгортання в середовищах новин із декількома джерелами.

Біографії авторів

Сергій Даценко, Національний технічний університет "Харківський політехнічний інститут"

аспірант кафедри комп’ютерної інженерії та програмування

Георгій Кучук, Національний технічний університет "Харківський політехнічний інститут"

доктор технічних наук, професор, професор кафедри комп’ютерної інженерії та програмування

Посилання

Herasymov, S., Tkachov, A., Bazarnyi, S. (2024), "Complex method of determining the location of social network agents in the interests of information operations", Advanced Information Systems, Vol. 8, No. 1, pp. 31–36. DOI: https://doi.org/10.20998/2522-9052.2024.1.04

Podorozhniak, A., Liubchenko, N., Oliinyk, V., Roh, V. (2023), "Research application of the spam filtering and spammer detection algorithms on social media and messengers", Advanced Information Systems, Vol. 7, No. 3, pp. 60–66. DOI: https://doi.org/10.20998/2522-9052.2023.3.09

Allcott, H., Gentzkow, M. (2017), "Social media and fake news in the 2016 election", Journal of Economic Perspectives, Vol. 31, No. 2, pp. 211–236. DOI: https://doi.org/10.1257/jep.31.2.211

Bakir, V., McStay, A. (2018), "Fake News and The Economy of Emotions", Digital Journalism, Vol. 6, No. 2, pp. 154–175. DOI: https://doi.org/10.1080/21670811.2017.1345645

Datsenko, S. (2025), "Comparative Study of Machine Learning Approaches for Fake News Detection on Social Platforms", 2025 IEEE 6th KhPI Week on Advanced Technology (KhPIWeek), pp. 1–5. DOI: https://doi.org/10.1109/KhPIWeek61436.2025.11288402

Christodoulou, C., Salamanos, N., Leonidou, P., Papadakis, M., Sirivianos, M. (2023), "Identifying misinformation on YouTube through transcript contextual analysis with Transformer models", arXiv preprint, arXiv: 2307.12155. DOI: https://doi.org/10.48550/arXiv.2307.12155

Datsenko, S. (2025), "Neural architecture comparison for fact verification on FEVER dataset", Control, Navigation and Communication Systems, Vol. 3, No. 81m pp. 72-75. DOI: https://doi.org/10.26906/SUNZ.2025.3.072

Shen, Y., Liu, Q., Guo, N., Yuan, J., Yang, Y. (2023), "Fake news detection on social networks: A survey", Applied Sciences, Vol. 13, No. 21, article 11877. DOI: https://doi.org/10.3390/app132111877

Capuano, N., Fenza, G., Loia, V., Nota, F. D. (2023), "Content-Based Fake News Detection With Machine and Deep Learning: a Systematic Review", Neurocomputing, Vol. 530, pp. 91–103. DOI: https://doi.org/10.1016/j.neucom.2023.02.005

Nickerson, R. S. (1998), "Confirmation Bias: A Ubiquitous Phenomenon in Many Guises", Review of General Psychology, Vol. 2, No. 2, pp. 175-220. DOI: https://doi.org/10.1037/1089-2680.2.2.175.

Ozbay, F. A., Alatas, B. (2020), "Fake news detection within online social media using supervised artificial intelligence algorithms", Physica A: Statistical Mechanics and Its Applications, Vol. 540, article 123174. DOI: https://doi.org/10.1016/j.physa.2019.123174

Abualigah, L., Al-Ajlouni, Y. Y., Daoud, M. S., Altalhi, M., Migdady, H. (2024), "Fake news detection using recurrent neural network based on bidirectional LSTM and GloVe", Social Network Analysis and Mining, Vol. 14, article 40. DOI: https://doi.org/10.1007/s13278-024-01198-w

Sastrawan, I. K., Bayupati, I. P. A., Arsa, D. M. S. (2021), "Detection of fake news using deep learning CNN-RNN based methods", ICT Express, Vol. 8, pp. 396–408. DOI: https://doi.org/10.1016/j.icte.2021.10.003

Nasir, J. A., Khan, O. S., Varlamis, I. (2021), "Fake news detection: A hybrid CNN-RNN based deep learning approach", International Journal of Information Management Data Insights, Vol. 1, No. 1, article 100007. DOI: https://doi.org/10.1016/j.jjimei.2020.100007

Devlin, J., Chang, M.-W., Lee, K., Toutanova, K. (2019), "BERT: Pre-training of deep bidirectional transformers for language understanding", Proceedings of NAACL-HLT, pp. 4171–4186. DOI: https://doi.org/10.18653/v1/N19-1423

Liu, Y., Ott, M., Goyal, N. et al. (2019), "RoBERTa: A Robustly Optimized BERT Pretraining Approach", arXiv preprint, arXiv: 1907.11692. DOI: https://doi.org/10.48550/arXiv.1907.11692

He, P., Gao, J., Chen, W. (2023), "DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-Disentangled Embedding Sharing", Proceedings of ICLR. DOI: https://doi.org/10.48550/arXiv.2111.09543

Hoy, N., Koulouri T. (2022), "Exploring the Generalisability of Fake News Detection Models", Proceedings of IEEE International Conference on Big Data, pp. 5731–5740. DOI: https://doi.org/10.1109/BigData55660.2022.10020583

Gruensteidl, M. N., Kirrane, S. (2026), "A Comparison and Critical Reflection of Information Disorder Detection Techniques: Performing a Cross-Data and Cross-Model Evaluation", Information Fusion, Vol. 127, Part B, article 103806. DOI: https://doi.org/10.1016/j.inffus.2025.103806

Chen, T., Kornblith, S., Norouzi, M., Hinton, G. (2020), "A Simple Framework for Contrastive Learning of Visual Representations", Proceedings of ICML. DOI: https://doi.org/10.48550/arXiv.2002.05709

Khosla, P., Teterwak, P., Wang, C. et al. (2020), "Supervised Contrastive Learning", Proceedings of NeurIPS, Vol. 33, pp. 18661–18673. DOI: https://doi.org/10.48550/arXiv.2004.11362

Gao, T., Yao, X., Chen, D. (2021), "SimCSE: Simple Contrastive Learning of Sentence Embeddings", Proceedings of EMNLP, pp. 6894–6910. DOI: https://doi.org/10.18653/v1/2021.emnlp-main.552

Gunel, S., Du, J., Conneau, A., Stoyanov, V. (2021), "Supervised Contrastive Learning for Pre-trained Language Model Fine-tuning", Proceedings of ICLR. DOI: https://doi.org/10.48550/arXiv.2011.01403

Bhattacharjee, A., Kumarage, T., Moraffah, R., Liu H. (2023), "ConDA: Contrastive Domain Adaptation for AI-generated Text Detection", Proceedings of IJCNLP-AACL, pp. 598–610. DOI: https://doi.org/10.18653/v1/2023.ijcnlp-main.40

Yan, F., Zhang, M., Wei, B., Ren, K., Jiang, W. (2024), "SARD: Fake news detection based on CLIP contrastive learning and multimodal semantic alignment", Journal of King Saud University – Computer and Information Sciences, Vol. 36, article 102160. DOI: https://doi.org/10.1016/j.jksuci.2024.102160

Shen, X., Huang, M., Hu, Z., Cai, S., Zhou, T. (2024), "Multimodal Fake News Detection with Contrastive Learning and Optimal Transport", Frontiers in Computer Science, Vol. 6, article 1473457. DOI: https://doi.org/10.3389/fcomp.2024.1473457

ISOT Research Lab (2024), "ISOT Fake News Dataset", University of Victoria, available at: https://onlineacademiccommunity.uvic.ca/isot/2022/11/27/fake-news-detection-datasets/ (last accessed 20.04.2026).

Wang, W. Y. (2017), "‘Liar, Liar Pants on Fire’: A New Benchmark Dataset for Fake News Detection", Proceedings of ACL, pp. 422–426. DOI: https://doi.org/10.18653/v1/P17-2067

Verma, P. K., Agrawal, P., Amorim, I., Prodan, R. (2021), "WELFake: Word Embedding Over Linguistic Features for Fake News Detection", IEEE Transactions on Computational Social Systems, Vol. 8, No. 4, pp. 881–893. DOI: https://doi.org/10.1109/TCSS.2021.3068519