ФОРМУВАННЯ ПРОСТОРУ ОЗНАК ДЛЯ РИЗИК-СКОРИНГУ BITCOIN НА ОСНОВІ ЛОКАЛЬНИХ І ТОПОЛОГІЧНИХ МЕТРИК

Владислав Просолов; Геннадій Халімов

doi:10.30837/0135-1710.2026.189.224

Автор(и)

Владислав Просолов Харківський національний університет радіоелектроніки, Україна https://orcid.org/0009-0002-1276-4828
Геннадій Халімов Харківський національний університет радіоелектроніки, Україна https://orcid.org/0000-0002-2054-9186

DOI:

https://doi.org/10.30837/0135-1710.2026.189.224

Ключові слова:

Bitcoin, ончейн-дані, ризик-скоринг, інженерія ознак, топологічні метрики, графові трансформації, виявлення шахрайства

Анотація

Предметом роботи є метод формування простору ознак для ризик-скорингу в мережі Bitcoin, що ґрунтується на поєднанні локальних характеристик вузлів, топологічних метрик їхнього околу, нелінійної нормалізації та графової трансформації ончейн-даних. Мета дослідження – вдосконалення методу формування простору ознак для неструктурованих ончейн-даних мережі Bitcoin способом комплексної агрегації локальних і топологічних властивостей об’єктів транзакційного графа й застосування нелінійної нормалізації, що дає змогу підвищити інформативність даних для задач ризик-скорингу. Завдання: обґрунтувати доцільність графового подання ончейн-даних у задачах ризик-скорингу Bitcoin; сформувати багатовимірний простір ознак на основі локальних мікроознак і глобальних топологічних макроознак; застосувати процедури попереднього оброблення, очищення та нелінійної нормалізації фінансових величин; дослідити роль локальних, структурних, темпоральних і контекстних атрибутів у підвищенні якості відокремлення ризикових об’єктів від легітимних; оцінити ефективність сформованого простору ознак як основи для подальшого використання в алгоритмах ризик-скорингу. Методи дослідження основані на формалізації ончейн-даних у вигляді графа, використанні методів інженерії ознак, графових трансформацій, нелінійної нормалізації, а також на аналізі локальних і топологічних метрик транзакційної мережі Bitcoin. Результати дослідження. Запропоновано комплексний підхід до побудови простору ознак для ризик-скорингу Bitcoin, який передбачає агрегацію 94 локальних мікроознак і 72 глобальних топологічних макроознак, застосування нелінійної нормалізації та графової трансформації даних. Продемонстровано, що такий підхід сприяє зменшенню розрідженості ознакового простору, підвищенню інформативності вхідних даних й кращій роздільній здатності в процесі відокремлення ризикових об’єктів від легітимних. Обґрунтовано, що якісно сформований простір ознак може бути базовим компонентом для подальшої інтеграції графових і часових нейромережевих механізмів у задачах фінансової аналітики. Висновки. Запропонований метод формування простору ознак є практично придатним інструментом для систем моніторингу ризиків у мережі Bitcoin і підтверджує доцільність поєднання локальних і топологічних метрик з метою підвищення стійкості ризик-скорингу до обфускаційних сценаріїв і складних траєкторій руху коштів.

Біографії авторів

Владислав Просолов, Харківський національний університет радіоелектроніки

аспірант кафедри безпеки інформаційних технологій

Геннадій Халімов, Харківський національний університет радіоелектроніки

доктор технічних наук, професор, завідувач кафедри безпеки інформаційних технологій

Посилання

Weber, M., Domeniconi, G., Chen, J., Weidele, D. K. I., Bellei, C., Robinson, T., Leiserson, C. E. (2019), "Anti-Money Laundering in Bitcoin: Experimenting with Graph Convolutional Networks for Financial Forensics", Social and Information Networks. DOI: https://doi.org/10.48550/arXiv.1908.02591

Akcora, C. G., Li, Y., Gel, Y. R., Kantarcioglu, M. (2020), "BitcoinHeist: Topological Data Analysis for Ransomware Prediction on the Bitcoin Blockchain", Proceedings of the Twenty-Ninth International Joint Conference on Artificial Intelligence, pp. 4439–4445. DOI: https://doi.org/10.24963/ijcai.2020/612

Elmougy, Y., Liu, L. (2023), "Demystifying Fraudulent Transactions and Illicit Nodes in the Bitcoin Network for Financial Forensics". DOI: https://doi.org/10.48550/arXiv.2306.06108

Kipf, T. N., Welling, M. (2017), "Semi-Supervised Classification with Graph Convolutional Networks", Proceedings of the International Conference on Learning Representations. DOI: https://doi.org/10.48550/arXiv.1609.02907

Hamilton, W. L., Ying, R., Leskovec, J. (2017), "Inductive Representation Learning on Large Graphs", Advances in Neural Information Processing Systems, Vol. 30. DOI: https://doi.org/10.48550/arXiv.1706.02216

Veličković, P., Cucurull, G., Casanova, A., Romero, A., Liò, P., Bengio, Y. (2018), "Graph Attention Networks", Proceedings of the International Conference on Learning Representations. DOI: https://doi.org/10.48550/arXiv.1710.10903

Brody, S., Alon, U., Yahav, E. (2022), "How Attentive are Graph Attention Networks?", Proceedings of the International Conference on Learning Representations. DOI: https://doi.org/10.48550/arXiv.2105.14491

Chawla, N. V., Bowyer, K. W., Hall, L. O., Kegelmeyer, W. P. (2002), "SMOTE: Synthetic Minority Over-sampling Technique", Journal of Artificial Intelligence Research, Vol. 16, pp. 321–357. DOI: https://doi.org/10.1613/jair.953

Zhao, T., Zhang, X., Wang, S. (2021), "GraphSMOTE: Imbalanced Node Classification on Graphs with Graph Neural Networks", WSDM 2021: Proceedings of the 14th ACM International Conference on Web Search and Data Mining, pp. 833–841. DOI: https://doi.org/10.1145/3437963.3441720

Pareja, A., Domeniconi, G., Chen, J., Ma, T., Suzumura, T., Kanezashi, H., Kaler, T., Schardl, T. B., Leiserson, C. E. (2020), "EvolveGCN: Evolving Graph Convolutional Networks for Dynamic Graphs", Proceedings of the AAAI Conference on Artificial Intelligence, Vol. 34, No. 4, pp. 5363–5370. DOI: https://doi.org/10.1609/aaai.v34i04.5984

Lundberg, S. M., Lee, S.-I. (2017), "A Unified Approach to Interpreting Model Predictions", Advances in Neural Information Processing Systems, Vol. 30, pp. 4765–4774. DOI: https://doi.org/10.48550/arXiv.1705.07874

Bellei, C., Robinson, T., Weber, M., Weidele, D. K. I., Domeniconi, G., Chen, J., Leiserson, C. E. (2024), "The Shape of Money Laundering: Subgraph Representation Learning on the Blockchain with the Elliptic2 Dataset", arXiv preprint arXiv:2404.19109. DOI: https://doi.org/10.48550/arXiv.2404.19109

Elliptic Data Set. URL: https://www.kaggle.com/datasets/ellipticco/elliptic-data-set

Taherdoost, H. (2023), "Blockchain and Machine Learning: A Critical Review on Security", Information, Vol. 14, No. 5. DOI: https://doi.org/10.3390/info14050295

Fedorchenko, V., Yeroshenko, O., Shmatko, O., Kolomiitsev, O., Omarov, M. (2024), "Password hashing methods and algorithms on the .Net platform", Advanced Information Systems, Vol. 8, No. 4, pp. 82–92. DOI: https://doi.org/10.20998/2522-9052.2024.4.11

Shaizat, M., Mussiraliyeva, S. (2025), "Enhanced identification of illicit bitcoin transactions through genetic algorithm-based feature selection", Eastern-European Journal of Enterprise Technologies, Vol. 4, 9 (136), pp. 34–42. DOI: https://doi.org/10.15587/1729-4061.2025.335630