ФОРМУВАННЯ ПРОСТОРУ ОЗНАК ДЛЯ РИЗИК-СКОРИНГУ BITCOIN НА ОСНОВІ ЛОКАЛЬНИХ І ТОПОЛОГІЧНИХ МЕТРИК
DOI:
https://doi.org/10.30837/0135-1710.2026.189.224Ключові слова:
Bitcoin, ончейн-дані, ризик-скоринг, інженерія ознак, топологічні метрики, графові трансформації, виявлення шахрайстваАнотація
Предметом роботи є метод формування простору ознак для ризик-скорингу в мережі Bitcoin, що ґрунтується на поєднанні локальних характеристик вузлів, топологічних метрик їхнього околу, нелінійної нормалізації та графової трансформації ончейн-даних. Мета дослідження – вдосконалення методу формування простору ознак для неструктурованих ончейн-даних мережі Bitcoin способом комплексної агрегації локальних і топологічних властивостей об’єктів транзакційного графа й застосування нелінійної нормалізації, що дає змогу підвищити інформативність даних для задач ризик-скорингу. Завдання: обґрунтувати доцільність графового подання ончейн-даних у задачах ризик-скорингу Bitcoin; сформувати багатовимірний простір ознак на основі локальних мікроознак і глобальних топологічних макроознак; застосувати процедури попереднього оброблення, очищення та нелінійної нормалізації фінансових величин; дослідити роль локальних, структурних, темпоральних і контекстних атрибутів у підвищенні якості відокремлення ризикових об’єктів від легітимних; оцінити ефективність сформованого простору ознак як основи для подальшого використання в алгоритмах ризик-скорингу. Методи дослідження основані на формалізації ончейн-даних у вигляді графа, використанні методів інженерії ознак, графових трансформацій, нелінійної нормалізації, а також на аналізі локальних і топологічних метрик транзакційної мережі Bitcoin. Результати дослідження. Запропоновано комплексний підхід до побудови простору ознак для ризик-скорингу Bitcoin, який передбачає агрегацію 94 локальних мікроознак і 72 глобальних топологічних макроознак, застосування нелінійної нормалізації та графової трансформації даних. Продемонстровано, що такий підхід сприяє зменшенню розрідженості ознакового простору, підвищенню інформативності вхідних даних й кращій роздільній здатності в процесі відокремлення ризикових об’єктів від легітимних. Обґрунтовано, що якісно сформований простір ознак може бути базовим компонентом для подальшої інтеграції графових і часових нейромережевих механізмів у задачах фінансової аналітики. Висновки. Запропонований метод формування простору ознак є практично придатним інструментом для систем моніторингу ризиків у мережі Bitcoin і підтверджує доцільність поєднання локальних і топологічних метрик з метою підвищення стійкості ризик-скорингу до обфускаційних сценаріїв і складних траєкторій руху коштів.
Посилання
Weber, M., Domeniconi, G., Chen, J., Weidele, D. K. I., Bellei, C., Robinson, T., Leiserson, C. E. (2019), "Anti-Money Laundering in Bitcoin: Experimenting with Graph Convolutional Networks for Financial Forensics", Social and Information Networks. DOI: https://doi.org/10.48550/arXiv.1908.02591
Akcora, C. G., Li, Y., Gel, Y. R., Kantarcioglu, M. (2020), "BitcoinHeist: Topological Data Analysis for Ransomware Prediction on the Bitcoin Blockchain", Proceedings of the Twenty-Ninth International Joint Conference on Artificial Intelligence, pp. 4439–4445. DOI: https://doi.org/10.24963/ijcai.2020/612
Elmougy, Y., Liu, L. (2023), "Demystifying Fraudulent Transactions and Illicit Nodes in the Bitcoin Network for Financial Forensics". DOI: https://doi.org/10.48550/arXiv.2306.06108
Kipf, T. N., Welling, M. (2017), "Semi-Supervised Classification with Graph Convolutional Networks", Proceedings of the International Conference on Learning Representations. DOI: https://doi.org/10.48550/arXiv.1609.02907
Hamilton, W. L., Ying, R., Leskovec, J. (2017), "Inductive Representation Learning on Large Graphs", Advances in Neural Information Processing Systems, Vol. 30. DOI: https://doi.org/10.48550/arXiv.1706.02216
Veličković, P., Cucurull, G., Casanova, A., Romero, A., Liò, P., Bengio, Y. (2018), "Graph Attention Networks", Proceedings of the International Conference on Learning Representations. DOI: https://doi.org/10.48550/arXiv.1710.10903
Brody, S., Alon, U., Yahav, E. (2022), "How Attentive are Graph Attention Networks?", Proceedings of the International Conference on Learning Representations. DOI: https://doi.org/10.48550/arXiv.2105.14491
Chawla, N. V., Bowyer, K. W., Hall, L. O., Kegelmeyer, W. P. (2002), "SMOTE: Synthetic Minority Over-sampling Technique", Journal of Artificial Intelligence Research, Vol. 16, pp. 321–357. DOI: https://doi.org/10.1613/jair.953
Zhao, T., Zhang, X., Wang, S. (2021), "GraphSMOTE: Imbalanced Node Classification on Graphs with Graph Neural Networks", WSDM 2021: Proceedings of the 14th ACM International Conference on Web Search and Data Mining, pp. 833–841. DOI: https://doi.org/10.1145/3437963.3441720
Pareja, A., Domeniconi, G., Chen, J., Ma, T., Suzumura, T., Kanezashi, H., Kaler, T., Schardl, T. B., Leiserson, C. E. (2020), "EvolveGCN: Evolving Graph Convolutional Networks for Dynamic Graphs", Proceedings of the AAAI Conference on Artificial Intelligence, Vol. 34, No. 4, pp. 5363–5370. DOI: https://doi.org/10.1609/aaai.v34i04.5984
Lundberg, S. M., Lee, S.-I. (2017), "A Unified Approach to Interpreting Model Predictions", Advances in Neural Information Processing Systems, Vol. 30, pp. 4765–4774. DOI: https://doi.org/10.48550/arXiv.1705.07874
Bellei, C., Robinson, T., Weber, M., Weidele, D. K. I., Domeniconi, G., Chen, J., Leiserson, C. E. (2024), "The Shape of Money Laundering: Subgraph Representation Learning on the Blockchain with the Elliptic2 Dataset", arXiv preprint arXiv:2404.19109. DOI: https://doi.org/10.48550/arXiv.2404.19109
Elliptic Data Set. URL: https://www.kaggle.com/datasets/ellipticco/elliptic-data-set
Taherdoost, H. (2023), "Blockchain and Machine Learning: A Critical Review on Security", Information, Vol. 14, No. 5. DOI: https://doi.org/10.3390/info14050295
Fedorchenko, V., Yeroshenko, O., Shmatko, O., Kolomiitsev, O., Omarov, M. (2024), "Password hashing methods and algorithms on the .Net platform", Advanced Information Systems, Vol. 8, No. 4, pp. 82–92. DOI: https://doi.org/10.20998/2522-9052.2024.4.11
Shaizat, M., Mussiraliyeva, S. (2025), "Enhanced identification of illicit bitcoin transactions through genetic algorithm-based feature selection", Eastern-European Journal of Enterprise Technologies, Vol. 4, 9 (136), pp. 34–42. DOI: https://doi.org/10.15587/1729-4061.2025.335630
UA
EN 


