“洗钱”黑洞里的“侦探”：我用图神经网络抓坏人的那些事

Created2025-09-05|Updated2025-09-05|风控与合规学习笔记

|Post Views:

哈喽大家好，我是小叶。

今天想跟大家聊聊反洗钱（AML）。如果你在银行工作，你一定知道那套“基于规则”的系统有多头疼。比如：某人一天转账超过 5 万，系统就会报警。

但现在的犯罪分子可不是吃素的。他们会把一笔巨款拆成几千个小额账户，在深夜通过几十个国家的服务器疯狂流转。传统的系统在这些“蚂蚁搬家”面前，简直就像是纸糊的。

作为一个爱好开发的小程序媛，我去年参与了一个基于 图神经网络（GNN） 的 AML 项目。今天想聊聊我的实战心得。

1. 为什么“图”比“表”更适合抓坏人？

传统的数据库是“表格”式的。每个人都是一行数据。但洗钱的本质是连接。

账户 A 转给账户 B。
账户 B 马上分拆转给账户 C、D、E。
C、D、E 又通过几层转账汇集到账户 Z。

在 GNN 的眼里，每个账户是一个“节点”，每笔交易是一条“边”。这就不再是孤立的数据点，而是一个活生生的交易网。

我的反思：
传统的逻辑是“看人”，而 GNN 的逻辑是“看邻居”。如果你的账户本身很干净，但你的邻居全是一堆刚开户就大额转账的异常节点，那你大概率就是“网”里的一环。这种**消息传递（Message Passing）**机制，让坏人无处遁形。

2. 🛠️ 实战避坑：别让“正常人”被误伤

在做模型训练时，我遇到一个巨大的挑战：正负样本极度不平衡。
在千万级的交易里，真正的洗钱可能只有几十笔。如果你直接训练，模型会偷懒——它会预测所有人都是好人，这样准确率也有 99.99%。

我的改进笔记：

采样策略：不能简单地随机采样。我采用了 SMOTE 算法和异构图采样（Heterogeneous Graph Sampling），重点关注那些“高出度、高入度”的节点。
特征工程：别只看金额。我加入了一些非常有意思的特征，比如“转账的时间熵（Time Entropy）”。洗钱往往是有规律的节奏，而普通人转账是随机的。
解释性：最难的一点是，合规人员不相信黑盒。如果模型说某人是坏人，你必须告诉他：因为这个人的二阶邻居里有 5 个黑名单用户，且他在 1 小时内发起了 100 次小额转账。

3. 给同行的一点真心话

GNN 确实很强，但它也有软肋——动态性。
洗钱网络是瞬间爆发、瞬间消失的。如果你的图是静态的，等你训练完，坏人早就跑了。

我现在正在研究 时序图神经网络（Temporal GNN）。它能捕捉节点和边随时间的变化。比如：某个账户平时一个月才转账一次，突然在凌晨 2 点发起了 500 次连接。这种“时间+空间”的双重打击，才是反洗钱的终极武器。

4. 碎碎念

其实，做风控就像是猫捉老鼠。坏人在进化，我们也必须进化。
我一直觉得，计算机技术在金融领域最大的温情，就是守护普通人的财产安全，让那些黑产无利可图。

最近我在看一些关于“社区发现（Community Detection）”的论文，感觉这在识别团伙作案上简直是神器。等我有空写个 demo 给大家看。

合规提醒：本文内容仅为技术交流。反洗钱工作需严格遵守中国人民银行及相关监管机构的法律法规。

Author: xtbb

Link: http://bin-hy.github.io/gnn-aml-rethinking/

Copyright Notice: All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.

深度学习 GNN 反洗钱思考社交网络

Related Articles

当 Transformer 遇上波动率预测：它真的比 LSTM 强吗？

哈喽大家好，我是小叶。最近在整理一份关于“高频波动率预测”的笔记。如果你关注深度学习在金融领域的应用，一定听过 Transformer。现在的 NLP 和 CV 全是 Transformer 的天下，所以很多小伙伴自然而然地觉得：既然它在翻译和图像上无往不利，那在预测股价波动率上，也应该是“降维打击”吧？但我现在的思考是：在金融这种低信噪比、非平稳的时间序列里，Transformer 真的比 LSTM 这种“老将”强吗？ 1. 那些被“注意力”带跑的噪声Transformer 的核心是 Self-Attention（自注意力机制）。它能捕捉长程依赖（Long-range dependency）。比如：一年前的某次美联储加息，可能对今天的市场情绪依然有影响。听起来很完美，对吧？但别忘了，金融数据的长程依赖极其微弱，而短程的噪声却极其强烈。我的反思：我之前做过一个实验，用 Transformer 预测 1 分钟级的实现波动率（Realized Volatility）。结果发现，模型在训练集上表现得像神一样，但在测试集上直接“翻车”。原因很简单：Attention 太敏感了。...

“股吧”千万条，风险第一条：我从散户情绪里挖出的反转信号

哈喽大家好，我是小叶。今天想跟大家聊聊“另类数据（Alternative Data）”。如果你在量化团队待过，你一定知道现在因子的内卷程度。传统的价量因子、财务因子，早就被大家挖烂了。于是，大家开始把目光投向了一些奇奇怪怪的地方：卫星遥感、港口流量、信用卡消费记录，还有——社交媒体情绪。作为一个上财在读的小程序媛，我去年给自己撸了一个“股吧爬虫+情绪分析仪”。今天想聊聊我在这些散户情绪里看到的真相。 1. 为什么“股吧”的情绪是反转信号？很多人觉得，股吧里全是噪声。大家在里面吵架、谩骂、吹捧。但如果你用 NLP 模型（比如我微调过的 FinBERT）去批量处理这些文字，你会发现一个非常有意思的现象：极致的情绪，往往是市场的拐点。我的反思：当一个股票的股吧里全是“涨停”、“起飞”、“YYDS”的时候，往往就是散户情绪最高亢、筹码最集中的时刻。这时候，聪明钱已经在悄悄撤退了。相反，当股吧里全是“退市”、“垃圾”、“再也不碰”的时候，绝望的情绪反而孕育着底部的反弹。这就是典型的 “逆向投资逻辑”。我用 Python 写了一个简单的策略：当情绪得分（Sentiment Scor...

当 AI 模型在金融市场里“翻车”：我为什么开始死磕 MLOps？

哈喽大家好，我是小叶。今天想跟大家聊聊一个可能有点“枯燥”但绝对“保命”的话题：MLOps（机器学习运维）。作为一个上财在读的小程序媛，我以前觉得：做 AI 不就是写写代码、调调参、刷刷 AUC 吗？直到我去年参与了一个实盘量化项目的上线。那是我的第一个模型。线下回测年化 30%，各种指标美如画。上线第一周，它就开始疯狂亏钱。导师把我叫进办公室，没看我的模型代码，只问了一个问题：“你有没有做模型监控？” 1. 那些被“静态思维”杀死的 AI 模型在学校里，我们拿到的数据集是静态的。但在金融市场，数据是流动的，甚至是诡异的。概念漂移（Concept Drift）：比如你的模型是基于牛市训练的，突然遇上大熊市，你的特征分布全变了。训练-预测不一致（Training-Serving Skew）：线下回测用的是收盘价，线上实盘用的是成交价。这万分之一的差别，就足以让你的策略失效。我的反思：金融 AI 最大的挑战不是“怎么训练”，而是“怎么活着”。如果你没有一套自动化、标准化的流程去管理模型的生命周期，那你训练出的每一个模型，都是在给未来埋雷。 2. 🛠️ 实战中的“三板...

在金融圈里“撸码”：我的 Pandas、Linux 和 Git 保命工具箱

哈喽大家好，我是小叶。今天想跟大家聊聊点“接地气”的东西。如果你是一个在上财在读、又想进金融圈撸码的小程序媛（或者小哥哥），你一定听过很多高大上的算法：Transformer、强化学习、GNN…… 但作为一个在量化团队实习过、也踩过无数坑的人，我想说：在金融实战里，能救命的往往不是大算法，而是你的“基本功”。如果你连 Pandas 里的时间序列索引都搞不清楚，或者 Linux 服务器崩了你只会重启，那你的“大模型”也只能是空中楼阁。今天想分享我的三个“保命工具箱”。 1. Pandas：不仅是表格，更是“时间机器”在金融领域，最核心的数据是 Time Series（时间序列）。坑 1：Look-ahead Bias（未来函数）。如果你在计算技术指标时，不小心用到了当天的收盘价来预测当天的涨跌，那你的回测曲线会美得让你怀疑人生。坑 2：Reindexing（重索引）。停牌的股票、节假日的行情，这些坑在数据对齐时会让你抓狂。我的实战笔记：我现在的保命代码里，一定会加上这一行： 12# 强制按交易日历重新索引，填充空值df = df.reindex(trading_cal...

债市里的“长情”与“善变”：久期、凸性与我的三次踏空

哈喽大家好，我是小叶。今天在备考金融风险管理（FRM），正好复习到固定收益（Fixed Income）这一块。作为上财在读、又爱撸码的小程序媛，我一直觉得：债券这种“还本付息”的东西，不就是算算现金流吗？有什么难的？直到我去年在模拟盘里，因为没看懂久期（Duration），直接遭遇了三次连续的“踏空”。今天想聊聊我对债市里这些核心指标的“血泪教训”。 1. 久期：它不仅仅是“时间”课本上说，马考利久期是现金流加权的平均回收期。但我现在的理解是：久期是债券对利率变化的敏感度。如果你手里拿着一只久期为 10 年的债券，当利率上升 1% 时，你的债券价格会跌大约 10%。我的教训：我当时觉得利率已经到底了，应该买点长债（Long-term bonds）博反弹。结果美联储加息预期一出，长债的价格跌得比股票还凶。我才意识到：久期是一把双刃剑。在牛市里，长久期是杠杆；在熊市里，长久期是噩梦。如果你不看久期，你就根本不知道自己承担了多大的利率风险。 2. 凸性（Convexity）：债券的“温柔保护”如果说久期是直线，那凸性就是曲线。当利率下降时，债券价格上涨的速度，比久期预测的要快...

“炼金”还是“炼心”？当我在量化里用强化学习跑赢基准的那一刻

哈喽大家好，我是小叶。今天想跟大家聊点硬核的，但也想说点大实话。如果你最近关注量化投资，肯定被“深度强化学习（DRL）”刷屏了。什么 FinRL、DQN 选股，听起来就像是拿到了打开财富之门的金钥匙。我去年也迷上了这个。作为一个上财在读、又爱撸码的小程序媛，我当时觉得：既然 AlphaGo 能下赢围棋，那我喂给它全市场的 K 线和因子，它不就能帮我实现财务自由了吗？ 1. 那些被“神化”的 DRL 曲线当时我照着一篇顶会论文复现了一个基于 PPO（Proximal Policy Optimization）的资产组合优化策略。在不考虑手续费和滑点的“理想国”里，那条净值曲线简直美得不像话，年化收益 40%+，夏普比率 3.0。我当时兴奋得差点就在校友群里发红包了。但当我冷静下来，把万分之三的滑点和千分之一的印花税加进去后，曲线瞬间塌方。我的反思：很多 DRL 在量化上的“成功”，其实是拟合了噪声，或者是通过高频换仓在赚那些根本拿不到的虚假利润。强化学习最大的敌人不是模型，而是真实交易里的摩擦成本。 2. 状态空间（State Space）的真相：你喂的是信息还是垃圾？写代...

Comments

ArtalkGiscus

Loading Database