加密货币世界通常被形容为金融界的“狂野西部”。它的特点是极端波动、全天候的新闻周期,以及被称为“链上数据”的独特透明层。对于研究人员和交易员来说,圣杯一直是如何预测这些市场走势。
近年来,像 GPT-4 这样的大型语言模型 (LLM) 彻底改变了我们需要处理信息的方式。我们已经看到它们编写代码、通过律师资格考试以及分析股市情绪。然而,将 LLM 应用于加密货币交易面临着一系列特定的挑战。与依靠季度报告和标准新闻周期驱动价格的股票市场不同,加密货币受技术指标、社交媒体炒作和区块链网络活动混乱组合的驱动。
在这篇文章中,我们将深入探讨 CryptoTrade , 这是一篇来自新加坡国立大学的研究论文。研究人员提出了一个引人入胜的框架,不仅仅是要求 AI 预测一个价格数字。相反,他们建立了一个 LLM 基础上的智能体团队,像数字对冲基金一样运作——分析新闻、解读区块链、做出决策,并且至关重要的是,反思自己的错误以随时间改进。
传统预测的问题
在我们拆解 CryptoTrade 架构之前,我们需要了解为什么这是一个难以解决的问题。
传统上,金融预测依赖于 时间序列预测 (Time-Series Forecasting) 。 像 LSTM (长短期记忆网络) 或基于 Transformer 的架构 (如 Informer 或 PatchTST) 通过查看一系列历史数字 (价格) 来预测下一个数字。
虽然这对稳定资产相当有效,但在加密领域却往往失效,因为它忽略了 上下文 。 如果比特币在一小时内下跌 10%,时间序列模型只看到数字在下降。它不知道 SEC 刚刚发布了一项新法规,或者以太坊网络正处于拥堵状态。
此外,大多数现有的 LLM 金融智能体都专注于股票市场。它们阅读财经新闻并查看价格历史。但它们错过了加密货币独有的数据源: 链上数据 。 在加密货币中,每一笔交易、每一次钱包变动和每一笔 Gas 费都是公开的。忽略这一点就像试图在不看晴雨表的情况下预报天气。
CryptoTrade 登场: 一种整体方法
这篇论文的核心贡献是一个结合了三大信息支柱的框架:
- 市场数据: 历史价格和成交量 (标准数据) 。
- 链下数据: 新闻、社会情绪和监管更新。
- 链上数据: 交易统计、Gas 费和活跃钱包数量。
研究人员并没有仅仅将这些数据输入到一个单一的提示词中。他们构建了一个涉及多个专业智能体的工作流。

如 图 1 所示,该系统在一个循环中运行。数据被收集和处理,传递给分析师智能体,由交易智能体综合,最后由反思智能体审查以提高未来表现。
让我们分解一下这个操作的“大脑”。
1. 数据基础
该系统依赖于丰富的数据饮食。对于市场数据,它提取主要币种如比特币 (BTC) 、以太坊 (ETH) 和 Solana (SOL) 的每日价格、成交量和市值。
对于 链上数据 , 研究人员从区块链数据库 (如 Dune) 中提取细粒度指标。这些包括:
- 交易数量和活跃钱包: 网络采用率的指标。
- 总传输价值: 实际上有多少资金在流动?
- Gas 价格: 例如,以太坊上的高 Gas 费表明网络拥堵和高需求。
对于 链下数据 , 系统聚合了来自 Bloomberg 和 Yahoo Finance 等主要财经媒体以及特定加密货币来源的新闻。
2. 专家智能体
CryptoTrade 的“魔力”在于其角色扮演能力。LLM 被指示采用特定的角色来分析市场的不同方面。
市场分析师智能体 (The Market Analyst Agent)
这个智能体充当“技术分析师”。它不关心新闻;它只关心数字。它计算技术指标,如移动平均线 (MA) 、MACD (指数平滑异同移动平均线) 和布林带 (Bollinger Bands) 。
如下面的 图 4 所示,该智能体获取原始数据——交易计数、Gas 价格和技术信号——并综合出一份关于市场方向的报告。它在关注价格行为的同时,也关注区块链网络的“健康状况”。

新闻分析师智能体 (The News Analyst Agent)
当市场分析师看图表时,新闻分析师在阅读标题。它的工作是评估“社会炒作”和情绪。
在 图 5 中,你可以看到这个智能体是如何运作的。它摄取标题——例如以太坊变得通缩或质押协议激增——并解读这对价格意味着什么。它过滤掉噪音,总结链下事件的潜在影响。

3. 决策者: 交易智能体 (The Trading Agent)
一旦市场分析师和新闻分析师提交了报告, 交易智能体 就会介入。这个智能体充当投资组合经理。它有权访问当前的现金余额和资产持有情况。
交易智能体必须综合来自分析师的 (有时是相互冲突的) 报告。例如,技术面可能因为价格过高而说“卖出”,但新闻面可能因为主要的 ETF 刚刚获得批准而说“买入”。
智能体输出一个决定: 买入、卖出或持有 , 并附带理由。它还决定头寸的 规模 (例如,“使用 50% 的可用现金买入”) 。

4. 秘密武器: 反思智能体 (The Reflection Agent)
这可以说是 CryptoTrade 框架中最具创新性的部分。在标准的自动交易机器人中,如果机器人亏钱了,它会一直犯同样的错误,直到人类修改代码。
CryptoTrade 利用了一种 反思机制 。 反思智能体查看 前一周 做出的决定。它将交易智能体的推理与实际市场结果进行比较。
- 我们买了吗?是的。
- 价格涨了吗?不,它崩盘了。
- 为什么? 也许我们忽略了一个看跌的新闻信号,或者我们在一个失败的技术突破上过于激进。
反思智能体生成“反馈”,这些反馈被输入到 第二天 的提示词中。这使得系统能够进行“上下文学习 (in-context learning) ”,有效地优化其策略,而无需重新训练或在新数据上微调。

实验与表现
研究人员使用 2023 年的历史数据对 CryptoTrade 进行了测试,涵盖比特币 (BTC) 、以太坊 (ETH) 和 Solana (SOL) 。至关重要的是,他们在三种不同的市场条件下进行了测试:
- 牛市: 价格普遍上涨。
- 熊市: 价格普遍下跌。
- 震荡市 (Sideways Market) : 价格波动但没有明显趋势。
他们将 CryptoTrade (由 GPT-4 和 GPT-4o 驱动) 与两类基线进行了比较:
- 传统策略: 买入持有 (Buy and Hold) 、MACD、移动平均线。
- 深度学习时间序列模型: LSTM、Informer、AutoFormer、PatchTST。
结果
结果具有启发性。第一个主要结论是 基于 LLM 的智能体显著优于深度学习时间序列模型。
时间序列模型 (如 Informer 和 PatchTST) 在加密货币的不稳定性质面前表现挣扎,因为它们纯粹将其视为数字序列预测任务。它们缺乏对市场 为什么 变动的语义理解。
然而,与传统交易信号 (如买入持有或 MACD) 相比,结果好坏参半但前景看好。

如 表 2 (关注比特币) 所示,CryptoTrade (GPT-4o) 在牛市中取得了 28.47% 的回报率 , 具有竞争力。更重要的是,在 震荡市——由于没有明显趋势而出了名地难以交易——CryptoTrade 设法比几乎所有时间序列基线都能更好地减少损失。
驾驭波动: 以太坊示例
为了直观展示智能体的行为,请看 图 2 中的以太坊交易图表。

蓝线代表智能体的持仓 (它持有多少 ETH) ,黄线是价格。
- 注意 灰色阴影区域 。 这些代表智能体做出重大战略举措的时期。
- 智能体成功识别局部底部买入 (积累头寸) ,并在价格见顶时卖出库存。
- 这种动态调整使其能够从波动中获取利润,而不仅仅是被动持有。
“全套配置”重要吗? (消融实验)
你可能会问: 我们真的需要新闻吗?我们真的需要链上数据吗?还是 LLM 只是根据价格在猜测?
研究人员进行了 消融实验 (Ablation Study) , 系统地移除系统的各个部分,以观察性能如何变化。

表 5 至关重要。它显示了牛市期间 ETH 的表现:
- 完整的 CryptoTrade: 28.47% 回报率。
- 无反思机制: 降至 17.14%。这证明了自我修正循环作用巨大。
- 无新闻: 降至 19.69%。智能体失去了感知市场情绪的能力。
- 无交易统计 (链上) : 降至 12.70%。
这是一个关键发现: 移除链上数据导致性能下降幅度最大。 这验证了区块链透明度是加密交易智能体关键优势的假设。
案例研究: “买预期,卖事实”
交易中最复杂的行为之一是驾驭重大新闻事件。一个经典的现象是“买预期,卖事实 (Buy the rumor, sell the news) ”——即价格因预期在事件发生 前 上涨,而在事件发生 后 因交易者套现而下跌。
研究人员分析了 CryptoTrade 在 2024 年初 比特币 ETF 批准 期间的行为。

如 图 3 所示:
- 谣言: 12 月底和 1 月初,新闻媒体热议 SEC 可能批准 ETF。新闻分析师捕捉到了这一点。交易智能体开始积极买入 (蓝线飙升) 。
- 事件: 1 月 11 日,ETF 获得批准。价格见顶。
- 卖出: 智能体识别出炒作周期的顶峰,并立即卖出头寸。
- 结果: 批准后不久价格下跌 (经典的“卖事实”事件) ,但智能体已经锁定了利润。
这种推理水平对于像 LSTM 这样的标准数值模型来说几乎是不可能实现的,因为它需要对“ETF 批准”对市场心理意味着什么进行语义理解。
结论与未来启示
CryptoTrade 论文证明了 LLM 可以成为强大的金融智能体,不仅因为它们聪明,还因为它们可以整合 多模态数据 。 通过结合技术指标的硬数学、新闻的社会情绪和链上数据的“真相”,CryptoTrade 创建了一个全面的市场视图。
给学生和研究人员的主要启示:
- 链上数据至关重要: 在加密领域,只看价格而不看区块链是不够的。消融实验证明,交易统计数据是主要的性能驱动因素。
- 反思驱动改进: 智能体批评其过去交易的能力使其能够适应不断变化的市场条件,而无需重新训练。
- 零样本能力: 值得注意的是,这种性能是在“零样本 (Zero-shot) ”方式下实现的。模型没有在多年的交易数据上进行微调;它只是被赋予了正确的数据和上下文提示。
虽然该智能体并没有在所有场景下击败所有传统策略 (在大牛市中很难击败“买入持有”策略) ,但它优于专业时间序列模型的能力表明,算法交易的未来在于 语义智能——理解数字背后的 故事,而不仅仅是数字本身。
随着 LLM 的不断发展,我们可以期待智能体从日间交易转向实时、逐分钟的执行,这可能会重塑加密货币市场高频交易的格局。
](https://deep-paper.org/en/paper/file-2909/images/cover.png)