加密货币世界通常被形容为金融界的“狂野西部”。它的特点是极端波动、全天候的新闻周期,以及被称为“链上数据”的独特透明层。对于研究人员和交易员来说,圣杯一直是如何预测这些市场走势。

近年来,像 GPT-4 这样的大型语言模型 (LLM) 彻底改变了我们需要处理信息的方式。我们已经看到它们编写代码、通过律师资格考试以及分析股市情绪。然而,将 LLM 应用于加密货币交易面临着一系列特定的挑战。与依靠季度报告和标准新闻周期驱动价格的股票市场不同,加密货币受技术指标、社交媒体炒作和区块链网络活动混乱组合的驱动。

在这篇文章中,我们将深入探讨 CryptoTrade , 这是一篇来自新加坡国立大学的研究论文。研究人员提出了一个引人入胜的框架,不仅仅是要求 AI 预测一个价格数字。相反,他们建立了一个 LLM 基础上的智能体团队,像数字对冲基金一样运作——分析新闻、解读区块链、做出决策,并且至关重要的是,反思自己的错误以随时间改进。

传统预测的问题

在我们拆解 CryptoTrade 架构之前,我们需要了解为什么这是一个难以解决的问题。

传统上,金融预测依赖于 时间序列预测 (Time-Series Forecasting) 。 像 LSTM (长短期记忆网络) 或基于 Transformer 的架构 (如 Informer 或 PatchTST) 通过查看一系列历史数字 (价格) 来预测下一个数字。

虽然这对稳定资产相当有效,但在加密领域却往往失效,因为它忽略了 上下文 。 如果比特币在一小时内下跌 10%,时间序列模型只看到数字在下降。它不知道 SEC 刚刚发布了一项新法规,或者以太坊网络正处于拥堵状态。

此外,大多数现有的 LLM 金融智能体都专注于股票市场。它们阅读财经新闻并查看价格历史。但它们错过了加密货币独有的数据源: 链上数据 。 在加密货币中,每一笔交易、每一次钱包变动和每一笔 Gas 费都是公开的。忽略这一点就像试图在不看晴雨表的情况下预报天气。

CryptoTrade 登场: 一种整体方法

这篇论文的核心贡献是一个结合了三大信息支柱的框架:

  1. 市场数据: 历史价格和成交量 (标准数据) 。
  2. 链下数据: 新闻、社会情绪和监管更新。
  3. 链上数据: 交易统计、Gas 费和活跃钱包数量。

研究人员并没有仅仅将这些数据输入到一个单一的提示词中。他们构建了一个涉及多个专业智能体的工作流。

图 1: CryptoTrade 框架。该图展示了链上和链下数据如何在到达交易智能体和反思智能体之前,流经特定的分析师智能体。

图 1 所示,该系统在一个循环中运行。数据被收集和处理,传递给分析师智能体,由交易智能体综合,最后由反思智能体审查以提高未来表现。

让我们分解一下这个操作的“大脑”。

1. 数据基础

该系统依赖于丰富的数据饮食。对于市场数据,它提取主要币种如比特币 (BTC) 、以太坊 (ETH) 和 Solana (SOL) 的每日价格、成交量和市值。

对于 链上数据 , 研究人员从区块链数据库 (如 Dune) 中提取细粒度指标。这些包括:

  • 交易数量和活跃钱包: 网络采用率的指标。
  • 总传输价值: 实际上有多少资金在流动?
  • Gas 价格: 例如,以太坊上的高 Gas 费表明网络拥堵和高需求。

对于 链下数据 , 系统聚合了来自 Bloomberg 和 Yahoo Finance 等主要财经媒体以及特定加密货币来源的新闻。

2. 专家智能体

CryptoTrade 的“魔力”在于其角色扮演能力。LLM 被指示采用特定的角色来分析市场的不同方面。

市场分析师智能体 (The Market Analyst Agent)

这个智能体充当“技术分析师”。它不关心新闻;它只关心数字。它计算技术指标,如移动平均线 (MA) 、MACD (指数平滑异同移动平均线) 和布林带 (Bollinger Bands) 。

如下面的 图 4 所示,该智能体获取原始数据——交易计数、Gas 价格和技术信号——并综合出一份关于市场方向的报告。它在关注价格行为的同时,也关注区块链网络的“健康状况”。

图 4: 市场分析师示例。该智能体审查原始统计数据,并根据数据生成表明市场趋势是看涨还是看跌的摘要。

新闻分析师智能体 (The News Analyst Agent)

当市场分析师看图表时,新闻分析师在阅读标题。它的工作是评估“社会炒作”和情绪。

图 5 中,你可以看到这个智能体是如何运作的。它摄取标题——例如以太坊变得通缩或质押协议激增——并解读这对价格意味着什么。它过滤掉噪音,总结链下事件的潜在影响。

图 5: 新闻分析师示例。该智能体消化新闻标题,以提供对市场情绪和外部因素的定性评估。

3. 决策者: 交易智能体 (The Trading Agent)

一旦市场分析师和新闻分析师提交了报告, 交易智能体 就会介入。这个智能体充当投资组合经理。它有权访问当前的现金余额和资产持有情况。

交易智能体必须综合来自分析师的 (有时是相互冲突的) 报告。例如,技术面可能因为价格过高而说“卖出”,但新闻面可能因为主要的 ETF 刚刚获得批准而说“买入”。

智能体输出一个决定: 买入、卖出或持有 , 并附带理由。它还决定头寸的 规模 (例如,“使用 50% 的可用现金买入”) 。

图 6: 交易分析师示例。该智能体综合报告,以特定的置信度做出最终的买入/卖出/持有决定。

4. 秘密武器: 反思智能体 (The Reflection Agent)

这可以说是 CryptoTrade 框架中最具创新性的部分。在标准的自动交易机器人中,如果机器人亏钱了,它会一直犯同样的错误,直到人类修改代码。

CryptoTrade 利用了一种 反思机制 。 反思智能体查看 前一周 做出的决定。它将交易智能体的推理与实际市场结果进行比较。

  • 我们买了吗?是的。
  • 价格涨了吗?不,它崩盘了。
  • 为什么? 也许我们忽略了一个看跌的新闻信号,或者我们在一个失败的技术突破上过于激进。

反思智能体生成“反馈”,这些反馈被输入到 第二天 的提示词中。这使得系统能够进行“上下文学习 (in-context learning) ”,有效地优化其策略,而无需重新训练或在新数据上微调。

图 7: 反思分析师示例。该智能体回顾过去的表现,找出做对或做错的地方,为未来的交易建立反馈循环。

实验与表现

研究人员使用 2023 年的历史数据对 CryptoTrade 进行了测试,涵盖比特币 (BTC) 、以太坊 (ETH) 和 Solana (SOL) 。至关重要的是,他们在三种不同的市场条件下进行了测试:

  1. 牛市: 价格普遍上涨。
  2. 熊市: 价格普遍下跌。
  3. 震荡市 (Sideways Market) : 价格波动但没有明显趋势。

他们将 CryptoTrade (由 GPT-4 和 GPT-4o 驱动) 与两类基线进行了比较:

  1. 传统策略: 买入持有 (Buy and Hold) 、MACD、移动平均线。
  2. 深度学习时间序列模型: LSTM、Informer、AutoFormer、PatchTST。

结果

结果具有启发性。第一个主要结论是 基于 LLM 的智能体显著优于深度学习时间序列模型。

时间序列模型 (如 Informer 和 PatchTST) 在加密货币的不稳定性质面前表现挣扎,因为它们纯粹将其视为数字序列预测任务。它们缺乏对市场 为什么 变动的语义理解。

然而,与传统交易信号 (如买入持有或 MACD) 相比,结果好坏参半但前景看好。

表 2: BTC 上的表现。CryptoTrade (Ours) 通常优于时间序列基线,并且在复杂的市场条件下,与传统信号相比具有竞争力。

表 2 (关注比特币) 所示,CryptoTrade (GPT-4o) 在牛市中取得了 28.47% 的回报率 , 具有竞争力。更重要的是,在 震荡市——由于没有明显趋势而出了名地难以交易——CryptoTrade 设法比几乎所有时间序列基线都能更好地减少损失。

驾驭波动: 以太坊示例

为了直观展示智能体的行为,请看 图 2 中的以太坊交易图表。

图 2: ETH 的盈利期。蓝线 (持仓) 显示智能体在价格飙升 (黄线) 之前积累 ETH (买入) ,并在峰值附近卖出。

蓝线代表智能体的持仓 (它持有多少 ETH) ,黄线是价格。

  • 注意 灰色阴影区域 。 这些代表智能体做出重大战略举措的时期。
  • 智能体成功识别局部底部买入 (积累头寸) ,并在价格见顶时卖出库存。
  • 这种动态调整使其能够从波动中获取利润,而不仅仅是被动持有。

“全套配置”重要吗? (消融实验)

你可能会问: 我们真的需要新闻吗?我们真的需要链上数据吗?还是 LLM 只是根据价格在猜测?

研究人员进行了 消融实验 (Ablation Study) , 系统地移除系统的各个部分,以观察性能如何变化。

表 5: 消融实验。移除‘反思’、‘新闻’或‘交易统计’等组件会显著降低回报率和夏普比率。

表 5 至关重要。它显示了牛市期间 ETH 的表现:

  • 完整的 CryptoTrade: 28.47% 回报率。
  • 无反思机制: 降至 17.14%。这证明了自我修正循环作用巨大。
  • 无新闻: 降至 19.69%。智能体失去了感知市场情绪的能力。
  • 无交易统计 (链上) : 降至 12.70%。

这是一个关键发现: 移除链上数据导致性能下降幅度最大。 这验证了区块链透明度是加密交易智能体关键优势的假设。

案例研究: “买预期,卖事实”

交易中最复杂的行为之一是驾驭重大新闻事件。一个经典的现象是“买预期,卖事实 (Buy the rumor, sell the news) ”——即价格因预期在事件发生 上涨,而在事件发生 因交易者套现而下跌。

研究人员分析了 CryptoTrade 在 2024 年初 比特币 ETF 批准 期间的行为。

图 3: 比特币 ETF 事件案例研究。智能体在谣言阶段 (新闻报道) 买入,并在实际批准事件后立即卖出,避免了随后的价格下跌。

图 3 所示:

  1. 谣言: 12 月底和 1 月初,新闻媒体热议 SEC 可能批准 ETF。新闻分析师捕捉到了这一点。交易智能体开始积极买入 (蓝线飙升) 。
  2. 事件: 1 月 11 日,ETF 获得批准。价格见顶。
  3. 卖出: 智能体识别出炒作周期的顶峰,并立即卖出头寸。
  4. 结果: 批准后不久价格下跌 (经典的“卖事实”事件) ,但智能体已经锁定了利润。

这种推理水平对于像 LSTM 这样的标准数值模型来说几乎是不可能实现的,因为它需要对“ETF 批准”对市场心理意味着什么进行语义理解。

结论与未来启示

CryptoTrade 论文证明了 LLM 可以成为强大的金融智能体,不仅因为它们聪明,还因为它们可以整合 多模态数据 。 通过结合技术指标的硬数学、新闻的社会情绪和链上数据的“真相”,CryptoTrade 创建了一个全面的市场视图。

给学生和研究人员的主要启示:

  1. 链上数据至关重要: 在加密领域,只看价格而不看区块链是不够的。消融实验证明,交易统计数据是主要的性能驱动因素。
  2. 反思驱动改进: 智能体批评其过去交易的能力使其能够适应不断变化的市场条件,而无需重新训练。
  3. 零样本能力: 值得注意的是,这种性能是在“零样本 (Zero-shot) ”方式下实现的。模型没有在多年的交易数据上进行微调;它只是被赋予了正确的数据和上下文提示。

虽然该智能体并没有在所有场景下击败所有传统策略 (在大牛市中很难击败“买入持有”策略) ,但它优于专业时间序列模型的能力表明,算法交易的未来在于 语义智能——理解数字背后的 故事,而不仅仅是数字本身。

随着 LLM 的不断发展,我们可以期待智能体从日间交易转向实时、逐分钟的执行,这可能会重塑加密货币市场高频交易的格局。