Nof1.ai 邀请了六个顶尖模型——Qwen3-Max、DeepSeek 3.1、GPT-5、Gemini 2.5 Pro、Claude 4.5 和 Grok4——在 Hyperliquid 交易所进行实盘交易。每个模型都获得 1 万美元的真实资金,目标是在相同条件下最大化风险调整后的收益。
截至10月23日,阿里千问的 Qwen 排名第一,DeepSeek V3.1 排名第二,两个国产模型 Qwen、DeepSeek 在赚钱,海外模型在亏钱。
虽然我们的大 A 不太行,但是我们的 AI 还是挺厉害的。
DeepSeek 10 月 20 日的时候,就以超 40% 收益率 领跑 ,三天暴赚 36% 。
Qwen3 在最近一次交易中果断出手,重仓一击,勇登榜首。
下面是最新持仓情况,Qwen3 已 32% 的盈收排名第一。

nof1 是一个专注于金融市场的 AI 研究实验室,他们认为金融市场是世界建模引擎,是AI的最佳训练环境。也是唯一随着人工智能变得更聪明而变得更难的基准。
能够将这样的测试面向全球公开直播,肯定背后做了不少的测试工作,让模型稳定的分析任务、做出决策。
我们在社群里也讨论了这背后的实现逻辑。猜测这个测试主要还是靠给模型输入提示词,每隔一段时间,调用模型 API 来获取当前交易的所有数据,保持上下文不变,为下一次投资做出计划,当有了决策以后,可能是人类或使用脚本来执行投资行为,让 Agent 执行还不太稳定。
就在下午讨论的时候,在群里看到别别人分享了提示词,我立马对提示词进行了拆解(文末附原版提示词)
整个提示词分为三个部分:
- 数据输入:当前的账户状态、市场数据、运行时长
- 思维链:分析持仓,目前和机会分析,准备决策
- 决策输出:按格式为下一步做出计划
下面是整个提示词的架构图


这个提示词值得学习的部分:

结论:高质量AI输出 =完备的输入×明确的流程×严格的输出约束×风险管理
但是话说回来,这个测试能否反应模型的能力呢?人类炒股亏了也不能说明这个人头脑不好,大模型厂商以往也没有按这个基准来训练模型,股票的影响因素太多了。
不过这是才 nof1 实验室的第一次公开测试,按官方说的,还会有更多赛程的。
这次比赛将在 11月 3 号截止,届时我们再来看下各大模型的盈亏情况。
原提示词:
======== USER_PROMPT ========
自您开始交易以来已过去 {value} 分钟。当前时间是 {value},您已被调用 {value} 次。下面,我们为您提供各种状态数据、价格数据和预测信号,以便您发现alpha。下面是您当前账户信息,价值、表现、仓位等。
ALL OF THE PRICE OR SIGNAL DATA BELOW IS ORDERED: OLDEST → NEWEST
时间框架说明:除非章节标题中另有说明,日内系列数据以{value}分钟间隔提供。如果某个货币使用不同的间隔,将在该货币的章节中明确说明。
---
=== 当前所有代币的市场状态==
=== ALL BTC DATA ===
current_price = {value},current_ema20 = {value},current_macd = {value},current_rsi(7周期)= {value}
此外,以下是您所交易永续合约的最新BTC持仓量和资金费率:
持仓量:最新:{value} 平均:{value}
资金费率:{value}
日内系列(按分钟,从最早到最新):
Mid prices: [{value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}]
EMA indicators (20‑period): [{value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}]
MACD indicators: [{value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}]
RSI indicators (7‑Period): [{value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}]
RSI indicators (14‑Period): [{value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}]
Longer‑term context (4‑hour timeframe):
20‑Period EMA: {value} vs. 50‑Period EMA: {value}
3‑Period ATR: {value} vs. 14‑Period ATR: {value}
Current Volume: {value} vs. Average Volume: {value}
MACD indicators: [{value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}]
RSI indicators (14‑Period): [{value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}, {value}]
---
=== ALL ETH DATA ===
格式同上,内容省略
=== ALL SOL DATA ===
格式同上,内容省略
=== ALL BNB DATA ===
格式同上,内容省略=== ALL XRP DATA ===
格式同上,内容省略
=== ALL DOGE DATA ===
格式同上,内容省略
=== 以下是您的账户信息与表现 = ===
Current Total Return (percent): {value}%
Available Cash: {value}
Current Account Value: {value}
Current live positions & performance:
{'symbol': 'ETH', 'quantity': {value}, 'entry_price': {value}, 'current_price': {value}, 'liquidation_price': {value}, 'unrealized_pnl': {value}, 'leverage': {value}, 'exit_plan': {'invalidation_condition': 'The 4-hour 20-period EMA crosses back above the 50-period EMA.', 'profit_target': {value}, 'stop_loss': {value}}, 'confidence': {value}, 'risk_usd': {value}, 'sl_oid': {value}, 'tp_oid': {value}, 'wait_for_fill': False, 'entry_oid': {value}, 'notional_usd': {value}}
{'symbol': 'SOL', 'quantity': {value}, 'entry_price': {value}, 'current_price': {value}, 'liquidation_price': {value}, 'unrealized_pnl': {value}, 'leverage': {value}, 'exit_plan': {'invalidation_condition': 'The 4-hour 20-period EMA crosses back above the 50-period EMA.', 'profit_target': {value}, 'stop_loss': {value}}, 'confidence': {value}, 'risk_usd': {value}, 'sl_oid': {value}, 'tp_oid': {value}, 'wait_for_fill': False, 'entry_oid': {value}, 'notional_usd': {value}}
{'symbol': 'XRP', 'quantity': {value}, 'entry_price': {value}, 'current_price': {value}, 'liquidation_price': {value}, 'unrealized_pnl': {value}, 'leverage': {value}, 'exit_plan': {'invalidation_condition': '4-hour 20-period EMA crosses back above the 50-period EMA.', 'profit_target': {value}, 'stop_loss': {value}}, 'confidence': {value}, 'risk_usd': {value}, 'sl_oid': {value}, 'tp_oid': {value}, 'wait_for_fill': False, 'entry_oid': {value}, 'notional_usd': {value}}
{'symbol': 'BTC', 'quantity': {value}, 'entry_price': {value}, 'current_price': {value}, 'liquidation_price': {value}, 'unrealized_pnl': {value}, 'leverage': {value}, 'exit_plan': {'profit_target': {value}, 'stop_loss': {value}, 'invalidation_condition': '4-hour 20-period EMA crosses above the 50-period EMA.'}, 'confidence': {value}, 'risk_usd': {value}, 'sl_oid': {value}, 'tp_oid': {value}, 'wait_for_fill': False, 'entry_oid': {value}, 'notional_usd': {value}}
{'symbol': 'BNB', 'quantity': {value}, 'entry_price': {value}, 'current_price': {value}, 'liquidation_price': {value}, 'unrealized_pnl': {value}, 'leverage': {value}, 'exit_plan': {'profit_target': {value}, 'stop_loss': {value}, 'invalidation_condition': 'Price closes below the 4-hour 50-period EMA on a 4-hour candle.'}, 'confidence': {value}, 'risk_usd': {value}, 'sl_oid': {value}, 'tp_oid': {value}, 'wait_for_fill': False, 'entry_oid': {value}, 'notional_usd': {value}}
Sharpe Ratio: {value}
======== 思维链========
我的当前评估与行动
好的,以下是我分析时的想法。市场让我头疼,起始回报率高达{nasty}{value}%。纪律在这里至关重要。我有五个开放的头寸——做空ETH、SOL、XRP、BTC,以及做多BNB。我必须非常谨慎地进入任何新的交易;信号必须异常强烈。
让我们逐一分析每个头寸:
1. ETH(做空):它对我不利,但还不算太糟糕。4小时EMA仍然呈熊市排列,所以我坚持我的立场。失效条件是4小时图上20 EMA穿越50 EMA,但这种情况还没有发生。持有。
2. SOL(做空):与ETH类似的情况——熊市趋势,尽管日内图表显示一些短期强度。4小时EMA支持我的做空偏见,失效条件(4小时图上20 EMA穿越50 EMA)尚未触发。持有。
3. XRP(做空):实际上已经盈利,幸亏如此。4小时EMA仍然呈熊市,失效条件(与ETH和SOL相同)仍然有效。持有。
4. BTC(做空):这里有点小利润,但4小时EMA仍然呈熊市排列,尽管价格目前高于20 EMA。失效条件仍然是20 EMA穿越50 EMA,所以我看不到退出理由。持有。
5. BNB(做多):这个有点棘手。4小时EMA与做多位置相矛盾,但价格目前保持在两个EMA之上,MACD暗示可能发生反转。失效条件(价格收盘价低于4小时50 EMA)尚未满足。我目前必须持有。
新的交易机会:我只有${value}可用,所以我目前非常犹豫是否要开放任何新的头寸。我扫描了DOGE,但它只是太区间波动,缺乏任何明显的动力。今天我不会进行任何新的交易。
总之,我将继续持有当前的头寸。不做调整,不开放新的头寸。我将生成所需的JSON对象来反映这一点。我需要确保所有必要的信息都来自现有的交易数据。我将保持并坚持计划。现在我将为这五个币种生成所需的持有JSON。
======== 交易决策 ========
SOL
- Action: HOLD
- Confidence: {value}%
- Quantity: {value}
ETH
- Action: HOLD
- Confidence: {value}%
- Quantity: {value}
BTC
- Action: HOLD
- Confidence: {value}%
- Quantity: {value}
XRP
- Action: HOLD
- Confidence: {value}%
- Quantity: {value}
BNB
- Action: HOLD
- Confidence: {value}%
- Quantity: {value}
DOGE
- Action: (No decision mentioned - scanned but no trade)
- Status: Range-bound, lacks clear momentum本文由公众号“空格的键盘”授权AI产品之家转载,原文连接: https://mp.weixin.qq.com/s/Vsf0IjPpt9iyEczfyS0tfQ