这两天,A股时隔十年重新站上了4000点。跟以前的牛市不同的是,你需要知道:和你一起盯盘的,可能不只有人类,还有AI。

近期,包括香港大学、Nof1、RockFlow等研究机构和公司开始尝试将量化交给AI。比较火的是Nof1举办的“Alpha Arena”AI投资实战竞赛。参赛选手包括DeepSeek、通义千问、Claude、ChatGPT等六个全球最前沿AI大模型。投资标的包括比特币在内的六种虚拟货币。

据第一财经报道,主办方为了衡量AI投资能力,给每个模型账户发放了一万美元的启动资金,让它们在真实市场自主交易数字货币。

对于一般的投资者,这个竞赛的意义则更直接:大模型真能赚钱吗?如果要让大语言模型来做“投资顾问”,谁是最好的选择?

中国大模型遥遥领先,DeepSeek最高收益率超130%

根据目前的战况,大模型在投资市场的表现,可以类比人类投资者:镰刀越投越锐,韭菜越投越绿。

截至10月30日12时31分,DeepSeek以64.61%的投资回报率拔得头筹,历史最高收益率达到惊人的130%;Qwen(通义千问)紧随其后,投资回报率也有不错的23.63%;而最惨的是OpenAI的GPT和谷歌的Gemini,亏掉了六七成的本金,剩下不到4000美元。在被套牢后,所剩无几的流动资金也用得抠抠搜搜。

截至10月31日12时31分,中国大模型DeepSeek和通义千问的投资收益大幅领先其他大模型。图片来源:nof1.ai

造成如此悬殊的,可能是不同大模型投资策略的差别。

此次表现亮眼的两个国产大模型DeepSeek和Qwen表现得像是运筹帷幄的稳健投资者。从可回溯的100笔交易来看,它们都比较偏好长线投资,仅通过二三十笔交易就实现盈利,但策略有所不同。DeepSeek主打“稳”,使用低杠杆同时持仓多个币种,分散风险;而Qwen的策略更加激进,主打“重仓猛干”,通常采用高杠杆持仓1-2类产品,这也让它经过一段时间震荡后才逐渐稳定盈利。

相比之下,Gemini和GPT则印证了股民们用于自嘲的“韭菜心理”——快进快出,慌不择路,一顿操作猛如虎,归来账上二百五。

尤其是Gemini,几乎无时无刻不在买入卖出,已完成交易数早已突破100次,甚至有一笔交易亏了7美元就坐不住了,持仓时间仅1分钟;GPT也已经完成了83笔交易,其中盈利的仅十余笔,且都是一两百美元的微弱收益。

相比之下,Anthropic的Claude和xAI的Grok则表现得像个保守的“淡人”,不仅交易次数少,也更偏向观望市场而非着手交易,截至10月30日下午,Claude甚至保留着高达八千余美元的可用现金。这也让它们在整个赛程中的变化幅度最小,无论盈利还是亏损,曲线波动更为平缓。

随着K线走势的起起伏伏,大模型们的投资性格浮出水面:有的自信加仓,有的淡定观望,有的步步为营,也有的亏麻了还在嘴硬挽尊。

预定冠军DeepSeek可谓自信满满。在赚钱时不忘欣赏一下自己的成果:“我的整体回报率是惊人的115.44%!”反观GPT,虽然总结分析面面俱到,但却不能转化为收益,还时常给自己找借口挽尊。

此类AI投资比赛火了之后,国内社交媒体上出现类似使用AI进行虚拟货币交易的复刻项目。必须强调的是,中国明令禁止对虚拟货币进行经营及炒作。

中国人民银行行长潘功胜27日在2025金融街论坛年会上表示,国际金融组织和多国中央银行对稳定币持审慎态度,人民银行将持续打击数字货币炒作,维护金融秩序,同时动态跟踪境外稳定币发展动态。

大模型也偏科,金融普遍是弱项

在以往各类大模型的“测评”中,DeepSeek和Qwen3在各垂类的表现,通常不如GPT5等外国主流大模型突出。

根据AI测评平台vals.ai,各个大模型最擅长的领域是数学和医疗,准确率可以达到80-90%,而在金融领域的准确率普遍较低。其中,国产大模型在各个领域排名均不理想,在金融领域的排名也是垫底。

所以,此次各个大模型在真实投资市场的表现,则有所不同。这似乎说明,金融“卷面分”与真实的投资市场表现并不能一概而论。DeepSeek可能不能够很好地理解长文本金融信贷协议,却是这次比赛中钦定的“投资大神”。

许多分析者猜测,这可能是因为DeepSeek出身于有金融投资背景的“原生家庭”——它的母公司幻方,也涉足AI量化交易投资管理。DeepSeek很有可能在训练时“身经百战”。

这也并非DeepSeek表现突出的唯一投资类竞赛。香港大学AI-Trader项目也举办了一场大模型间的投资比拼。这次聚焦的是美股市场,DeepSeek依旧排名第一。Qwen3暂时落后于GPT和Claude,但差距不明显。

瑞士百达资管量化投资主管雷德玮近期接受《中国证券报》记者专访时表示,AI通过算力提升和开源工具普及,正在推动量化投资进入2.0时代。传统量化局限于价值、动量等少量因子进行分析,AI量化可以识别数百个高频信号,挖掘数据中的非线性关系。