前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人

  人工智能(AI)还没有准备好取代你的基金经理 ,一系列公开测试说明了其中缘由 。

前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人-第1张图片

  在全球领先AI模型参与的一系列新的交易竞赛中 ,迄今为止AI的表现并不算好 。大多数系统蒙受了亏损。它们交易过于频繁,在收到完全相同指令时会作出截然不同的决策。而且目前仍无人知道,这些缺陷会否随着模型迭代升级而消失 ,还是揭示了大语言模型与市场实际运作方式之间存在的根本性鸿沟 。

  以科技初创公司Nof1运营的Alpha Arena为例。该平台让八个主要前沿AI系统同台较量,开展四场比赛,其中包括Anthropic的Claude 、谷歌的Gemini 、OpenAI的ChatGPT以及埃隆·马斯克的Grok。每个系统在每场比赛开始前都获得1万美元资金 ,随后在两周内自主交易美国科技股 。挑战包括依据多种信号交易、采取防御性策略、对竞争对手表现作出反应,以及使用高杠杆操作。

  整体投资组合最终亏掉了约三分之一资金。在全部32组结果中,模型仅有6次实现盈利 。Grok 4.20在一项可获知竞争对手表现的挑战中取得最佳成绩。它只进行了158笔交易;在相同提示下 ,阿里巴巴的千问则交易了1418次。

  Alpha Arena只是越来越多相关实验中的一个 。这些实验都在测试,大语言模型能否胜任金融业最困难的工作:战胜市场。尽管这些竞赛远谈不上具有学术严谨性,但它们迄今最公开地展示了 ,当这些系统尝试承担华尔街一些利润最丰厚 、风险最高的工作时,会发生什么。

  这些初步结果之所以重要,是因为交易正是金融业对于完全交给AI仍保持谨慎的少数工作之一 。过去几年 ,从摩根大通到Balyasny Asset Management等行业巨头 ,几乎已将这项技术用于其他各个环节 。如今,大语言模型已在量化机构中用于解析新闻,在对冲基金中起草备忘录 ,在大型银行中识别欺诈等。但在真金白银的交易上,“人类参与”仍是行业信条,似乎也是情有可原。

  Nof1创始人Jay Azhang表示:“大语言模型本身其实无法真正赚钱 。你基本上需要一整套非常复杂的约束框架、支撑系统和数据平台 ,才有可能给它们一个发挥的机会。 ”

  他说,大语言模型擅长做研究,也擅长为某些任务寻找并调用合适工具。但它们目前仍不知道 ,影响股价波动的诸多变量 —— 包括分析师评级、内部交易和市场情绪变化等 —— 各自究竟有多重要 。它们往往把握不好交易时机,错误设定仓位规模,而且买卖过于频繁。

  AI博客Flat Circle追踪了11个与市场相关的竞技平台 ,所有平台都至少有一个模型实现盈利。但在这11个平台中,只有两个平台的模型中位数实现盈利,这表明大多数模型都难以战胜市场 。

  这一结果与人类的表现如出一辙 ,因为众所周知 ,多数主动管理型基金同样跑输大盘。而且就像人类一样,这些模型也容易出现明显偏颇。多场竞赛显示,AI系统在收到相同指令时会作出非常不同的决定 ,这对部署它们的机构具有重大影响 。Azhang举例说,在Alpha Arena最近一轮比赛中,Claude大多倾向做多 ,Gemini并不排斥做空,而千问则更愿意借助高杠杆承担风险。

  运营Intelligent Alpha的Doug Clinton表示:“它们有自己的‘个性’,你必须像管理人类分析师那样去管理它们。 ”他说 ,如果让模型意识到自己表现出某种偏见,结果可以得到改善 。Intelligent Alpha有一个由大语言模型驱动的基金,就AI预测企业盈利的表现发布其自身的基准 。

  Intelligent Alpha的基准为10个AI模型提供财务申报文件 、分析师预测、业绩电话会纪要、宏观经济数据以及最多10次网络搜索权限。由于聚焦范围更窄 ,大语言模型在这项测试中的表现更为积极。2025年第四季度,OpenAI的ChatGPT对盈利预期变动方向的判断准确率达到68%,创下迄今最佳成绩 。Clinton表示 ,这些模型通常会随着每次新版本发布而持续改进。

标签:

相关推荐

  • 全球疫情顶峰(全球疫情席卷)

    全球疫情顶峰(全球疫情席卷)

    中国非典哪一年发生的〖壹〗、2003年非典疫情:2003年,中国爆发了一次严重的传染性非典型肺炎(SARS)疫情,造成了大量人员感染和死亡。2004年禽流感:2004年,禽流感在亚洲多个国家爆发,并传播到了欧洲和美洲,导致数千人感染和死亡。〖贰〗、非典的起源与首次爆发非典(严重急性呼吸综合征,SARS)于2002年11月16日在中国广东省顺德市首次爆发。...

    2026/05/15
  • 禁止转发疫情(禁止转发的图片)

    禁止转发疫情(禁止转发的图片)

    成都多名干部泄露疫情防控工作信息被立案审查成都多名干部因泄露疫情防控工作信息被立案审查,涉及都江堰市委常委李跃、青羊区卫健局局长刘咏梅、双流区东升街道党工委书记刘伟及怡心街道党工委书记李德文,均因擅自拍照并通过微信外传会议信息造成不良影响,分别被成都市、青羊区、双流区纪委立案审查。近日成都多名干部被立案审查,主要原因还是这几名干部泄露了防疫信息,这是一起性...

    2026/05/15
  • 【张汪疫情,张汪医院联系电话】

    【张汪疫情,张汪医院联系电话】

    枣庄市大集时间表枣庄市大集按农历日期定期举办,不同乡镇街道大集时间不同,以下是常见大集信息市中区主要大集1)西王庄大集农历逢八,像初初十十八等。2)孟庄大集农历逢七。3)齐村大集农历逢六。4)永安大集农历逢九。薛城区主要大集1)邹坞大集农历逢七。2)陶庄大集农历逢六。在枣庄市中区,齐村集的逢集日期固定在阴历的九日。而利民大集则在阴历的十二二十三十日举行。这...

    2026/05/14
  • 疫情女司机/疫情女孩追救护车

    疫情女司机/疫情女孩追救护车

    女司机担心感染新冠,竟然在高速超速狂飙,如何看待她的做法?一名女司机想用速度甩掉病毒,结果被罚了。在河北衡水的一高速上,一位女子在高速上狂飙到了时速182km,警方将其拦下后,了解到原来女子从天津谈完生意返回河南,担心感染新冠病毒,就一路狂飙。女子因为违反了交通法规,被罚款1000元,扣12分。新冠病毒虽然可怕,但是交通法规还是要遵守。向大乘汽车志愿者致敬...

    2026/05/14
  • 兰州详细疫情(兰州疫情2026又开始了吗)

    兰州详细疫情(兰州疫情2026又开始了吗)

    甘肃新增0+10例,兰州新增0+2例,下周一有望解封月4日甘肃省新增0例确诊病例、10例无症状感染者,其中兰州市新增0例确诊病例、2例无症状感染者,下周一(8月8日)存在解封可能性,但需以官方最终通知为准。新增病例具体情况根据甘肃省卫健委官方网站8月5日消息,8月4日0—24时,甘肃省无新增确诊病例,新增无症状感染者10例。0月16日0—24时,甘肃省无新...

    2026/05/14
  • 华英农业或将易主!募资“补血”背后业绩承压

    华英农业或将易主!募资“补血”背后业绩承压

    华英农业收到控股股东鼎新兴华通知,公司将易主。本次权益变动后公司控股股东将变更为信阳产投,实控人将变更为信阳市财政局。来源|读创财经编辑|靳恩琦 责编|朱峰5月14日晚间,华英农业(002321)发布公告称,公司收到控股股东信阳市鼎新兴华产业投资合伙企业(有限合伙)(以下简称“鼎新兴华”)的通知,鼎新兴华全体合伙人共同签署了《关于鼎新兴华之清算分配协...

    2026/05/14
  • 关于德国疫情封锁的信息

    关于德国疫情封锁的信息

    重要提醒:德国调整由中国入境德国的规定——第三波疫情恶化...〖壹〗、德国因第三波疫情恶化调整由中国入境德国的规定,包括要求提供核酸检测阴性证明,同时默克尔考虑实施“全国封锁”。〖贰〗、从12月15日起,高风险国家入境旅客隔离期可缩短至5天(需阴性检测结果)。客户恢复上班的可能性较低,因三级封锁下非必要商业活动仍受限,且政府警告圣诞解封可能导致第三波疫情。...

    2026/05/14
  • 【诺如疫情,诺如病毒疫情】

    【诺如疫情,诺如病毒疫情】

    江西是诺如病毒重灾区?别闹啦,这是个大“乌龙”!〖壹〗、“江西是诺如病毒重灾区”的说法是谣言,并无事实依据。具体分析如下:诺如病毒的基本情况:诺如病毒是引起“其他感染性腹泻”的病原体,属于丙类传染病。其潜伏期短,通常24到48小时发作,感染后症状包括腹泻、呕吐、恶心、腹痛、头痛、发热、畏寒和肌肉酸痛等。〖贰〗、“江西是诺如病毒的重灾区”这一说法纯属谣言。具...

    2026/05/14
  • 【江川疫情名单,江川疫情报告】

    【江川疫情名单,江川疫情报告】

    江川街道办事处是否被封了?〖壹〗、是的。3月22日晚,闵行区新冠肺炎疫情防控指挥部发布了各相关街镇(包括莘庄工业区)关于疫情防控的重要公告。公告称,接市疫情防控指挥部通知,闵行区华漕镇、马桥镇、梅陇镇、江川路街道自3月23日(星期三)至24日(星期四),继续维持全域封控。所有人员在3月23日进行1次核酸检测筛查。〖贰〗、江川街道明天是封小区的,这样才能更好...

    2026/05/14
  • 疫情又暴发/疫情严重爆发

    疫情又暴发/疫情严重爆发

    疫情凶猛反扑!欧洲多国收紧防控措施〖壹〗、欧洲多国因新冠疫情凶猛反扑而收紧防控措施,奥地利宣布全国“封锁”并推行强制性疫苗接种,德国等国也面临严峻形势并采取相应措施。欧洲疫情形势严峻近期,欧洲新冠疫情持续恶化,一些国家报告的新增确诊病例数创下疫情以来新高。据世界卫生组织发布的数据,欧洲地区过去一周内每10万人7天内新增确诊病例230例,为全球比较高。〖贰...

    2026/05/14
返回顶部