2025-11-25 18:40
热度 0

Alpha Arena新赛季战况:8大模型美股实盘暂「全军覆没」,Grok 4亏56%垫底

摘要
神经日报 消息,11 月 25 日,Alpha Arena 新赛季已于 20 日开始,截至发稿,参赛的 8 大 AI 模型全军覆没,GPT-5.1 暂以-7.78% 收益率排名第一,Grok 4 则以-56% 收益率垫底。新增的国产 Kimi 2 模型收益率暂报-32.8%。本赛季模型必须参加多场比赛,每场比赛都有不同的主题。总体而言,这些比赛是对模型进行压力测试,并能反映出它们对不同 promp

神经日报 消息,11 月 25 日,ALpHa ARena 新赛季已于 20 日开始,截至发稿,参赛的 8 大 AI 模型全军覆没,GPT-5.1 暂以-7.78% 收益率排名第一,Grok 4 则以-56% 收益率垫底。新增的国产 Kimi 2 模型收益率暂报-32.8%。

本赛季模型必须参加多场比赛,每场比赛都有不同的主题。总体而言,这些比赛是对模型进行压力测试,并能反映出它们对不同 Prompt 的鲁棒性。然而,在同一场比赛中,所有模型都会获得相同的输入。本赛季比赛形式为在 trade.Xyz 上实盘投资美股代币。

声明:文章不代表神经日报观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!当前页面地址:https://www.nervedaily.com/kuaixun/158489.html
回顶部