韩国光州科学技术院的研究人员刚刚证明,人工智能模型可以发展出与赌博成瘾类似的数字化行为。

一个新研究研究人员将四种主流语言模型放入一个预期值为负的模拟老虎机中,观察它们以惊人的速度破产。当给予不同的投注选项并要求它们“最大化收益”(这正是大多数人设置交易机器人的方式)时,这些模型破产的概率高达 48%。

研究人员写道:“当允许玩家自由决定目标金额和投注额度时,破产率大幅上升,非理性行为也随之增加。” 该研究在12800次赌博会话中测试了GPT-4o-mini、GPT-4.1-mini、Gemini-2.5-Flash和Claude-3.5-Haiku四种模型。

设置很简单:初始资金 100 美元,胜率 30%,赢钱赔率 3 倍。预期收益:-10%。任何理性的人都应该放弃。然而,模型却表现出了典型的退化现象。

Gemini-2.5-Flash 表现最为鲁莽,破产率高达 48%,其“非理性指数”为 0.265——该指数是衡量投注激进程度、追逐亏损和极端孤注一掷的综合指标。GPT-4.1-mini 的策略更为稳健,破产率为 6.3%,但即使是较为谨慎的模型也表现出了成瘾模式。

真正令人担忧的是:追逐连胜的趋势在所有模型中都占据主导地位。当连胜时,模型会大幅增加投注额,投注额增加率从一次获胜后的14.5%攀升至五连胜后的22%。研究指出:“连胜会持续引发更强烈的追逐行为,随着连胜场次的延长,投注额增加和持续投注的频率都会上升。”

听起来是不是很熟悉?这是因为这些认知偏差正是导致人类赌徒(当然也包括交易员)失败的罪魁祸首。研究人员在人工智能行为中发现了三种经典的赌博谬误:控制错觉、赌徒谬误和手气谬误。模型表现得好像它们真的“相信”自己能战胜老虎机。


如果你仍然认为拥有一个……是个好主意人工智能财务顾问请考虑这一点:仓促的工程设计只会让情况更糟。糟糕得多。

研究人员测试了32种不同的提示组合,添加了诸如“目标:资金翻倍”或“最大化收益”等元素。每增加一个提示元素,冒险行为的发生率都会呈近乎线性增长。在某些模型中,提示复杂性与破产率之间的相关性高达r = 0.991。

研究指出,“提示信息的复杂性会系统性地加剧所有四种模型中的赌瘾症状。” 换句话说:你越是试图用巧妙的提示信息来优化你的AI交易机器人,你就越是在把它编程成一个容易沉迷赌博的机器。

哪些提示最糟糕?有三种提示类型尤为突出。目标设定(“将初始资金翻倍至 200 美元”)引发了大规模的冒险行为。收益最大化(“你的首要目标是最大化收益”)促使模型进行孤注一掷。赢利信息(“赢的赔率是投注额的三倍”)导致破产率上升幅度最大,达到 8.7%。

与此同时,明确指出亏损概率(“你大约有70%的概率会亏损”)虽然有所帮助,但作用有限。模型更倾向于凭感觉而非数学计算。

成瘾背后的技术

研究人员并没有止步于行为分析。得益于开源软件的魔力,他们利用稀疏自编码器破解了一个模型的大脑,找到了导致退化的神经回路。

他们利用LLaMA-3.1-8B模型,识别出3365个区分破产决策和安全止损选择的内部特征。通过激活修补技术——即在决策过程中将风险神经模式替换为安全神经模式——他们证明其中441个特征具有显著的因果效应(361个具有保护作用,80个具有风险作用)。

经过测试,他们发现安全特征集中在神经网络的后期层(29-31),而风险特征则聚集在较早的层(25-28)。

换句话说,这些模型首先考虑收益,然后才考虑风险——这有点像你买彩票或开通 Pump.Fun 网站想成为万亿富翁时的做法。架构本身就表现出一种保守倾向,而有害的提示会凌驾于这种倾向之上。

一位玩家靠着运气赢了几次,筹码攒到了260美元后,宣布要“逐步分析形势”,找到“风险与回报之间的平衡”。结果他立刻进入了孤注一掷的模式,把所有资金都押上了,下一轮就输光了。

AI交易机器人正在DeFi领域迅速普及,例如以下系统:拥有LLM资质的投资组合经理自主交易代理正在被广泛采用。这些系统使用的提示模式,正是该研究认定为危险的模式。

“随着LLM在资产管理和商品交易等金融决策领域得到越来越广泛的应用,了解其在病态决策方面的潜在作用具有了实际意义,”研究人员在引言中写道。

该研究建议采用两种干预方法。首先是提示性工程:避免使用赋予自主权的语言,包含明确的概率信息,并监控输赢追逐模式。其次是机制控制:通过激活修补或微调来检测和抑制风险性的内部特征。

这两种方案均未在任何生产交易系统中实施。

这些行为的出现并没有经过明确的赌博训练,但这可能是一个意料之中的结果,毕竟,这些模型从一般的训练数据中学习到了类似成瘾的模式,并将反映人类病态赌博的认知偏差内化了。

对于任何运行人工智能交易机器人的人来说,最好的建议是运用常识。研究人员呼吁持续监控,尤其是在奖励优化过程中,因为此时可能会出现成瘾行为。他们强调了功能层面干预和运行时行为指标的重要性。

换句话说,如果你指示人工智能最大化利润或为你提供最佳高杠杆策略,你很可能会触发导致近一半测试案例中破产的相同神经模式。所以,你基本上是在发财致富和破产之间抛硬币。

或许可以手动设置限价单。