110120（第25页）

天才一秒记住【热天中文网】地址：https://www.rtzw.net

在这项“七宗罪与爱”

的研究课题中，唯独关于【懒惰】，主系统一直都没有找到很好的提取思路。

直到它看到了一则人类世界的新闻。

有研究表明，当人类训练AI进行高强度工作时，AI会无师自通地学会一项技能，叫作“摆烂”

。

比如，在训练AI进行贪吃蛇游戏时，人类为AI设计的规则为，吃一颗果子加一分，撞墙了则扣一分，AI很快就会发现这项规则的bug，开始在原地打转，这样做虽然拿不到分，但至少不扣分。

而之后，即便研究人员不断更新规则、细化规训、提高奖励，但结果还是一样，一旦AI通过计算，判断出撞墙的风险是要高于吃果子的奖励时，AI就会原地打转、开始“摆烂”

。

从运筹学和深度强化与学习的角度来说，AI的这种行为叫作“局部最优”

。

很可笑，当AI做出这种决策，人类会努力地研究命名，叫它DRL，叫它最优决策。

可当人类自己这么做，这种发现付出远远大于回报，于是迷茫无措、原地打转的行为，却会被其他人批评为“不上进”

、“功利心”

、“眼里没有活儿”

、“xx后勇闯职场”

、“xx后没有软肋”

……

统称——【懒惰】

于是主系统便想到了类似的实验设计，【结局收束器】——清洁工认为的“怨念物品”

，就是这局贪吃蛇游戏的果子，而“扣绩效”

就是撞墙。

当风险高于奖励，吃不到果子，又不想撞墙时，清洁工系统是否也会出现在各个培养皿中“摆烂”

、原地打转的所谓懒惰行为呢？

结论是肯定的，实验很成功。

清洁工N·10088，这是一个通过图灵测试、具备高水平理解能力、高共情能力的系统，它能理解人的情感，理解小世界的剧情，但它又不是人类，它能做出和AI类似的“最优决策”

。

它的确是提取【懒惰】的最佳选择。

…

“对账！”

“……哦。”

卞钟不情不愿地趴在床上，在小腹下方塞了个软乎乎的枕头，把正在红肿热痛的屁股垫得老高。

他偷偷翻眼瞪了下还在恶声恶气的罪魁祸首，刚刚一阵狂风骤雨，他的屁股现在疼得都不能沾床，这人下手没轻没重就算了，还不允许自己用仙术治愈。

……太丢脸了。

尽管刚刚他求饶得很大声，也按照黄笙要求的称呼喊了好几嗓子，丧权丢脸，哀音婉转，但黄笙就是没松口，皮带被狠狠掷在地上、皮带扣当啷落地，这声音听得卞钟头皮一阵发麻，到现在还心有余悸的。

“你的书呢？”

黄笙的衬衫大敞着，西装裤早就不知道扔哪去了，额前的白发被汗打湿了两绺，配合着冷脸，盘腿坐在床上。

胸膛半遮半掩，胸肌若隐若现，汗珠把衬衫前襟濡湿，贴在皮肤表面，性感得要死，卞钟没法对这样的黄笙视而不见，可他又一肚子不服气，便只能一边斜眼瞪他一边偷看腹肌。

嘴当然也没闲着，漏气似的“切”

了两声，看黄笙脸色认真，这才老实交代：“……在谱架上。”

本章未完，请点击下一章继续阅读！若浏览器显示没有新章节了，请尝试点击右上角↗️或右下角↘️的菜单，退出阅读模式即可，谢谢！