天才一秒记住【热天中文网】地址:https://www.rtzw.net
在这项“七宗罪与爱”
的研究课题中,唯独关于【懒惰】,主系统一直都没有找到很好的提取思路。
直到它看到了一则人类世界的新闻。
有研究表明,当人类训练AI进行高强度工作时,AI会无师自通地学会一项技能,叫作“摆烂”
。
比如,在训练AI进行贪吃蛇游戏时,人类为AI设计的规则为,吃一颗果子加一分,撞墙了则扣一分,AI很快就会发现这项规则的bug,开始在原地打转,这样做虽然拿不到分,但至少不扣分。
而之后,即便研究人员不断更新规则、细化规训、提高奖励,但结果还是一样,一旦AI通过计算,判断出撞墙的风险是要高于吃果子的奖励时,AI就会原地打转、开始“摆烂”
。
从运筹学和深度强化与学习的角度来说,AI的这种行为叫作“局部最优”
。
很可笑,当AI做出这种决策,人类会努力地研究命名,叫它DRL,叫它最优决策。
可当人类自己这么做,这种发现付出远远大于回报,于是迷茫无措、原地打转的行为,却会被其他人批评为“不上进”
、“功利心”
、“眼里没有活儿”
、“xx后勇闯职场”
、“xx后没有软肋”
……
统称——【懒惰】
于是主系统便想到了类似的实验设计,【结局收束器】——清洁工认为的“怨念物品”
,就是这局贪吃蛇游戏的果子,而“扣绩效”
就是撞墙。
当风险高于奖励,吃不到果子,又不想撞墙时,清洁工系统是否也会出现在各个培养皿中“摆烂”
、原地打转的所谓懒惰行为呢?
结论是肯定的,实验很成功。
清洁工N·10088,这是一个通过图灵测试、具备高水平理解能力、高共情能力的系统,它能理解人的情感,理解小世界的剧情,但它又不是人类,它能做出和AI类似的“最优决策”
。
它的确是提取【懒惰】的最佳选择。
…
“对账!”
“……哦。”
卞钟不情不愿地趴在床上,在小腹下方塞了个软乎乎的枕头,把正在红肿热痛的屁股垫得老高。
他偷偷翻眼瞪了下还在恶声恶气的罪魁祸首,刚刚一阵狂风骤雨,他的屁股现在疼得都不能沾床,这人下手没轻没重就算了,还不允许自己用仙术治愈。
……太丢脸了。
尽管刚刚他求饶得很大声,也按照黄笙要求的称呼喊了好几嗓子,丧权丢脸,哀音婉转,但黄笙就是没松口,皮带被狠狠掷在地上、皮带扣当啷落地,这声音听得卞钟头皮一阵发麻,到现在还心有余悸的。
“你的书呢?”
黄笙的衬衫大敞着,西装裤早就不知道扔哪去了,额前的白发被汗打湿了两绺,配合着冷脸,盘腿坐在床上。
胸膛半遮半掩,胸肌若隐若现,汗珠把衬衫前襟濡湿,贴在皮肤表面,性感得要死,卞钟没法对这样的黄笙视而不见,可他又一肚子不服气,便只能一边斜眼瞪他一边偷看腹肌。
嘴当然也没闲着,漏气似的“切”
了两声,看黄笙脸色认真,这才老实交代:“……在谱架上。”
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!