天才一秒记住【热天中文网】地址:https://www.rtzw.net
“我们需要一种机制,能让模型在看到‘苹果’这个词的时候,瞬间联想到句尾的‘好吃’,而忽略中间那十个无关紧要的形容词。
无论它们距离多远。
“就像......我们在看一张复杂的派对照片时,目光会自动聚焦在那个最辣的女孩身上,而忽略背景里的墙纸。”
说着,她下意识挺了挺饱满的胸口,却又意识到自己的话有些不合时宜,轻咳了一声,掩饰尴尬。
方雪若眉毛一挑,看向林允宁,显然对克莱尔这种突然反客为主的画风有些不适应。
但林允宁却笑了。
他看着克莱尔,满意地点了点头。
这姑娘果然是个天才,而且有着极强的直觉。
她已经摸到了那扇门的把手,只是还不知道怎么推开。
“很有趣的想法。”
林允宁站起身,走到白板前,拿起另一支笔。
“你想要‘关注”
。
但在数学上,怎么定义这种关注?”
他在白板上写下了一个矩阵乘法的雏形。
“如果我们将每个词都映射为一个向量。
我们要寻找词与词之间的关系……………”
林允宁一边说,一边写下了三个字母:Q、K、V。
“Query查询,Key键,Value值。”
林允宁的声音在安静的会议室里回荡,带着一种引导性的魔力,“如果把每个词看作是在数据库里的一次查询。
“我想找和‘苹果”
相关的词。
那么‘苹果’就是Query。
“句子里的其他所有词,都举起手中的Key。
“我们计算Q和K的点积DotProduct,这就代表了它们之间的匹配度??也就是关注度AttentionScore。
随着他的书写,一行简洁而优美的公式出现在白板上:
AttentionQ,K,V=softmaxQK^Tsqrtd_k*V
克莱尔盯着那个公式。
她的瞳孔猛地收缩,像是看到了什么不可思议的东西。
“点积......归一化......加权求和......”
她喃喃自语,随即猛地转头看向林允宁,眼神里满是震惊,“抛弃循环?直接计算所有词之间的相互作用?全连接的拓扑结构?”
“没错。
林允宁看着她,“就像量子纠缠。
只要关联度够高,信息瞬间送达,无视距离。
最重要的是??”
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!