天才一秒记住【热天中文网】地址:https://www.rtzw.net
伴随系统提示音落下,一股关于文本分析的庞大信息流,便径直涌入沈庭的脑海。
文本分析的核心框架与技法,大致分为三个部分:
首先是书面语言分析,聚焦于“用语习惯”
。
每个人的用词遣句,都有着自身的独特性。
这与地域、职业、教育背景、文化熏陶乃至时代特征息息相关。
分析文本中反复出现的特色词汇、非常规搭配、特定领域的术语或黑话,甚至语法结构的偏好,就能逆向推断出书写者的成长环境、可能籍贯、从事的职业或长期沉浸的亚文化圈。
比如,频繁使用“俺”
、“咱”
自称,可能指向北方某些方言区。
习惯用“啥”
代替“什么”
,也有其地域倾向。
某些特殊的儿化音运用,如“这人儿”
,同样可以成为线索。
而文本中,如果出现了“账户对冲”
、“杠杆比率”
、“量化宽松”
等术语,那么书写者很可能从事金融或相关行业。
若满是计算机代码缩写或网络黑客俚语,背景自然指向计算机领域。
其次,是文字布局与格式分析,也称为“空间表达”
。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!