为什么网上喷子那么多,戾气那么大?
Posted | stderr
记录一些最近的胡思乱想。为什么网上喷子那么多,戾气那么大?
这个问题,按照常规的解释,原因是喷子们逻辑谬误,论证滑坡,不能就事论事,喜欢搞人身攻击。
那么怎么样才能做到「就事论事」呢?现在而今眼目下,我有一个偏激的 opinion:人类越来越不可能就事论事了。原因需要从一个分类开始说起:人类的语言越来越分为三种用途:
Ⅰ. 人和人的情感交流和情绪模拟需要
Ⅱ. 人对周边「事」的描述的需要
Ⅲ. 语言是知识存储和运输的介质
下面倒序分开讨论:
Ⅲ. 语言就是知识
一个人掌握的绝大部分知识,都是 declarative knowledge。比如法国首都在哪里?巴黎;水分子由什么原子构成?H₂ 和 O。这些东西无一例外都得通过语言来存储和传输。现代学科高度发达,甚至有很多通用语言之外的专用语言也被发明和使用:
- 肢体语言、手语等
- 数学语言,mathematical notation
- 计算机编程语言
- 逻辑符号
- 物理、化学、生物公式,医用术语等
如果说「理性」的世界是由人类特有的「因果」推演建立起来的,那么我们可以说,无法被语言描述的知识不存在。语言是知识存储和运输的唯一介质。即便有人发明/发现了语言无法描述的知识,那么也只能由他一个人知道不能传播或继承所以权且当它不存在。
我们甚至可以抛出一个暴论,事物都是能被理解,才能称为事物(Was vernünftig ist, das ist wirklich)。能合理推演出来的假设,必定也可以成为对应的事物。(und was wirklich ist, das ist vernünftig)
当然某些知识,已经快超过人类语言能力天花板了。比如 coq
证明的四色定理,人只能说程序验证了没错,至于证明过程没人能看懂。
Ⅱ. 对「事」的描述
语言难以描述单又很重要、常见事物有:
- 图像。比如照片、一幅画、图表、符号。所谓一图胜千言,有的时候很难用语言描述
- 动作或者运动的过程。属于procedure,非declarative的 know-how。比如弹钢琴,骑自行车。你即便能用语言把所有关于乐理、演奏的技巧讲给别人,别人如果不亲自练,还是不会。
- 直接体验。比如气味,振动等。比如火不能用手摸,石头砸到脚会痛。只有亲身的教训才够深刻
其中,「音乐」语言也被发明了出来,用来描述特定的节奏和声波。「语言」在如今的世界甚至已经脱离了文字的范式,变得非常抽象,比如 视觉语言(VI) 和 设计语言(design language)。这里和分类Ⅲ 分开讨论,是因为图片和感性的东西很难被语音/文字序列化。
Ⅰ. 对「情绪」的传递
实际上,前面对「语言」的讨论,都是经过「感官」作为 IO 接口的。主要就 手+眼睛 和 嘴+耳朵这两对渠道。但是人是个复杂生物,它有更高级的需要——精神追求。人被社会定义,需要认同;人对其他人和世界需要一个 好/坏 的基本判断。具体到网络上讨论,情绪交换无非就是两性关系和时政辩经。其中键政又以军事和国家大政为主。这些都是情绪 AOE 的重灾区,此类话题是喷子的 natural habitat(我本人也不能免俗)
自然语言史
说完语言的用处三个分类,思考一个问题:人类为什么发明语言?普遍的理由说一开始是为了觅食,比如采集和狩猎,为了描述动植物和位置。其次最重要的是「讲故事」
随着口头语言的成熟,人类还发明文字和书写,主要为了服务三个方面:巫医占卜祭祀,所有权归属和交易。
社会分工出现后,「自然」语言对「知识」和「事」的描述的功能已经被剥离了。最古老的人类需求已经高度专业分化了:
- 采集和狩猎用的语言退化为美食语言。为了填肚子,所有人不得不工作才能生存。工作的语言是高度异化的。行业的黑话外行根本不懂。说起这个,英语教育有个滑稽的问题。绝大部分大学生毕业了去国外发现对食物的名字和菜单一脸懵逼。可见现代语言教育有多么的离谱,脱离了最根本和基础的生理需要。
- 描述环境和地理,被高科技快速替代。以前出个远门是真的冒险,还得规划线路,按照旅行手册向陌生人问路。现在都是手机导航、点评和 guide。这方面人类语言能力被工具代替。
- 古人类围着篝火讲故事,被丰富的影视娱乐工业代替。
- 巫医占卜祭祀,被分化成多个职业。医生的语言,比如医嘱普通人压根看不懂。占卜被打成封建迷信,人们只能按照媒体对行业进行预测,祭祀就是政治活动,党八股也需要释经。所有权归属被法律语言确定,交易是由一套复杂的金融和物流体系决定。
不知道读到这里,你发现没有,人类语言在我这里分类 Ⅲ、Ⅱ 里的应用已经高度职业化、工业化了。那么结论是显而易见的:
人类传统意义上自然形成的语言,在业余生活中只剩下一种主要作用:Ⅰ. 情绪输出。
回答开头的问题
如果需要进一步阐述这个观点的话,那就是「客观」的语言应用,已经各行各业成熟改造了。各个文明留给祖传语言残留的功能,就是按照文化驱动的「主观」观点释放。
网上为什么喷子那么多?工作上的语言都是毕恭毕敬,专业领域的东西你一般没耐心看。非专业的内容,只剩下情绪。完毕
AI 和 未来
喷子的问题撸完了,突然想起我之前我一个疑惑:
为什么 NLP 里 sentiment analysis 那么流行?
作为野生业余NLP爱好者,我对这个领域第一入门印象就是情感分析,训练一个 classifier 看这句话到底是正面还是负面;说实话我第一次知道这个是比较意外的,因为我下意识觉得「正能量」和「负能量」是一个主观的东西,而且人类喜欢正话反说,阴阳怪气,很难分析准确。特别是那种话中有话的隐喻。作为外行的我原本以为 NLP 是用来提取「信息」和「情报」的学问,没想到只是政企用这个技术来扫言论是不是好评~市场用它来分析韭菜是否有乐观或悲观的预期。当然,情感分析这个问题很常见还因为技术上它是一个经典的监督学习+语聊搜集的案例,而且结果比较好。
chatgpt/gpt-4 这类工具的出现给我启发,一个来自《复现ChatGPT的难点与平替》
把训模型当作带孩子:
1. Pretrain:在孩子0-3岁的时候,我们没法讲太多道理,他也听不懂,更多的是让他自己观察这个世界,自由学习。
2. Instruction Tuning:孩子学会说话了,也对世界有了基本认知,我们就可以开始通过示范教他一些东西,比如怎么穿衣服、怎么刷牙。
3. RLHF:等孩子再大点,很多事情都会了,便不会再完全模仿父母,而是有自己不一样的行为,这时候父母就需要对这些不可预料的行为给出反馈,在他取得好成绩时奖励,在做坏事后惩罚。
结合语言的 Ⅰ Ⅱ Ⅲ 分类,或许 AI 可以被用来解决网上戾气太重的问题,弄出不一样的玩法。毕竟情绪价值是暂时的,语言作为知识的价值是长久的。但是别忘了, 情绪是达成长久价值的重要途经。人类必须基于道德和上下文作出恰到好处的选择。
注
本文无任何学术理论支撑,纯粹个人胡思乱想。如有谬误纯属正常。完结于 2023-03-26 02:07:08
Comments