Ab initio: 从稍底层到语言学习的两种机制 分享原创

前言:Neko保存着一叠早年修读神经生物学专业课的笔记。在此,Neko谨选择其中关于语言学习机制的部分,结合新的学术结果,抽出适合大众阅读的简单版本。需注意,文中有许多太史公曰内容,系来源被Neko忘掉了或者纯属Neko想象,请保持警惕。感谢chemie的旧文对本文的贡献;感谢sorrysorrysorry先生关于meme的讲解。

在语言学习理论领域,Stephan Krashen 的 Acquisition-learning hypothesis占有相当的地位。它可以简述为,经由学院派方式学习外语的人通常是“学习”一门外语,而儿童学习语言经由"习得"模式。Neko说,她认为习得不仅仅是儿童的专利,因为习得同样使用了基础的联合性学习模式,只不过发生是潜意识的。这并不非常不可思议:目前意识的来源尚不明确,它并不如人们想象的那样由大脑皮层掌控,目前认为与解剖结构上上行网状激活系统——后脑干被盖(rostral brainstem tegmentum)、丘脑和皮层结构有关。清醒与睡眠机制由脑干的蓝斑与中缝核支配。在人类的童年期,人类能够将抽象的声调变化组合规则与人物的动作、神态、步态等信息联系起来,成为母语。假如在这个时期同时让他较系统地接触多门语言,就能够令其成为多语言持有者,Neko认为这反映了人类语言在机制上的共性。统计上,习得能力随着个体年龄增加逐渐下降,基本符合教学一线的反馈认知。

人类先有语言,后有文字,这其实反映出习得是比学习更为基础的能力。我们所认知的世界实际上是我们所感知的世界。Chemie称之为元语言的语素已经是对我们的感知的一种抽象,而数量更庞大或较为抽象的事物,需要将习得的元语言进行一定整合来理解,是抽象概念的集合或者逻辑运算结果。哲学是一个极端的、完全不存在于客观世界的抽象——世界上没有1,有的只有称之为苹果、石头、透镜...的东西,它按照某种规律刺激视锥细胞集群,在视中枢被判断出边缘的位置从而加载出形状,躯体感觉神经元能够度量该物体的反馈从而大致得出重量...所有这些刺激在一起构成了元语言,苹果、石头、透镜...它们被边缘隔开成不打算随意分下去的某个个体,我们就称它们具有属性:数量1。

这个模式对于学习语言也是一样。古希腊人发明了语法,来系统性的记述这个过程。它最初是用古希腊语元语言解释古希腊语抽象语言,后来被引申,任意的对照都是有可能做到的,只要肯接受翻译过程中的、可能比母语更多的信息丢失。语言的细节内容已经发生了很大变化,甚至枝干也发生了流变,衍生出语系、语族、语支。(该过程历史上曾被误认为是地理决定的,但现在我们知道它是种群决定的,而随着种群隔绝被打破,语言的随机突变就能够有影响世界的能力。)

Neko认为,在传播领域,存在易于被习得而不容易被学习的事物,如meme,当然也不止于meme。它们不妨描述为片段化了的抽象概念,常具有多见、模糊、切中欲望等特点。要足够多见,透射电子显微镜没有这个潜质;要够模糊,不能是缺乏解释空间的TECNAI G-20;切中欲望,食、色,等。在不同社群被转译为不同词汇,troll、钓鱼、贩卖焦虑等等。它们之所以不易学习,是因为它们模糊,起始元素和它们的逻辑关系不定。当被注意到后,会大致分为两类:一类对该词汇颇有了解,比如经常有人到办公室给这些人看“巨作”,具有较完善的免疫力。但人是傲慢的经验主义动物:另一类人可以不假思索的、按照原始的习得模式选定某种组合,并付诸实践。更隐秘的傲慢是,假如这样的实践取得理想的效果——这当然是不错的结果——有人就会奉此为圭臬,排斥其他做法。在课堂上可能要被打手心的错误,就这样堂而皇之的被确定下来,甚至可能会被拿来打下一代的手心。同样的“易于被习得而不容易被学习的事物”,对儿童的冲击力更大。我们已经知道希特勒青年团的残暴,批斗父母的红卫兵的冷酷。假如我们试图甩开责任,下一代将会受到威胁。

因此当某“易于被习得而不容易被学习的事物”被看待时,人群整体对他的看法就会形成一个spectrum。当信息耗散速率小于信息传播速率时,它就能够增殖。由于当今人类社会需要的学习时长非常的高,或者说专业化,每个个体能够抵御的“易于被习得而不容易被学习的事物”很可能不能够重叠。这些都会影响spctrum的中值和分布。

Neko认为这还有一些救——个体如能保持谦虚,不要做这些“易于被习得而不容易被学习的事物”的卫道士,就足够让它们停留在玩笑。谣言止于智者,官谣当然也别想例外。五毛捍卫的是自己的无能与物欲;红卫兵捍卫的不是语录,是自己的愚蠢和恐惧。其他理论亦然。

Neko说完了。但她担心的是,说明和曲解边界常常模糊,而在此文中,虽然尽力避免,但使用了类似于常见“易于被习得而不容易被学习的事物”的写作风格,无意识的堆砌了大量名词。请诸君务必加盐再吃,Neko不胜惶恐。

( 由 作者 于 2020年9月20日 编辑 )
9
2020年9月20日 108 次浏览
12 个评论
QUIT
foolish HKFOOL

讲得好清楚。 要求加盐 。 请在评论区补充一些可以被习得或者学习的内容做为参考。

派乐迪
愛牛奶盒的人 你們可不能混瑤哦~

喜歡樓主的文章😯

爱狗却养猫 Reader, Sleeper, Deer lover, Cat feeder, Bun eater

我想到了一个不一定恰当的比喻:有意识的学习和潜意识的习得的关系,就像海上冰山一角与海面下的冰山主体的关系。人是动物,不是机器。对于动物才有宣传、影响、传播学,对于机器只有调试。

另,离题一下,关于人与AI,我有一种假设:AI只能“学习”而无法“习得”(因为没有感知、潜意识等东西),所以不会受杂音干扰,更有效率;但与此同时,也无法拥有真正的创造力。我觉得“创造力”是类似基因突变那样的东西,有那么点“无中生有”的因子(或者说,灵感,Eureka?),需要从感知和潜意识中汲取。人的感知和潜意识,让人vulnerable to manipulation,让人有时显得愚不可及,但也是人智慧的来源。

技术宅
Resistance 编程随想读者|会点IT技术|爱好信息安全|关注隐私保护

说了一堆专业术语,还是没看出来对于一般人学习外语有多大帮助?

( 由 作者 于 2020年9月21日 编辑 )
Neko #ΦωΦ

感谢各位支持!

这个话题Neko酝酿了有两三天,拟定标题时确实只想到了对学外语的帮助。但是苦于写不长:学习外语只要多用就行了-仿照儿童习得语言的模式,简化学习内容的抽象程度,尽量习得而不是学习某门语言。具体来说,不要翻译成母语再翻译成元语言-这个翻译过程太慢了。

接下来就是重复。这个重复不需要很多,2次就够忘不掉了。

@爱狗却养猫 #15336994 好…贴切的比喻。机器的元语言是人给它编好的。它的学习几乎总是在用元语言和自己学到的东西去解释。

不过话说回来,人还是不了解自己的意识究竟为何,当然也就很难编出sentient AI了。万一我这里引用的划分方法只是复杂度的问题呢?毕竟元语言的出现是相当不可考的事,远早于文字出现,人类只能研究其他动物的行为来推测。在解决之前,给自己一点人类专属神秘感,告诉自己还是相当了不得的。

@Neko #15464589 理论上来说如果人能构建类似人的神经系统,模拟类似的环境,sentient AI就可以做到。但这两个问题,哪一个都很难,而且从成本收益来看至少目前人类没有激励去做一个完全类人的AI啊(例如,除了有趣,为什么我要care我的机器人是否会有喜怒哀乐?)。一般应用广泛的AI,都是为了解决某个具体的实用问题的。

@Neko #15462678 Rosetta Stone 这款软件的特色就是【语言习得】。请问你是否用过?

@Resistance #15672225 这个没有。开始研究比较文学那会计算机都还不普遍,现在养成的习惯属于个人摸索的结果。抱歉啦。

@爱狗却养猫 #15534579 不冲突嘛,现在没有动机去做,就算想也很难做就是了-)

完全看不明白。我觉得楼主是个疯狂科学家。

@我们一起学猫叫 #114724 长话短说:

存在即是被感知,但被感知有一定规律可循,好学和准确有一定的冲突。

NEKO不是Mad Scientist!他们只是两只猫;-)

欲参与讨论,请 登录注册

example notif text