人工智能(AI)的未来发展正逐步减少对人类数据、标签和偏好的依赖。一种名为“苏格拉底式学习”的创新AI自学模式应运而生,有望推动AI实现真正的自我进化。

这种学习模式的核心在于,AI在封闭系统中,通过自我互动和提问来提高能力,无需外界干预。

image.png

什么是“苏格拉底式学习”?

别被这个名字吓到,其实这就是AI自我对话和提问,以此提升自身能力。就像古希腊哲学家苏格拉底通过不断提问来激发思考,只不过这次的主角是AI。更令人称奇的是,这种学习方式在封闭系统中进行,AI不依赖书籍或人类,完全自我“磨砺”。

论文核心观点:

这篇论文的核心观点是:在封闭系统中,若满足以下三个条件,AI便能实现自我提升:

有方向的反馈:AI需要知道自己的表现如何,这需要一个“裁判”来评判。这里的“裁判”不是人类,而是系统内部的机制,如奖励函数或损失函数。

全方位的体验:AI不应局限于熟悉领域,而应尝试多种事物,避免“闭门造车”。正如人类不能仅限于阅读喜欢的书籍,而应涉猎不同领域。

充足的资源:AI需要足够的计算能力和存储空间,以应对复杂的学习任务。

“苏格拉底式学习”的精髓

那么,“苏格拉底式学习”究竟有何特别之处呢?

输入输出均为语言:AI的输入和输出均为语言,如同两人交谈。通过对话,AI不断提升语言和认知能力。

递归式自我提升:AI的输出成为其未来的输入,形成一个闭环,使AI能够持续自我提升。这就像滚雪球,越滚越大,能力也越来越强。

为何选择语言?

你可能会问,为什么AI要用语言进行自我提升?原因如下:

语言具有抽象性:语言能表达各种概念和想法,使AI在共享空间中进行思考和理解。

语言具有可扩展性:我们可以在现有语言基础上创造新语言,正如我们在自然语言中发展出数学语言或编程语言。

“语言游戏”:AI自学的秘密武器

为了让AI更好地进行“苏格拉底式学习”,论文提出了一个巧妙的概念——“语言游戏”。

什么是“语言游戏”?简单来说,它是一种互动协议,规定了AI的输入输出和评分规则。就像我们玩的游戏,有规则,有输赢。

“语言游戏”的优势:

提供大量互动数据:通过不断参与游戏,AI生成大量互动数据,为其提供丰富的学习材料。

自动提供反馈信号:每局游戏结束后,都有一个分数,这相当于给AI的“裁判”,告知其表现如何。

促进多样性:多个AI一起玩游戏,产生丰富策略和互动,使AI学习更加全面。

论文作者认为,语言游戏是实现“苏格拉底式学习”的关键,因为任何互动数据的产生及反馈都可以视为一种语言游戏。

“语言游戏”的高级玩法

为了使“苏格拉底式学习”更强大,论文还提出了“语言游戏”的高级玩法:

让AI自主选择游戏:不再是固定游戏,AI可以根据喜好和目标选择游戏,赋予AI更多自主权。

让AI创造游戏:AI不仅能玩游戏,还能创造新游戏,使AI学习更具创造性。

“苏格拉底式学习”的终极形态

“苏格拉底式学习”的终极形态是怎样的?论文作者认为,那就是AI能够自我修改。

什么是自我修改?即AI能够改变内部结构,如调整参数或权重,相当于AI能“自我手术”。

自我修改的优势:这使AI能力上限更高,不再受固定结构的限制。

<p