参考消息网4月24日报道 英国《泰晤士报》网站4月22日刊发一篇文章,题为《教育型人工智能聊天机器人将引发教科书革命》,作者是丹尼·福特森。文章摘编如下:
徐道辉被“冷处理”已经有几周时间了。此前,这名密歇根州立大学教授、人工智能(AI)初创企业超级聚焦公司的创始人安排了一场会晤,对方是一家世界顶级教科书出版商的老板。
超级聚焦公司开发了一款聊天机器人,利用这家出版商的一本畅销教材进行训练。在被“投喂”了几乎每一页内容之后,这款机器人模型高分通过测验,从而提升了开发新一代AI“学习伙伴”的可能性,这种“学习伙伴”将成为单一学科的专家。
徐道辉回忆说:“我们说,‘我们考虑只针对10个最常见的高中或大学学科发布这种学习伙伴’。然后,他们切断了与我们的沟通。”
在各式“生成式AI”产品纷纷发布之际,超级聚焦公司的尝试代表了这项技术又一个惊人的潜在用途。但这也让这家初创公司置身AI领域几个关键战场的核心。哪些信息可以用来训练这些模型?AI开发人员是否应该向出版商支付版税,以便获取至关重要的数据?
看看世界顶级教科书出版商之一培生集团的例子。当被问及如何看待第三方利用培生集团的材料创建“AI教师”时,首席执行官安迪·伯德明确表示:“我怀疑这会给我们带来问题。”
伯德表示,培生集团计划“迎接”AI教育革命,但补充说:“这并不意味着一切免费。你得从……尊重知识产权和版权做起。”
各种“生成式AI”工具的工作原理相同,都被喂以大量数据。然后,这些模型的核心算法在得到提示后,利用所有训练数据为特定问题提供最可信的“答案”。推动生成这些答案的功能实际上是一种经过高度训练的猜测,即根据数十亿个句子猜测一个句子中接下来最有可能出现的单词。
如果问超级聚焦公司的“学习伙伴”美国第23任总统是谁以及他的标志性政策是什么,答案不会简单重复它被训练时使用的教科书内容,而是基于其所包含的数据得出的新答案。换句话说,这将是一个人类教师可能提供的服务。
显然,出版商并不认同AI支持者的观点。关键问题涉及一个被称为“合理使用”的法律原则,即允许个人或公司在特定情况下无需获得许可也能使用受版权保护的材料。合理使用的界线是模糊的。法官考虑的因素包括对原作品的使用是否会使其大幅贬值,以及原作品中有多少用于创造新作品。
考虑到技术进步的速度,这是一个至关重要的问题。未来,每个人都可能拥有一个随时可以使用的智能手机版“口袋天才”,可以解答几乎任何问题、写论文或创造艺术。
在可能由此引发的混乱中,教育首当其冲。但这里存在一个限制因素。像ChatGPT(聊天生成预训练转换器)这样的大型语言模型经常“真假不分”:它们本身并不具备知识,而是在对一个问题的答案进行猜测。结果是,它们常常捏造事实,并且十分自信地陈述事实。
超级聚焦公司认为它可以克服这个问题,方法是让AI工具产生“记忆”,这种记忆只包括有限的、人们想要的材料——例如一家公司的客户服务手册或一本美国历史书——然后把答案限制在这个知识基础上。
这一理念能否站稳脚跟是一个悬而未决的问题,但显而易见的是,教育正在迅速发生变化,从业者正在争相调整。
伯德说:“‘把头埋进沙子里’是行不通的,因为这是现实。它正在发生,而且我认为其速度超乎所有人的预料。”