2023年3月,openai向公众发布了gpt-4。随后,谷歌发布了一款名为bard的聊天机器人。至此,“openai-微软”组合与“deepmind-谷歌”之间的竞争正式拉开帷幕,它们创造的产品能够以自然的方式与人类聊天,并执行大量基于文本的知识性任务。
马斯克担心,这些聊天机器人和人工智能系统可能会被灌输某种政治思想,甚至可能感染他所谓的“觉醒文化心智病毒”,尤其是这些人工智能还出自微软和谷歌之手,他还担心能够自我学习的人工智能系统可能会对人类产生敌意。如果考虑更直接的潜在影响,马斯克担心聊天机器人会被训练成推特上炮制各类虚假信息、带有意识形态偏见的报道和金融诈骗信息的账号。当然,所有这些坏事都是人类已经在干的,但是如果别有用心的人拥有了这种能力,能部署成千上万个聊天机器人执行邪恶任务,这些问题就会呈指数级地恶化。
马斯克那种想“骑着高头大马冲进去拯救世界”的冲动劲儿又上来了。他觉得openai和谷歌双雄相争,场上需要第三名角斗士登场——一个专注于人工智能安全、致力于保护人类的角斗士。他创立并资助了openai,现在却被排除在这个赛场外,他对此十分不满。人工智能是一场正在全球科技界上空酝酿的巨大风暴,没有人比马斯克更喜欢风暴了。
2023年2月,他邀请了或者说“召唤”了山姆·阿尔特曼到推特同他会面,并要求阿尔特曼带来openai的创始文件。马斯克质疑他,要求他证明自己凭什么能够合法地把一个由捐款资助的非营利组织转变成一个可以赚取数百万美元的营利组织。阿尔特曼试图向马斯克证明这一切都是合法操作,他坚称自己既不是股东也不是套现者。他还向马斯克提供了新公司的股份,但被马斯克拒绝了。
出人意料的是,马斯克对openai和阿尔特曼发起了猛攻。他说:“openai是作为一家开源的(这也是我将其命名为‘open'ai的原因)、非营利性的公司创建的,其目的就是与谷歌抗衡,现在它却成了一家封闭源代码、追求利润最大化的公司,实际上处于微软的控制之下。我到现在都不明白,我捐赠了1亿美元创办的非营利性组织是怎么变成市值300亿美元的营利性公司的。如果这是合法的,为什么大家不都这么做呢?”他称人工智能是“人类有史以来创造过的最强大的工具”,随后对它“如今落入了无情的垄断企业之手的境遇”表示遗憾。
阿尔特曼很痛苦,与马斯克不同,他是一个非常敏感的人,而不是一个愿意针尖对麦芒的人。他没有从openai中赚到任何钱,而且他认为马斯克对人工智能安全问题的复杂性钻研得还不够,不过他确实认为马斯克的批评是发自内心的担忧。阿尔特曼告诉科技记者卡拉·斯维什尔:“他是个浑蛋,我俩行事风格真的很不一样,我不想要他那种风格。但我认为他真的很关心这件事,他对人类的未来处境感到焦虑不安。”
马斯克的数据流
喂养人工智能,靠的是数据。新诞生的这些聊天机器人正在接受海量信息的训练,包括互联网上的数十亿个网页和其他文档。谷歌和微软拥有搜索引擎、云服务和电子邮箱,他们手头有大量的数据可以帮他们训练这些系统。
马斯克能给这场战局带来什么呢?马斯克坐拥的一大数据资产是推特的信息流,其中包括多年来所有人发布的超过1万亿条推文,还有每天新增的5亿条。它是人类集体意识的体现,是世界上更新最及时的数据集,包含了现实生活中人类的各种对话、新闻、兴趣、趋势、争论和术语。此外,它还是一个很好的训练场,可以让聊天机器人测试真人对其回复做出的反应。马斯克在收购推特时并没有考虑到这些数据的价值,他说:“实际上这算是一个附带的好处,我是在买下推特以后才意识到的。”
推特曾经零零星星地允许其他一些公司使用这些数据流。2023年1月,马斯克在推特会议室召开了一系列深夜会议,研究如何针对这项服务收费的问题。他对工程师们说:“这是一个将推特数据集变现的好机会。”而且能限制谷歌和微软使用这些数据改进自家的人工智能聊天机器人。
马斯克还拥有另一个数据宝库:特斯拉每天从自家车辆上的摄像头接收并处理的1 600亿帧视频画面。这些数据不同于为聊天机器人提供信息的文本文件,这是人类在真实世界中导航的视频数据,它有助于为实体机器人打造人工智能系统,而不再是只能生成文本的聊天机器人。