当前位置:首页 > 人物传记 > 《埃隆·马斯克传》 > 正文 93 车用人工智慧:2022至2023年,实现新里程碑

93 车用人工智慧:2022至2023年,实现新里程碑

车用人工智慧

2022至2023年,实现新里程碑

让自动驾驶汽车像人一样思考

「它就和ChatGPT一样,只不过是给汽车使用,」自动辅助驾驶团队成员什罗夫对马斯克说。他将自己在特斯拉的专案,拿来与OpenAI新推出的人工智慧聊天机器人做比较。OpenAI是马斯克和奥特曼在2015年共同创立的实验室。马斯克花费将近十年的时间,开发各种不同形式的人工智慧,包括自动驾驶车、机器人Optimus、脑机介面Neuralink等。什罗夫的专案主要是开发最先进的机器学习技术,也就是设计能够学习人类行为的自动驾驶系统,他说:「我们处理了大量资料,都是关于真实人类如何应对复杂的驾驶情境,然后训练电脑神经网路模仿人类的行为。」

什罗夫偶尔会加入三剑客詹姆斯、安德鲁及诺迪恩的行列,组成四剑客。马斯克要求和什罗夫见面,想说服他离开特斯拉自动辅助驾驶团队,去推特工作。但什罗夫想留在特斯拉,他希望说服马斯克相信,自己负责的专案对特斯拉甚至整个世界来说,都非常重要。他将提出的新技术称为「神经网路路径规划器」(neural network path planner),将赋予特斯拉的自动驾驶软体「向人类学习」的能力。

他们两人预定在2022年12月2日周五会面,实际上马斯克当天的行程早已爆满,只能硬塞进去。那一天,也是独立记者泰比预计发表第一批推特文件的日子。当天早上,什罗夫依马斯克的要求抵达推特总部,马斯克刚参加完电动皮卡Cybertruck发表会,从内华达赶回来。他向什罗夫道歉,表示自己忘记要飞到纽奥良和法国总统马克宏见面,讨论欧洲的内容审核规范。他请什罗夫当天傍晚再回来。当马斯克等待与马克宏会面时,传简讯给什罗夫,再度要求延后会面时间。他在某个时间点写道:「我会迟到四个小时,你愿意等我吗?」但就在同一个时间,他又突如其来地传简讯给独立记者维斯夫妇,请他们当晚飞到旧金山与他会面,协助处理推特文件。

当天深夜,马斯克回到旧金山,终于有机会坐下来与什罗夫谈一谈。什罗夫解释,他正在开发的神经网路路径规划器专案细节。「我认为,让我继续进行目前的工作,真的超重要。」什罗夫说。马斯克听了他的说明之后,再度燃起对这个专案的热情,也认同什罗夫的说法。他明白,未来特斯拉不只是一家汽车公司,也不只是一家干净能源公司。如果能整合全自动辅助驾驶、Optimus机器人与Dojo机器学习超级电脑,它将会成为一家人工智慧公司,不仅能透过聊天机器人在虚拟世界运作,也能在实体工厂与道路上运作。他早已在考虑雇用一批人工智慧专家,与OpenAI正面对决,特斯拉的神经网路路径规划团队将能补足他们的工作。

多年来,特斯拉的自动辅助驾驶系统一向采取规则基准法(rule-based approach)。系统由摄影机取得视觉资料,辨识车道标线、行人、车辆、交通号志等各种标的,以及八台摄影机可拍到的任何物件。接着,软体会依据一套规则运作,例如:红灯亮时要停车,绿灯亮时要开车;保持在车道标线中间;不能跨越双黄线驶进对向车道;只在任何车辆的速度都不足以撞到你时,才通过路口等等。特斯拉工程师手动撰写和更新数十万行C++程式码,将这些规则应用在各种复杂情境中。

什罗夫正在开发的神经网路路径规划器专案,可为软体增加新能力。「汽车不再只是根据规则决定适合的路径,」什罗夫说,「还会倚赖神经网路,而神经网路是根据数百万个人类行为的案例进行学习。」换句话说,神经网路会模仿人类。每当面对某个情境,神经网路会依据人类在成千上万种类似情境中的行为,选择其中一条路径。就和人类学习说话、开车、下棋、吃义大利面和几乎其他所有事情一样,我们或许会遵循某套既定规则,但多数时候,我们都是观察其他人怎么做才渐渐学会技能。这是电脑科学之父图灵在1950年发表的〈计算机与智慧〉论文中,设想的机器学习方法。

特斯拉拥有全球名列前茅的强大超级电脑,用来训练神经网路,里面采用的是晶片大厂辉达(Nvidia)设计的图形处理器(GPU)。马斯克的目标是在2023年改用Dojo,也就是特斯拉从零打造的超级电脑,以视觉资料训练人工智慧系统。Dojo用的晶片与基础设备全都是特斯拉人工智慧团队自行设计,运算效能高达约8 exaflops(一个exaflops为每秒百万兆次浮点运算),是全球性能最强大的人工智慧超级电脑之一。这台超级电脑将可用来训练自动驾驶软体及Optimus机器人。「能够同时训练它们真的很有趣,就好像它们正在努力探索世界。」马斯克说。

到了2023年初,神经网路路径规划器专案已经分析了从特斯拉顾客车上取得的1,000万幅影片画面。这是不是表示系统的表现只能达到一般人类驾驶的平均水准?「不是,因为我们只用了人类成功应对某个情境的资料。」什罗夫解释。人类标记员会评估所有影像画面,然后给予评分;许多标记员的工作地点在纽约水牛城。马斯克告诉他们,找出「Uber五星驾驶会采取的行动」,然后利用这些影片训练电脑。

马斯克会定期巡视特斯拉位在帕罗奥图的办公大楼,自动辅助驾驶团队就在其中一个开放空间工作。他会蹲跪在一旁,即兴地讨论。有一天,什罗夫向马斯克展示他们最新的开发进度。马斯克觉得很不错,但有个问题:真的需要采用这个新方法吗?会不会有点过头?他有个座右铭:绝不用巡弋飞弹宰杀苍蝇,用苍蝇拍就够了。使用神经网路规划路径,只为了应付少数不太可能发生的极端情况,是否过度复杂而没有必要?

什罗夫向马斯克展示,在哪些情况下,神经网路的表现会优于规则基准法。在一个模拟情境中,道路上散布着垃圾箱、掉落的交通锥,以及任意丢弃的垃圾。由神经网路路径规划器引导的汽车,在必要时会打破某些规则,跨越车道线,借此避开障碍物。「当我们从规则转为神经网路时,就能做到这一点,」什罗夫对马斯克说,「如果使用神经网路,汽车永远不会撞到任何东西,即使是在混乱的情境下。」

每次看到类似的技术大跃进,马斯克就会变得异常的兴奋。「我们应该举办一场詹姆斯。庞德风格的展示会。四周炸弹全部爆炸,幽浮从天而降,然后我们的汽车疾驶而过,完全没撞到任何东西。」他说。

机器学习系统在自行训练时,通常需要有目标或指标做为引导。马斯克偏爱的管理方法,正好是直接指定哪些指标最重要。他告诉团队的指标是:使用特斯拉全自动辅助驾驶的汽车,在没有人为干预下的行驶里程。「我希望每次开会时,第一张投影片能够显示最新的无人为干预里程数,」他下令,「当我们训练人工智慧时,要优化的目标是什么?答案是提高两次人为干预之间的里程数。」他告诉他们,要和电玩游戏一样,让玩家每天都可以看到分数,「看不到分数的电玩游戏很无聊。如果每天都能看到无人为干预的里程数持续增加,会让大家更有动力。」

于是团队成员在工作空间安装了几台巨大的85吋电视萤幕,即时显示全自动辅助驾驶汽车在不受人为干预的情况下,平均可行驶多少里程数。每当他们看到某种类型的干预行为反复发生,例如驾驶在变换车道、车道合并或转进复杂路口时,握住了方向盘,他们就会同时启用规则及神经网路路径规划器,试着解决问题。他们在办公区摆了一面铜锣,每当成功解决人为干预的问题时,就敲锣庆祝。

人工智慧的应变反应比真人更好

2023年4月中,马斯克决定测试新的神经网路路径规划器,让电动车在帕罗奥图市区绕行。什罗夫和自动辅助驾驶团队已经装配好一台车,其中的自动驾驶软体接受过神经网路训练,有能力模仿人类驾驶的行为。在这个软体里,遵循规则基准法的传统程式码占比非常低。

马斯克坐在驾驶座,旁边坐着的是自动辅助驾驶软体总监亚索克。艾鲁斯瓦米(Ashok Elluswamy)。什罗夫与其他两位团队成员麦特。鲍赫(Matt Bauch)及克里斯。佩恩(Chris Payne)坐在后座,他们三人已在特斯拉工作了八年,办公桌彼此相邻,都住在旧金山,住所仅相隔几个街区。多数人的办公桌都会放上家人相片,他们三人的办公桌却放着同一张照片:三人在万圣夜派对上的合影。詹姆斯在马斯克收购推特、徵调他去那里工作之前,曾是这个团队的第四名成员,什罗夫一直避免自己落入和詹姆斯相同的命运。

在他们离开特斯拉帕罗奥图办公园区的停车场时,马斯克在地图上选定了电动车行驶的目的地、点击全自动辅助驾驶,然后双手离开方向盘。当电动车驶入主要干道时,立即面临第一个可怕的挑战:一台单车正朝向他们而来。「我们所有人屏住呼吸,因为骑单车的人会怎么反应很难预料,」什罗夫说。但是马斯克一点也不在意,也没有把手放回方向盘。结果这台车自动礼让单车先行。「完全是真人驾驶会采取的做法,」什罗夫说。

什罗夫和他的两位团队成员开始详细解说,他们如何从顾客车上的摄影机搜集数百万支影片片段,才训练出车上的全自动辅助驾驶软体。相较于以人工撰写程式、设定数千条规则的传统软体,新软体的架构简单许多。「它的运作速度快了10倍,而且最后可删除30万行程式码。」什罗夫说。鲍赫表示,这就好比人工智慧机器人在玩某种极其无聊的电玩游戏。马斯克听了,扑哧笑了出来。电动车继续在车流中自行向前行驶,马斯克拿出他的手机,开始发送推文。

电动车行驶了25分钟,经过大街小巷,完成复杂的转弯,成功避开单车、行人和宠物。行驶过程中,马斯克完全没有碰触方向盘,只有几次去踩油门,因为他觉得这台车过度谨慎,例如:在四向停车号志前过度遵守规则。 电动车一度采取的应变行动,甚至让马斯克觉得比自己可能做出的反应更好。他说:「哇,太棒了,即使是我的人类神经网络,都可能反应不过来,但是这台车做对了。」他实在太开心了,开始用口哨吹着莫札特的G大调〈小夜曲〉。

拥有两大即时资料库

马斯克对在场的所有人说:「各位做得太棒了,真的非常了不起。」接着,所有人一起参加自动辅助驾驶团队的周会,20名成员几乎全穿着黑色T恤,围着会议桌而坐,聆听最后的裁决。许多人原本不相信神经网路专案能成功。马斯克宣布,现在他相信了,他们应该投入大量资源,继续推动这项专案。

讨论过程中,马斯克抓住了团队发现的一个关键要点:神经网路必须接受至少100万支影片片段的训练,才能运作顺畅,如果超过150万支,则会表现得非常优异。这意味着相较于其他车厂与人工智慧企业,特斯拉拥有极大的竞争优势。因为特斯拉每天可从全球将近200万台的电动车上,搜集到数十亿幅影片画面。「在这点上,我们占有独一无二的地位。」自动辅助驾驶软体总监艾鲁斯瓦米在会议上说。

不论是开发哪种形式的人工智慧,从自动驾驶汽车到Optimus机器人,以及类似ChatGPT的机器人程式,都必须具备搜集与分析大量即时资料的能力。现在,马斯克已拥有两个强大的即时资料库:自动驾驶车的影片,以及推特平台上每周高达数十亿则的推文。会中他告诉自动辅助驾驶团队,刚完成一笔重要采购案,是为推特添购了上万个GPU晶片。他同时宣布未来将增加开会频率,讨论特斯拉正在设计中的Dojo晶片,Dojo晶片可望展现更强大的效能。他也懊悔地承认,不该在圣诞节期间,冲动地关闭推特位于沙加缅度的资料中心。

当天在会议中参与旁听的,有位人工智慧领域的超级明星工程师。马斯克当周才把他挖角过来,参与即将推出的秘密专案。

* * *

1 所有车辆在通过交叉口时,必须先停车,确认安全后再开车。