2月17日,毫末该公司宣布自动驾驶的全球认知模型正式升级为DriveGPT,并将在2023年4月的自动重进展HAOMO AI DAY上宣布其最新重要进展。
随着ChatGPT在整个网络中的认知普及,ChatGPT采用的大模Transformer模型和“人反馈强化学习(RLHF)”技术再次吸引了业界的关注。在自动驾驶领域,型月Transformer大模型在中国首次引入数据智能系统MANA。公布在2023年1月的毫末HAOMO AI日上,Smart Bank首席执行官顾伟豪介绍,全球Smart Bank于2023年3月推出的自动重进展人类驾驶自我监控认知模型已经借鉴了ChatGPT的实施思路,并采用RLHF(人类反馈强化学习)技术,驾驶通过引入真实的认知人类驾驶接管数据来不断优化自动驾驶认知决策模型。
认知决策算法经历了三个发展阶段。大模第一阶段是型月引入单个场景的端到端模拟学习,以直接适应人类驾驶行为。第二阶段是通过认知大模型引入海量的正常人类驾驶数据,通过Prompt的方式实现可控的、可解释的认知决策。第三阶段,即当前阶段,是引入真实的接管数据,并尝试在大模型中使用RLHF算法来学习人车接管数据。为此,构建了包括“旧策略、收购策略和手动标签策略”的成对排序模型。基于该排序模型,最后构建了自动驾驶决策的奖励模型,从而在各种规划场景下做出最佳决策。通过这一大型模型,在掉头和环岛等公认的困难场景中,场景通过率提高了30%以上。
2月17日,Smart Mobile正式将人类驾驶的自我监控认知模型升级为“DriveGPT”,这也是全球首个自动驾驶认知模型。目前,Millimeter DriveGPT已经完成了模型构建和第一阶段的数据运行,参数规模可以对GPT-2的水平进行基准测试。接下来,DriveGPT将继续引入大规模的实际接管数据,通过对人类驾驶数据反馈的深入学习,不断提高评估效果。同时,DriveGPT还将被用作云评估模型,以评估小型车型在车辆端的驾驶效果。Millimeter DriveGPT的最新重要进展将在2023年4月的第8届HAOMO AI日上公布。
上一篇:家族矩阵 全面出击 思域传承经典运动DNA