多模式交通系统是一个高度复杂且非线性的巨型系统,它在时间和空间上促成人员、货物和服务的流动。多模式交通系统复杂性源于许多因素,包括不同交通模式间的耦合性,交通需求和供应之间复杂的相互作用,以及开放、异质和自适应交通系统的固有随机特性。因此,理解和管理这样一个复杂系统是一个非常复杂且困难的任务。然而,随着交通以及其他领域多源大数据可获取性的增加,计算机硬件算力的增强,再加上机器学习模型的飞速发展,大模型的概念被许多领域应用与实践,包括计算机视觉、自然语言处理等。
团队将大模型的概念应用于交通领域,并构想了一个名为MT-GPT(Multimodal Transportation Generative Pre-trained Transformer)的根据交通拓扑结构分层“点线面”的多模式交通大模型框架,旨在为复杂多模式交通系统中的多方位决策任务提供数据驱动的大模型。
MT-GPT与用户的交互流程
MT-GPT并不是一个大语言模型,其只是借助语言(多模态)模型提取问题输入(Prompt)的语义信息,并以此来推动用户与大模型的交互,MT-GPT与用户的交互流程如上图所示。MT-GPT通过点线面三层大模型框架来解决不同多模式交通任务,特定的多模式交通拥有固定的数据范式与模型结构,因此设想中的MT-GPT模型参数量并不会像已实现的语言或视觉大模型一样拥有高达万亿的参数。
MT-GPT的技术路线
MT-GPT的数据来源是多样且异质的,因此我们构思了一种新的MT-GPT的数据范式来支持这种综合性交通系统的数据框架和结构。MT-GPT会根据数据范式,依照路网的时空拓扑结构与联邦学习的分布储存架构,对多源交通数据进行点、线、面的分级储存和分类。然后,通过跨模态模式的联合表征学习,获得对训练数据的有效表征。MT-GPT分为单点大模型、干线大模型与路网大模型这三个层级,各个层级大模型使用多任务学习作为内部模型架构,并且使用Transformer作为共享骨干网络(Backbone),每个层级的多任务学习框架中包含了共享层(Shared Layer)与特定层(Task-specific Layer),特定层根据改层级交通任务的不同可以选取不同的头部。单点大模型与干线大模型都会生成单点层级与干线层级的交通任务表征,共享并传递至上一个层级的大模型。为了缓解路网层级感知稀疏的问题,MT-GPT在路网大模型中增加了迁移学习模块,来帮助模型迁移到没有样本的路网区域。
基于MT-GPT改进的多任务学习架构
考虑到不同交通模式的特征,团队探讨了实现这一概念框架的核心技术及其整合方式,构思了适配交通的大模型数据范式与改进的分层多任务学习、分层联邦学习、分层迁移学习与分层Transformer框架。
MT-GPT分层多任务学习框架中的任务岛与耦合桥
团队通过搭建“任务岛”与“耦合桥”的框架讨论了这样一个多模式交通大模型框架在“点线面”三层大模型框架下的应用案例,从而为多尺度的多模式交通规划、网络设计、基础设施建设和交通管理提供智能化的支持。
综合而言,MT-GPT的创新性在于将大模型与多模式交通系统相结合,由于具备自动评估和生成解决方案的能力,MT-GPT有望为交通规划、网络设计、交通基础设施建设和交通管理等一系列交通任务提供智能化的解决工具。