为培养与提升学生使用交通大数据分析技术解决实际交通问题的能力,《交通大数据》的课程设计大作业如下:
组队要求
交通大数据课程组队信息表
队伍编号 | 队伍名称 | 队长 | 队长学号 | 队长邮箱 | 组员1 | 组员1学号 | 组员2 | 组员2学号 | … |
1 | 答案全都对 | 张三 | 1234567 | 1234567@seu.edu.cn | 李四 | 1234568 | 王五 | … | … |
以小队为单位完成任务,一个小队包含3-4人,自由组队,队伍成员自行推选一名队长,负责队伍信息上报和作业提交。队长对成员信息进行汇总,于QQ群内的共享文档登记队伍成员信息、队伍名称。
问题描述
交通流量预测是交通控制和管理的重要依据,通过对于交通流量感知和推演,能使交通管理部门提前掌握交通状态的动态变化,预知可能发生的交通拥堵,协助构建先进的出行者信息系统。近年来,交通流量预测在自动驾驶系统、网约车平台、综合交通管理等多种交通场景中都得到了广泛的应用。
数据说明
比赛数据发布在课程GitHub平台:
https://github.com/Tlab-seu/traffic-big-data-theory-and-applications
比赛数据为某公路的卡口流量数据,共包含10个卡口,卡口流量以5分钟为单位进行集计。数据包含四个基础字段:卡口编号(detector_id)、日期(day)、时间(time)、流量(volume,veh/h)。
图1 卡口数据示例
图2 卡口示意图
数据被划分为训练集(train.csv)和测试集(test.csv)。训练集数据包含24天全天的卡口流量数据,测试集包含7天6:00~14:55的卡口流量数据。参赛者需要对测试集中各天15:00~15:55的卡口流量进行预测,并提交预测结果。提交结果需与样例文件(submission_example.csv)一致。
图3 提交结果样例
任务要求
基于给定的训练数据,借助探索性数据分析等手段,分析数据特点;针对数据中的潜在问题,对原始数据进行恰当的预处理;实施特征工程,构建交通流量预测模型,并对给定的测试数据进行预测。
对建模流程进行归纳、提炼、总结,撰写一篇科技论文,长度约4-8页,中英文不限。
提交要求
论文以PDF格式提交, 注明姓名、学号和邮箱
提交时间:开始时间为5月10日12:00,结束时间为6月20日中午12:00
论文至少需要包含以下内容:
1.引言。介绍研究的背景、动机、创新点/亮点
2.文献综述。对现有研究进行归纳总结
3.问题描述。对研究问题进行具体介绍
4.建模方法。详细阐述整个数据分析流程(包含数据预处理、建模等)
5.实验结果。介绍数据集概况,展示并分析实验结果
6.总结。对研究工作做整体总结,并提出可进一步完善的方向
论文格式的模板为Word英文模板.docxWord中文模板.docx
评测方法
竞赛结果成绩40%,论文成绩60%,评测函数为均方根误差(RMSE);
每支队伍每周可以提交一次,可最多包含5份预测结果,由队长提交(提交方式后续发布),取最好成绩更新竞赛排行榜,排行榜于QQ群发布,每周更新一次,取所有提交结果中最好的成绩作为竞赛最终成绩。