中国IDC圈4月27日报道,互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。

其中在27日下午的"大数据与城市交通"分会坛上,武汉市交通发展战略研究院 轨道交通室副主任郑猛先生在分会上作了关于“武汉市交通大数据系统开发与应用”的精彩演讲。

500-333文章照片-大数据技术与产品创新-郑猛

武汉市交通发展战略研究院 轨道交通室副主任郑猛

郑主任首先感谢了大家对分会论坛的支持,然后谈到武汉市交通大数据系统开发与应用,主要分享了来自东部地区的城市,二线城市代表学习的体会。他主要通过两方面来介绍,一个是武汉交通大数据框架,第二个是具体应用的情况。

以下为郑猛演讲实录:

郑猛:如果用几个数据概括武汉系统,简要说两句话,一个是行业特征,第二个是细化。不同的单位出发点特色有所差异,武汉市我们规划局下面的试点单位,基本也不是主管部门也不是很强的政府研究机构,所以我们服务于规划角度做了探索。

我们一开始是跟各个系统行业建立了合作,2010年我们开始数据建立了系统,实际上武汉市和其他城市有所区别的是我们把所有各行业数据做了汇总,比如说IC卡,手机数据,GPS数据,还有公交卡数据,把各个分散的数据进行了规划到我们系统,我们进行规划和城市布局以及交通研究关联起来,这是第一个方面。

第二个方面我们也是在利用这些数据,在2010年到2014年,当然也是在北京交通发展中心还有其他研究机构的支持下,我们做了大量开放系统,还有北京市出行模型,我们做了大型标配,以及关于北京出租车和公交地铁方面的数据。从每个系统建立前面讲了很多了,从体验来说几个方面,一个是稳定可靠数据源是我们的保证,武汉市在这块之所以拿到那么多数据,能跟大家分享的是我们建这套数据系统的时候,我们实际上把系统回归到系统提供的单位,这样才能确保我们数据建设持续的来源,我们数据开放以后,我们接到公交市民大屏幕,还有提供到公交系统,还有发布大数据,还有我们跟报刊媒体专栏和交通拥堵预测,这样我们从数据系统应用到提供闭。第二个我们跟行业做管理用,经常数据出了问题我们没有反应他们就说数据有了问题改一改,这样我们就形成数据提供单位和应用研究单位形成利益共同体,确保我们很多数据源解决方面的一个解决之道吧。

这个是关于系统的更新,我们2010年建立系统,后来是持续不断的更新,因为技术发展不一样,也是不断的更新系统和不断的投入,包括系统响应时间,还有指数更新,包括提到了延时指数和应用之间的关系处理。第三个我们建立系统更多的作为研究单位挖掘数据,提升研究能力。比如说关于历史数据整个的回。

关于过江桥梁流量密度做校核系统的工作,根据公交车系统和时间关系,从规律叫做做更开放的研究。

第二个方面谈一下大数据应用,三个方面的问题,一个可视化,第二个模型,第三个互联网方面的应用。关于数据可视化这块,常规情况下大数据分析,包括模型,经常给人感觉是一个黑匣子,到最后把它可视化。

现在我们实际上需要把分箱打开,数据来了之后可视化,在每个过程中用可视化分析,可能会给我们更多直观的感受。

第二个方面是关于平台,前面提到了八个平台,这其实都是定制化的,系统应该说是很综合的,但是我们做研究不是那么灵活,并且平台建立以后对维护更新和增加还是比较烦琐的,同时我们就需要小型的小而美的快速响应平台,如果形象的比就是前面是太极拳套路,后面是非常快速的一个平台。

我今天汇报的更多是小型平台的搭建,因为前面的平台搭建是非常成熟的。这块我们拿到的首先就是数据,一千多万条,我们数据进来之后几秒钟可视化展现出来运行的状态,右边菜单栏可以随时根据需要做参数,第二个对空车进行单独分析,右边是城市代码直接展现给用户,所以作为研究者仆役非常方便根据你的需要调整地的参数。这个关于出租车这块我们选择这里面所有的出租车都是动态的,我选择另外一个车子,选择它的轨迹,进行分析。旁边有一个时间进度条,这样我可以分析。另外一个方面我可以区域分布被看他的可视化。

还有一个方面就是像武汉市过江桥梁,拉一条线,就马上可以通过断面流量时间分布,后面每个小时的分布以及流量情况,这样可以把数据和后面的结果利马能得到展现,这是小型平台的快速反应。

这是选择机场点,我们往前推,十分钟之前的时间点是怎么样,我们根据特定区域做一些特征研究。

这个是根据行使+OD区域,这个就是有了空驶车辆OD分布,这样看不是很直观,我们切换几个角度来看,空驶车辆OD比较短,主干道搭车更高一些。第二个是可视化带来的一些好处,首先可以看一下中间这条蓝色的是长江,长江有很多桥梁可以看出来,很多桥梁过空车的量不是很多,但是中间有一个特别粗,这样我们在做前面,如果没有可视化的情况下做数据清洗时可能也遗漏这一点,这个信号里面是疙瘩的,如果没有可视化清洗处理就不知道这个,遮挡的问题可视化就可以判断。

另外就是公交分析数据,可以进行实时展现。我们进行尝试,可以任意的场景都可以进行展示。这是关于出租车这一点我本聚类展示,在形象上的分布,这个也是不同的角度。所以说在可视化大数据时代来临,可视化成为我们一个基本的工具贯穿史,这是我们初步的想法。第二个是大数据模型关系,我们大数据给我们更多的历史和现状的分析,我们要对城市的未来发展,特别是找到我们解决对策,更多的还需要跟未来相结合,这样我们也把大数据和模型之间要更好的衔接起来,这样来指导我们城市交通规划的研究。

左边这个数据是我们拿到的地铁刷卡数据,前面这一片有几点,这是我们一周的数据,这些数据传统来说我们就是把它放到我们前面提到的八个系统里面有一个公共交通系统,这个系统来说功能是比较强大,要做到系统功能。但是在模型上面,我们地铁有四条线了,模型功能是很欠缺,即使是开发也是简单的功能,所以我们考虑到有没有把这个数据直接读到软件的系统里面去,这样我们在软件模型方面比较突出的做一些相关的分析。

这个是我们用的目前现在过比较主流的有4个相关的,武汉市1999年应用的系统,这个数据读进来可以用通用的快速语言进行写代码,这个比较简单,另外跟在线地图结合比较简单,这样我们很快的通过数据得到一天每个小时的OD数据就出来了,每个小时、十分钟或者五中进行一个小时的OD图片化的展示,这是我们一个尝试。

另外我们分析一天的数据量,寻找这方面的研究提供一些可视化的途径。另外我们模型里面就有很多的分配功能,通过我们OD在应用里面分配模块进行客流量分析,客流、车公里包括大断面的流量情况。还有一个就是在两条换乘线有八个方向的换乘路径,就可以得到模型比例。

另外城市公交换乘第一次全称免费,第二次打八折,很复杂,所以我们利用模型,把各个平台结合起来分析。

另外我们和其他融合,比如说看到哪个区域来,给我们进行更多的数据分析的支撑。这个我们可以点任意轨道站,这个点是我们武汉门槛,我们选来源,三个火车站,到了地铁站,出了站以后出了哪个地方进行扩散,在整个网域进行分析,这是武汉市热力图跟地铁网状分析,从地铁规划来说跟我们人流是否吻合,所以不同的数据和我们数据融合非常多的一些启示。

第三个方面是关于互联网数据的价值,刚刚腾讯和百度都讲了,他们无论是腾讯也好还是百度还是高德也好,都是推出实时分析功能,拥堵、收费不收费,以及公交和线路的选择,都是全链条,实时的时间。以往这个时间给我们做模型,我们经常做预测模型许多固化,做线上校核实际上不足,我们武汉站是三环站,这个看它的分布,位于城市一环内中心站30汾州210平方公里,60分钟是1600平方公里,看二环三环数据进行比较,然后我们看到高峰对于不同区域的变化是不一样的。像武昌火车站三个图里面比例不不一样,一环和二环加起来才跟三环高铁站类似,所以现在有不同的声说把火车站放到外围,这个是从可利用性方面给大家提供选择。

时间关系我想做一个因子,网上开源数据提供了非常丰富的资料,通过我们数据挖掘,能够给设施选址、设施人口覆盖可以提供更好的参考。我想我今天就简要的汇报到这里,谢谢大家!

 

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-08-24 09:38:00
大数据资讯 关注县域数据能力建设,抢占产数业务发展先机
2023年《数字中国建设整体布局规划》正式发布,数据能力已成为我国区域发展的底座和创新引擎。 <详情>
2023-03-30 11:15:07
云资讯 分布式时代已至,数据如何更有价值?
无论是连通各大集群内大型超大型数据中心,还是连接边缘侧小型、边缘数据中心,分布式云计算都已成为这张算力网络最重要的支撑。在此背景下,云计算步入分布式时代。 <详情>
2023-03-01 19:27:00
市场情报 FlagOpen大模型技术开源体系,开启大模型时代“新Linux”生态
大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用,人工智能进入普及应用的新时期。 <详情>
2023-01-09 09:36:46
大数据资讯 我国互联网广告数据匿名实施服务正式上线
《指南》形成的“技术保障、评估规制、过程控制”的互信制衡机制,适用于各类互联网广告业务,包括广告投放、程序化交易、广告监测等应用场景下的数据匿名化处理。 <详情>
2022-12-30 10:10:19
大数据资讯 中国移动磐维数据库正式发布
未来,随着数据库功能和稳定性等进一步增强,磐维数据库将在中国移动内外部的广泛应用中积累更多复杂业务场景实践经验,进一步提升数据库产品的核心技术能力,助力数智化转 <详情>