研究内容:
现在并没有标准的方法来验证从大数据中所得信息的质量和可靠性。这次我们讨论了城市形态理论可以被用来验证大数据的可靠性。同时,从大数据中得到的信息也可以反作用于理论甚至拓展现有的理论或假设。我们提出一个框架来研究城市形态理论怎样被运用去验证大数据信息和被验证的信息怎样去补充其他数据,用来揭示空间聚集或者人类定居点的空间模式。我们通过以北京作为例子研究,证实这个框架的有效性。也充分显示了北京公交通勤者的次中心特点。
研究方法及成果:
1、首先我们提出一个能更有限地连接城市形态理论和公交卡数据的框架。除开能用公交数据研究城市形态,更能利用城市形态的理论来验证从大量数据中所得信息的可靠性。传统数据、公交数据以及两者的结合作为输入,同时提出可以用现行城市形态理论和传统数据来帮助验证公交数据的有效性。更者,我们相信公交数据的介入能产生新的城市形态,这样更有利于我们验证大数据的有效性。
连接城市形态理论和公交卡数据的框架
2、案例:北京市公交通勤者。
龙灜等在《地理学报》的论文“利用公交刷卡数据分析北京职住关系和通勤出行”中利用公交数据挖掘出了北京公交通勤者的居住场地和工作场地的模型。而我们这次要做的就是通过上面的框架来验证其有效性。
数据:2008年4月7日-13日的77,976,010 条公交线路的8,549,072 条通勤者数据。
3、OD流分布:通过数据挖掘我们找出了公交通勤者的居住地和工作地的次中心,计算发现这些次中心符合幂分布,并对此进行了OD矩阵可视化。
OD流分布
北京市公交通勤者的居住地和工作地OD矩阵可视化
4、次中心的代表性和可靠性:我们利用空间自相关统计(spatial autocorrelation statistics)来识别通勤者的工作和居住地的次中心。然后通过验证这些次中心符合齐普夫定律(Zipf’s law)证实了其有效性。
北京公交通勤者的次中心
次中心的幂分布
5、次中心的特点:为了更好地研究次中心的经济聚集、交通拥堵或者职住情况,通过和传统数据的结合,我们总结出北京和其他城市的次中心的土地使用、邻里情况等,以便于更好了解我们的城市形态。也通过结合了传统城市数据信息为我们城市形态做出了一些判断。
研究讨论:
本次研究显示,大数据通常被用来帮助城市研究,但是其有效性有效考证。本文也建议大数据需要与传统调查方法和城市形态理论结合起来,来提高他的有效功以至于更好地为研究者和决策者提供参考。虽然文中框架被证明有效,但仍有很多不足的地方需要改善与补充。
原文更加精彩:http://www.beijingcitylab.com/working-papers/
50 Big data forintrametropolitan human movement studies
----A case study of bus commuters basedon smart card data
欢迎关注北京城市实验室!
Email:BeijingCityLab@gmail.com
Emaillist: BCL@freelist.org
新浪微博:北京城市实验室BCL
微信号:beijingcitylab
网址: http://www.beijingcitylab.com.
中文编辑:凝子
更多新闻