Menu Home

Author Archives

刘建政

刘建政

香港大学城市规划与设计系博士后研究员、剑桥大学土地经济系访问学者。本科毕业于华东师范大学地理信息系统专业;硕士毕业于北京大学城市与区域规划专业;博士毕业于香港大学城市规划与设计系。他的个人网站是http://www.jzliu.net/

Here are my most recent posts

开放数据介绍: 全球行政区域边界地图(Global Administrative Areas)

全球行政区域边界地图是一个用于GIS分析的全球行政区域边界地图数据库。该数据不仅包括国家边界地图,也包括省级、市级和县级行政区地图,部分国家甚至有更细的行政区地图。每一个地图不仅有空间的边界信息,在其属性数据库中还有该行政区的名称。 全球行政区域边界地图当前版本是2.5,包括了全球294430个行政区域的边界空间数据。该数据有多种格式,包括shapefile、ESRI geodatabase、RData以及Google Earth kmz等等。感兴趣的读者可以使用ArcGIS软件使用该数据,如果没有ArcGIS,也可以下载免费的GIS软件,比如Q-GIS或者DIVA-GIS来使用这套数据。这两个软件的下载地址也可以从数据的官方网站找到。 这套数据是由Robert Hijmans,加州大学伯克利分校脊椎动物博物馆的Julian Kapoor和John Wieczorek,国际水稻研究所的Nel Garcia,Aileen Maunahan和Arnel Rala,加州大学戴维斯分校的Alex Mandel,以及众多其他的贡献者合作开发的。 全球行政区域边界地图可以免费获取,感兴趣的读者还可以选择下载具体某个国家的行政区域边界地图。这套数据可以用于学术研究以及其他非商业应用。 更多详细信息,请访问官方网站。 欢迎关注《城市科学文摘》获取最新学术会议资讯。

数据可视化:基本图表与高级图表

  编者按:一张好图胜过千言万语。如果可以使用简单易懂的可视化图表表达城市研究中各种复杂的对象和数据,那将会极大地帮助人们更好的认识城市。但如何才能做出一张好图?如何表示四维以上的数据?本期《城市科学文摘》介绍了一般数据的可视化,内容不仅包括柱状图、散点图等基本图表,也包括树图、桑基图等高级图表。本期文摘的大部分插图及有关“简洁”可视化的观点来自于Stephen Thomas 的著作Data Visualization with JavaScript和d3js.org的示例展示。 “When you consider the ultimate purpose of data visualization—helping users understand data—simplicity is one of the most important features of an effective visualization.”( “数据可视化的最终目标——是帮助用户理解数据,从这个意义上说,‘简洁’是有效数据可视化的最重要的特征之一。” ) — Data Visualization with JavaScript by Stephen A. Thomas 基本图表 [注释1-2] Bar Chart柱状图适用场合是二维数据集(每个数据点包括两个值x和y),但只有一个维度需要比较。柱状图利用柱子的高度,反映资料的差异。肉眼对高度差异很敏感,辨识效果非常好。柱状图的局限在于只适用中小规模的数据集。通常来说,柱状图的X轴是时间维,用户习惯性认为存在时间趋势(图1a)。如果遇到X轴不是时间维的情况,建议用颜色区分每根柱子,改变用户对时间趋势的关注。图1b是英国足球联赛某个年度各队的赢球场数,X轴代表不同球队,Y轴代表赢球数。 图1 柱状图 [注释1] Line Chart折线图适合二维的大数据集,尤其是那些趋势比单个数据点更重要的场合。还适合多个二维数据集的比较。图2是两个二维数据集(大气CO2,地表平均气温)的折线图。 more »

大数据,”大”偏差

  编者按:大数据在城市研究中的应用方兴未艾。社交媒体、电话、交通卡等等数据的出现极大地丰富了城市研究的粒度和广度,使得以前因为数据获取困难而不能研究的对象变得可研究。这篇文章认为,大数据仍然是数据的一种,其本质上还是对事物现象和问题的观测结果。而数据只有在它有用时才重要,它不能替代城市研究中的常识、理论还有严密的研究设计,城市研究在使用大数据时需遵循科学研究中严谨严密的数据收集方法和研究设计。 文献来源:Liu, J., Li, J., Li, W., & Wu, J. (2015). Rethinking big data: A review on the data quality and usage issues. ISPRS Journal of Photogrammetry and Remote Sensing. doi: 10.1016/j.isprsjprs.2015.11.006. 大数据的权威性问题 传统的数据收集方式一般都是由研究者或者国家、某一个社会机构、团体来执行或者监督执行的。数据的真实性、可信度以及后续数据的处理包括数据中错误的剔除都是基于一个假设,即研究者严格遵从研究伦理。一般而言,社会上,也包括学术界,对国家、社会机构以及相关团体收集的数据是有着较高的认可度和信任,因为这些执行数据收集的机构具有权威性和公信力,而且这些机构也往往有更多的资源和力量去执行这些基础工作。 但是众多的大数据的收集在权威性和公信力这方面存在问题。我们在研究中所使用的社交媒体数据来自新浪微博、腾讯微博等社交平台,这些平台并不是以科学研究为目的而存在的,而是以逐利为目的的商业化平台。这里面的区别有三个方面:第一,商业化平台并不会遵循科学的数据收集程序包括抽样方法等去收集和保存数据,他们只服务于能够提供利润的人群而不是总体,而且他们提供的数据服务接口背后的抽样方法和处理算法未知,这些重要信息对研究者来说是一个黑箱,比如大众点评网、街旁网的用户人群;其次,这些大数据提供者可能会随时改变数据属性变量以及收集的方法,而这些变化研究者可能无从得知;第三,商业化平台没有义务和利润动机去保证数据的真实性和有效性,一个典型的例子就是新浪微博上的众多僵尸粉和广告粉。其他网络数据源,如飞信好友、搜房网、百度、谷歌搜索等等,也存在这些问题。 著名的谷歌流感趋势指数Google Flu Trends index,能够利用用户搜索流感数据记录来预测流感爆发时间,曾经轰动一时,但是有学者曾经报告谷歌改动算法使得预测结果精度变得不稳定。 大数据的信息片面和噪音问题 大数据的信息片面性体现在大数据所含信息的片面性。大数据所能揭示的信息比较片面,并不完全。比如手机数据覆盖人群范围大,实时且低成本,但基站定位信息粗略,且无用户属性信息,应用范围有限。 第一个限制在于因为目前已有手机数据往往只有包括用户ID、基站位置、时间戳等少数几个字段的研究,这些在单个用户水平的数据记录往往因为没有用户的社会属性数据而变得应用极为有限。这些数据不能体现被调查者之间的差异,难以描述居民出行行为特征。就本文目前查阅文献所得,这些数据也就主要用在识别人群活动位置及其移动性,比如用户居住地、城市中心识别、城市交通流量、空间交互社区等。 二是这些位置也并非准确的用户活动地点,而只是基站位置。这些位置的精确度也受基站的密集度和信号强弱的影响。三是数据所擅长的活动识别方面,只能识别工作和居住这两种活动,这两类活动的识别也因为武断的自定义活动时间段而变得不准确。而且数据只记录了用户的移动行为,这些移动行为往往只花了用户很少时间,而用户真正花时间的活动,如在办公室的工作、在居住小区的生活,却被忽略了。用户的这些停留期间的活动,才是真正与城市居民行为、健康、社会经济等息息相关的活动,手机定位数据记录的只是这些海量信息里面一些极片面的相对不重要的信息。 公交刷卡数据的应用也是如此。即使研究者利用传统的居民出行调查数据和土地利用数据来确定公交IC卡持卡人的社会经济属性,这种利用其他数据来协助识别持卡人居住地可能存在极大的误差。这些问题也存在于街旁网的位置签到数据。因为其商业化的本质,所记录的位置信息和用户签到信息都是基于商业消费活动的。使用街旁网数据也就仅仅限于研究城市的商业活动。准确来说,是已经在街旁网注册登记的那些商户和用户所参与的商业活动,一般而言,是一些零售业、大众消费类的商业活动。类似的大数据包括大众点评网签到数据。 大数据的样本代表片面性问题 正如在大数据的权威性问题中所阐述的,众多的大数据提供者因为其商业化逐利的本质,大数据的收集过程中很可能没有采用正确的抽样方式或者说所代表的人群局限在一个很小的范围内。根据这些大数据做出了研究成果很可能没有反映真实的问题和情况。 目前很多使用社交媒体数据的研究都是基于这样一种假设:社交媒体数据由于其数据量特别大,使用的用户(网民)特别多,似乎具有较大的样本覆盖率,因此就可以忽略因为其商业化平台带来的人群样本偏差。但是实际情况却并不是这样。比如,新浪微博2013 年第四季度的日活跃用户为6140 万人,根据中国互联网络信息中心的网民数量统计,大约占网民人数的9.94%,占国内总人口的4.51%,从这个角度,其样本覆盖率仍然是很低的。而且一个对新浪微博用户的抽样调查显示,超过四分之一的微博用户集中在广东、北京和上海,而这三个地方的网民却只占全国网民数量的9%。国外的数据也存在类似的问题。2012年一项对1802名美国网民的抽样调查表明,国外社交网络网站Twitter只有16%的网民使用率,而且只有年龄从18岁到29岁的年轻人、非洲裔美国人和城市居民对此感兴趣。当前非常热门的照片分享社交媒体网站Instagram有13%的使用率,除了上述群体,也只在拉美人和女性中流行。 more »

【青年学者职业生涯系列之一】:如何谈判薪水-在工资福利谈判中的六个迷思

编者按:对于许多刚迈入学术界的青年学者而言,相信对如何在学术界发展自己的职业生涯存在着诸多疑惑。比如:一份教职的工作到底意味着什么?高校包括院长系主任在教师招聘时主要考虑的是什么因素?教授们在参加会议时是如何拓展自己的关系网络的?已获得终身教职的那些教授们到底对未来有着什么样的追求?而没有获得教职的教师们又去了哪里?在学术求职中如何谈判薪水?为什么很多求职面试没有成功?等等。这些问题的答案,将有助于青年学者在面对许多抉择时做出明智的决定。为了服务我们的读者特别是广大青年科研工作者,在《城市科学文摘》编辑部的支持下,我编译了“青年学者职业生涯系列”文章。这个系列一共6期文章,每期一篇。内容分别是:“如何谈判薪水-在工资福利谈判中的六个迷思”、“学生气的六种表现-如何避免在学术求职中‘自杀’?”、“高校院系是如何看待学术招聘工作的?”、“教师职业生涯路径转变:我们期待系主任做什么?”、“终身副教授‘Terminal Associate Professor’怎么办?”、“建立学术人际关系网络”。这6期文章的内容大多数来自于英文专著或者教育类的英文期刊,原作者们大都是在高校工作的佼佼者,其中不乏系主任、知名教授。敬请关注! “如果说我看得比别人更远些,那是因为我站在巨人的肩膀上。(If I have been able to see further, it was only because I stood on the shoulders of giants.)” —— 牛顿 本期文章是“青年学者职业生涯系列”的第一期,讲述的是在获得工作机会之后的薪水谈判策略。文章内容是从学术研究工作招聘的角度来阐述的,部分内容或建议可能并不适用于中国的情况,但对我们了解西方高校以及研究所工作招聘有所帮助。

【青年学者职业生涯系列之四】:高校教师职业生涯路径的转变

编者按:古语有云“先知而后行”。如果能事先了解从事高校教师这一职业将会是什么样的体验,那么青年学者们将能够根据自己的兴趣和志向做出更明智的选择。本期是“青年学者职业生涯系列”的第四篇文章,原文讲述的是在高校教师职业生涯转变的过程中,系主任作为学系的领导者可能扮演的角色。虽然原文是从一个系主任的视角出发,但从中我们可以获得这样的信息:一位高校教师,无论他/她是正教授、副教授还是助理教授,将可能出现怎样的职业生涯变化,并且这种转变受何种因素的影响。本文将介绍原文中四个教师职业生涯转变的案例,包括:1)从教学科研到行政管理的转变;2)研究领域的转变;3)科研教学转型;4)从行政返回到教学科研的转变。在每个案例中我将会详细阐述转变过程中的起因、影响因素以及结果。希望这些信息能对《城市科学文摘》的读者们有所帮助!

【青年学者职业生涯系列之三】:高校院系是如何看待学术招聘工作的

编者按:本期是“青年学者职业生涯系列”的第三篇文章,讲述西方高校在招聘教师时从发布招聘广告、筛选候选人到决定人选的整个决策过程。部分内容或建议可能并不适用于中国的情况,但对我们了解西方高校以及研究所工作招聘有所帮助。编者自己也曾经作为学生代表全程参与香港大学副校长的全球遴选工作,个人感觉这篇文章有不少真知灼见,特编译出来与读者分享。

【青年学者职业生涯系列之六】:建立学术人际关系网络

编者按:本期是“青年学者职业生涯系列”的第六篇文章,也是本系列的最后一期。文章的原作者斯坦福大学副教务长办公室项目主任Chris Golde博士讲述了如何在学术圈中建立职业人际关系网络。文章介绍了学术人际关系建立的四个典型环节——识别、开始、投资和加强——以及各个环节的具体的操作方法。文章简单易明、内容丰富,相信对很多青年学者有指导意义。

【青年学者职业生涯系列之二】:学生气的五种表现-如何避免在学术求职中‘自杀’

编者按:这是《城市科学文摘》青年学者职业生涯文章系列中的第二期,讲述的是五种经典的学生气表现。依编者看来,这五种表现不仅存在于西方高校的学生中,在国内高校学生中也很普遍。编者自己也曾有种种类似的表现。了解这些有助于我们的年轻读者调整自己在工作面试中的心态,也有助于导师对学生进行指导。

【青年学者职业生涯系列之五】:终身副教授怎么办-从院系的角度出发

编者按:本期是“青年学者职业生涯系列”的第五篇文章,从高校院系的角度来讲述“终身副教授”的问题。在成为正教授的路上,更多的是大棒,而非萝卜。文章分别阐述了“终身副教授”对学系的利与弊,然后针对这些利弊根据“终身副教授”背后的原因从高校院系的角度分别给出了建议。文章本身没有给个人如何避免成为“终身副教授”提供多少信息和建议,但却反映了院系对于“终身副教授”的问题是怎么看待的。原文作者是佛罗里达大西洋大学Harriet L. Wilkes Honors College学院院长Jeffrey L. Buller。