大数据让“马云们”知道了太多的秘密


文章出自:中国国家地理 2014年第11期 作者: 李林夏 江红 

标签: 地图地理   观点地理   

纷繁的世界,变化的万物,自有令人不易察觉的规律隐没其中。那么,如何去捕捉它们缥缈的踪影?如今井喷式出现的数据,就像刺破重重迷雾的探照灯光,正日益成为极具价值的“商品”,让我们从另一个角度看到一个更加真实的中国面貌。令人意外的是,这些貌似不起眼的数据信息,大多数并非出自传统意义的科研机构,而是产生并被掌控于马云等商业巨头的价值体系之中。
天空飘来一朵形如中国地图的云
天空中一朵白云飘来,形态好似中国地图。数据如云。海量数据的分析与应用,正在要求人们改变对其精确性的苛求,转而追求数据的多元性和交叉性。不同事物间的相关性,有时比因果关系更加值得关注。摄影/陈海滢

无线电定位
让全城的街区与房屋
没有死角地展现出来

夜晚的成都街头,一家挨一家的餐馆灯光闪烁。稍远的地方,灯光就不再清晰,串串香涮锅中的蒸汽,如薄雾般在餐厅门口飘飘袅袅,薄雾中尽是麻辣之味。我和朋友随便挑了一家餐馆,刚坐下,服务员小妹儿就拿上iPad给我们点菜:“‘跳水兔’、‘鲜椒鸡’是我家点得最多的,今天已经卖了40多份,肉多,实惠。”

北京市建筑物雷达扫描实景图
这张地图是依据全方位雷达扫描所获得的海量数据制作的。地面上所有的建筑物被精确地定形、定位,并依据实景进行
修正。相比于同样火热的遥感技术、全景拍摄以及3D建模,通过雷达数据制作的地图在表现城市的整体格局以及城镇扩张等领域有着更为简洁直观的优势。制图/蔡博峰

同行的朋友中,有从事餐饮业的郭佳肃与沈洋先生,他们是做大数据时代智能餐饮系统的。这两人悄悄告诉我,不要小看服务员手中的iPad,正是通过它们将大量的点餐信息汇集在一起,可以看出很多富有价值的内容:比较菜品被点的频率,就能看出某一地区的哪些菜受欢迎,这可以帮助餐馆准确地预备菜品数量。如果数据足够,还可以估算出这个地段某一类食材在某月乃至全年的消费状况;外卖的送餐地址汇集在一起,可以看出哪些地区加班的人群最多,哪里具有再开餐厅的潜质。诸如此类的信息对其他服务行业的进入同样有着重要的参考价值。

北京餐馆每月消耗多少只羊?
一切瞒不过点餐机
烧烤店:男人最爱板筋,女人最爱烤虾
咖啡店:卡布奇诺最畅销
这是一组根据北京不同餐馆中无线点餐系统汇集的数据,其中一些内容颇为有趣:在北京不同的商圈,以学生为主体的学院路—五道口地区,快餐店生意最好;在国贸CBD商务区,川菜颇受欢迎;而在丰台等地的传统居民区,火锅店最为热闹。在北京的烧烤店中,除了肉串之外,男性顾客最爱点的食物是烤腰子和板筋,女性顾客最青睐的则是烤虾和骨肉相连;而在咖啡店中,卡布奇诺咖啡销售状况最好。造成这些差异的原因是什么?不同的人会有不同的猜测和分析,但这些相对于现实的统计结果而言并不重要,简单清晰而又有充足数据支持的结论,正是许多商家迫切需要的信息。
数据提供/屏芯科技 郭佳肃

我顿感震惊,这些生活中的细节琐事,大多数人或许并不会留意。但事实上,我们在不同场合做出的任何判断与选择,哪怕只是在购物网站上的一次轻击鼠标,如果被当作统计数据进行收集整理,或许都能变成令人意想不到的有用信息,甚至还可能引发一场意义深刻的消费革命。

新疆妹子胸围最大,

黑龙江姑娘胸围最小?

2011年,一张全国各省女性胸围排行榜引发了不小的争议:新疆、香港、北京、云南、山西分列胸围最大地区的前五位,胸围最小的省份排序(胸围从小到大)则分别是黑龙江、浙江、海南、江苏和福建。

淘宝数据盛典
网络购物信息统计
引出的八卦与争论
在2011年,淘宝网根据各个商家6月中旬至7月中旬女性内衣销售的尺码状况以及发货地址,统计出了中国女性胸围的省区排行榜。C罩杯及以上尺寸所占购买比例最大的地区依次是:新疆、香港、北京、云南和山西,它们因而被视为女性平均胸围最大的地区。然而到了2014年,同样是6月中旬至7月中旬的数据,统计结果却有了不小的变化:广东、江苏、浙江等地这一次成为C罩杯及以上尺寸内衣购买比例最高的地区。这样的统计结果虽然不一定准确,甚至不太严肃,但却告诉我们,商业销售的数据,隐含着许多我们未曾留意的秘密。

制作这样的另类榜单,原始数据来自于淘宝网商家2011年6月中旬至7月中旬发往不同地区的女性内衣罩杯尺码。胸围最大的省,依据各省、市、自治区购买C罩杯及以上尺码内衣的比例来排名;而胸围最小的省份,则是以A罩杯销售量所占比例进行的排序。看到出炉的榜单,网友对结果或者赞叹,或者怀疑:新疆妹子胸部最丰满吗?有人主动寻找证据和个例——当时热播电影《让子弹飞》中意外走红的女演员赵铭,就是新疆人。可是一直以来,东北姑娘给人的印象都是高挑丰满,黑龙江竟然成为网购A罩杯比例最高的省份,这不禁让人一阵唏嘘。

到了2014年,新一期数据公布。今年6月中旬至7月中旬女性内衣的销售状况,较之前一次大相径庭:C罩杯及以上尺码的内衣购买比例最高的省份分别为广东、江苏、浙江,而黑龙江姑娘拿掉了胸部最小的称号,在A罩杯购买人群中所占比重从之前的第1名大幅度降至第18位。

再看全国的内衣整体销售情况,2011年至2014年的3年间,全国A罩杯内衣的购买比例从25.26%下降至21.5%,而C罩杯则由8.96%上升至13.1%。中国女性的胸围普遍在上升?是自然发育、丰胸产品或是整形手术使然?销售数据反映出的现象,无法给我们提供严密可信的结论分析。一些店家透露,生产厂家也在分析揣摩顾客的消费心理:内衣尺码标大一些更好卖。如此看来,网购内衣的尺码状况能否反映女性胸围的真实状况,值得商榷。

不过一些周边的相关数据,使得对女性胸围的分析更加有趣:在一个月的时间中,广东有6.3万人购买了丰胸产品,成为最热衷丰胸省份。广东女性对胸部丰满程度的关注,远远超过了其他省份,这背后是开放的文化环境,还是独具一格的生活追求,则留与各家评说。

为何北京人爱用“安卓”,

上海人钟情“苹果”?

2011年淘宝网全年手机销售的数据样本显示,上海用户选择手机是偏爱iOS系统的苹果手机,而北京用户则偏向于选择安卓系统的手机。iOS系统与安卓系统相比,系统更加连贯流畅成熟,用户界面直观友好,设备之间共享度高,应用程序的质量也有较严格的控制,当然价格相对也要高一些;但另一方面,安卓系统的开放性远超iOS系统,限制性低,兼容性好,用户可以根据自己的使用习惯配置系统,系统更加多元,手机价格也相对便宜。

上海作为全国的金融中心,大量商业精英云集。苹果手机时尚的设计细节与成熟的系统,暗合着这座城市相当一部分人群的消费心理,一定程度上也反映了上海人崇尚西方生活方式、追求精致产品的“海派文化”;而北京用户对手机的选择,似乎彰显着对于多元文化的兼容能力——实用方便就好,这似乎也是“京派文化”中包容并蓄、作风粗犷的某种反映。

这是专注于数码产品报道和评测的网络日志Engadget(瘾科技)整理的网购
信息,总结出的2013年第四季度中国大陆地区手机销售状况。在这个时间段中,
三星手机占到各品牌手机销售总量的19%,销售量高居榜首;联想以13%的占有率紧随其后,酷派位列第三。今年这一时间段的销售数据即将出台,不知较之去年会有怎样的变化。

如今手机还有一个重要的功能,那就是拍照。对于部分女性而言,拍照中最重要的应用,非自拍莫属。有人总结在现代女性的必备技能中,自拍排名颇为靠前——熟练掌握自拍技巧的人,可以轻松找到最佳角度展示自己所希望展示的美丽与妩媚。大部分年轻女性所满意的自拍照中,长睫毛、大眼睛、尖下巴、细长腿以及光滑的皮肤,是颇被看重的因素。于是随着现代女性“展示自我”的需求不断增强,“自拍神器”应运而生,它可以帮助自拍新手迅速掌握技巧,内置照片处理功能也能基本满足大家的“美颜”需求。2011年底的数据显示,“自拍神器”卡西欧TR100相机和三星MV80相机购买者比例最高的是上海女性,平均每万人中购买者超过12人。

另外,在美容护肤、美体、精油、彩妆、香水、美发、衣服配饰等方面的总消费上,上海女性也是名列榜首。如果说广东女性关注自身胸部丰满程度,那么上海女性最关注的则是整体美,以及在微信朋友圈中展示照片的质量。

最爱读书的是南京人,

最疼男人的是舟山女人

生活之中,吃喝玩乐缺一不可。在如何度过闲暇时光这一问题上,不同城市各有偏好,根据网购产品类型,城市性格可观一二。就2011年淘宝网全年书籍销售情况而言,如果根据每百名买家中购买图书者的数量进行排名,那么位列排行榜前10的城市中,竟然有6个都出自江苏省,这也让江苏成为最热爱读书的省份。

天秤座最大手,双子座最节省
以十二星座来分析网购者的消费能力
按照星座划分,购买零食的人群中,敢爱敢恨,决不妥协的天蝎座与白羊座买家
比例最高,每千人中购买者数量平均分别是96.0人与94.9人;而理性、纠结的处女座与天秤座买家相对较少,每千人中购买者数量平均分别是91.0人与90.2人。
但如果以年成交总金额来进行排行,无论男女天秤座的消费力都高居榜首;最节俭省钱的,则是双子座人群。尽管以星座来对人群进行划分并不科学,也被很多人所
不屑,但海量数据中的暗含的这些信息,以及千分之几的差异,在商业市场上却有着难以估量的价值。

以南京为例,每100名买家中有26.7个人购买过书籍,全年全市网购书籍消费达5428万元,古都积淀下的文化传统可见一斑。

另外一些购买数据则让我们看到关于情感生活的种种端倪。根据2011年每百名女性用户中购买过男士用品的用户数量,排出了最舍得为男人花钱的城市排行榜,在排名前10的城市中浙江省竟独占8个席位。其中舟山女性每百人中,就有24人曾网购过男士用品,人均花费达到了900元。值得一提的是,舟山同时也在书籍购买排行榜位列第6,在吉他购买排行榜上位列第1。

舟山男性缘何拥有如此福气?在各种八卦与猜测之中,有些细想起来却也不无根据:原先的舟山群岛孤悬海外,购物多有不便,且男人有相当比例随船出海,这里的女性自然对常年在外的男人更加关爱;如今虽然舟山跨海大桥早已通车,但小型客车单程过路费就要百元开外,去宁波等地的成本着实不低,所以网购在这里颇受青睐——打开快递员送来的吉他,便可坐在窗前面朝大海弹上一曲,不亦快哉!

江浙一带还有不少网购数据排名全国前列,尽管有些统计结果很冷门,但同样有趣。比如一年中网购猫粮、猫砂人群比例最高的地区是江苏镇江,换句话说,这里可能是中国最爱猫的城市。值得一提的是,上世纪80年代风靡大江南北的动画片《黑猫警长》,就诞生在镇江。

飞往何处的航班最容易延误?
广州、上海、宁波、北京、丽江、西双版纳、拉萨……这是“航班延误险”反馈的结果
2012年2月底,淘宝网根据“淘宝旅行”推出的航班延误险的销售与赔偿状况,
以春运的“1月8日—2月16日”为统计周期,整理出了航班延误的城市排行榜。数据显示:广州是这一时间段飞机延误最常发生的城市,而飞向新疆阿勒泰的
航班最准时靠谱。

网购中的个性化广告

——给人方便却也让人紧张

每次上网买东西,我都会想起一位精通数理运算的朋友。他绰号“八爪”,供职于某著名的网络交易平台公司,负责数据分析。每次给外行人介绍他的职业,他都会说:“你网购时,边上会有一行‘为你推荐’或者‘您可能还喜欢’的推荐栏,我就是做这个的。”

如何根据客户之前的行为,准确预测其心中潜在的需求,制作私人化的广告?这就是八爪工作中所面临的问题,而解决它的方法,则是海量数据的整理与分析。网购数据中微小的差距和对比,到底有什么样的意义?八爪对我说,按照数理统计,在无限次的掷硬币过程中,出现正反面的几率理论上是一致的。但如果在实际的商业投资中,某一地区或领域的成功几率稍稍偏离平衡,哪怕只是高出一点点,那就可能带来巨大的商机。

但是说实话,我不喜欢八爪这个职业。每次网购或者浏览商品之后,在不同的界面中,我总会不断看到和我曾经购买的物品相同或者相似的产品——告诉我哪里价格更低,哪些商品购买的人更多。这些推荐有时让我怀疑自己曾经选购的商品买贵了,有时则让我心中不爽甚至恐慌:仿佛自己的一切行为,都在被无形的眼睛默默地看着,这些眼睛的背后,是私人侦探一般的监视者——他们可以无视一切繁杂的现象,随时在窥视你赤裸的“身体”。

在更多的网站中,基于地理位置和日常信息的推荐,同样让人不禁担心,从此隐私暴露无遗。新时代的数据革命,是否会以牺牲个人秘密为代价?

中超联赛更像中国东部足球联赛,

西北地区沦为“足球沙漠”

2014年是世界杯年,而中国足球的主要对手,并不是欧美强队,甚至已经不再是韩国、日本、伊朗,中国男足在为如何击败泰国队、越南队而苦恼。当大家都在对球员“怒其不争”的时候,阿里巴巴董事会主席马云,却注资加盟广州恒大足球俱乐部,为中国足球打入一针强心剂。

2014年中超联赛,32.4%的国内注册球员籍贯在辽宁省
依据2014年16家中超俱乐部的参赛注册信息,全部448名国内足球运动员分别
来自25个省区,其中辽宁籍球员达到145名,比排名第二位的上海球员多99名。在辽宁与上海之后,天津、广东、山东籍的球员总数也都超过30名,分列3至5位。值得一提的是,没有一名现役中超球员的籍贯归属于甘肃、内蒙古、宁夏、青海、
西藏等省区。

然而也有不同的声音:我身边一位从事体育报道的朋友给了我一份2014年广州恒大足球队的名单,队内29名国内球员中,广东籍球员有9人,遗憾的是他们大多难以打上主力位置。在20世纪,广东省是一个球星辈出的省份,可如今虽然广州恒大足球队成绩显赫,却与广东籍的球员难以扯上直接关系。

那么现在中国顶级联赛的职业球员,籍贯的分布究竟是怎样的状况呢?

2014年中超联赛16支队伍的注册球员信息中,共有国内球员448名。如果不看球员所在的球队,只依据其籍贯来汇总,我们会看到一个地域分布非常不均衡的统计结果:辽宁籍球员以145名高居榜首,上海籍球员以46名列第二位,天津与广东籍球员各有31名,山东籍30名;而甘肃、福建、海南、内蒙古、宁夏、青海、西藏等省区竟没有一名中超球员。

贺炜
中央电视台
体育频道
足球评论员
主持人
足球为什么是第一运动?在我看来,足球暗合了工业革命之后人类社会组织和运转的原理,可作为研究人类精神世界和社会活动方式的最佳模型。同时,足球是高度组织化的运动,对参与者的个人能力和组织协调性都提出了很高要求,没有科学的培养和训练,我认为一个自然人不可能拥有这样的技能。而这种高水平的训练,需要更高水平的组织架构来实施。
我国是个经济发展很不均衡的大国,沿海经济发展迅速,而西北内陆地区稍稍滞后。在足球这项运动里,我们可以直接看到这种现象的映射。由于不具备充分的人文和硬件环境,西北地区足球水平的提升受到很大限制。虽然爱好者众多,但没有足够的条件使他们的水平得到提升,或者说没有“催化剂”使他们的水平达到质变。这又会导致竞争力低下,从而削弱基层参与者的动力。如此恶性循环,就形成了目前西北地区足球贫瘠的现状。
要想改变并非一日之功,足球的发展要有经济基础,只有经济积累到一定程度,再加理念上的合理引导,才能逐渐走上正确轨道。足球的发展和社会的发展相辅相成,无法脱离整个社会环境独立存在。所以,我认为,研究中国足球的前进之道,也许同样是在为研究中国社会的前进之道贡献力量。

辽宁足球有着悠久的传统,仅大连市沙河口区东北路小学,就曾为国字号球队输送主力球员数十名。辽宁籍球员占据了国内中超球员的三分之一,可以说这里是中国最出球星的省份。但遗憾的是,包括大连在内的辽宁省球队,如今已经辉煌不在。

同样值得关注的是,西藏、青海、内蒙古等省区,喜爱足球的孩子不在少数,但竟然没有球员活跃在国内的顶级赛场,这同样让人感到唏嘘和无奈。

未来最火爆的“光棍集中营”,

将出现在江苏连云港赣榆区和

湖北武穴市

其实在地图版面上,我们很难找到均匀、规则分布的数据。资源与人口分布的不均衡,使得不同地区的各种指标都存在着或大或小的差异。

有些数据大家看完可一笑了之,有些却着实有些沉重。近几年,周围不少朋友喜得贵子——很大比例都是男孩儿,女宝宝凤毛麟角。大家相互开玩笑说,以后男孩找老婆竞争会相当残酷。

深红色区域,
很可能成为未来
最火爆的光棍集中地
第五次全国人口普查中各区县1—4岁儿童
男女比例分布图
这张地图是一家图形图像企业依据2000年第五次全国人口普查公布的数据制作的。在1至4岁的人口中,中国2800多个区县中有295个男女比例超过1.4,
也就是说100个女孩对应着140个男孩甚至更多。男女性别比例严重偏高的地区,主要集中在中国中东部,在此我们列出了性别比例最为失衡的20个区县。值得
注意的是,被调查统计的儿童如今已经成长到15—18岁,很多地区的男青年将要面对激烈的求偶竞争。制图/超擎图形 王昊

可是认真起来,这事还真不是开玩笑。从事图形图像软件行业的王昊先生和郭井顺先生依据2000年第五次全国人口普查的数据,把1—4岁的儿童分地区进行了统计,结果一张令人震惊的中国地图出现在我面前。

在中国大部分地区尤其是东部,男孩的出生比例压倒性地超过女孩。按照普遍的人口规律,在不受人类控制和干扰的情况下,世界各地出生的婴儿性别比例应该是基本一致的。男女比例一般在1.02∶1—1.07∶1之间,也就是说每出生100个女婴时,男婴出生数为102—107个。由于男婴的死亡率略高于女婴,这样到婚育年龄时,男女性别比例就基本持平。

可在中国很多地区,新生儿性别比例已经远远高出这个数字。在江苏、甘肃、河南、湖北、江西、广东的部分地区,婴幼儿男女比例已经高过1.5∶1,其中江苏连云港市的赣榆区、湖北的武穴市,男女比例竟达到2左右。

李银河
中国社会科学院社会学研究所研究员
早在1983年就已有人注意到性别比失衡问题,当时我国性别比尚属正常。最早见诸报端的性别比失衡现象是1989年关于某县情况的报道。到2007年,我国已经成为世界上出生性别比失衡最为严重、持续时间最长的国家。
人口专家认为,造成男女性别比例失调的重要原因是重男轻女,认为无儿便是断香火,许多孕妇求助于医疗技术鉴别胎儿性别。概括说来,长期父权制下形成的重男轻女思想,社会保障制度不健全,B超的普及和滥用,是导致我国出生性别比失衡的三大主要原因。
性别比失衡的危害很多,首先是“婚姻拥挤”现象的出现。根据国家统计局人口统计资料推算,目前0—19岁人口中,男性比女性多2377万。未来20年内,平均每年新进入结婚年龄的男性,比女性多120万人。同龄适婚女性短缺,男性就会向低年龄女性中择偶,挤压到一定程度,就要向别的地区发展,“婚姻剩余男性”最后沉积在低收入的贫困阶层;其次是由此导致的犯罪增加,危及婚姻和家庭稳定,使得买卖婚姻、拐卖妇女、卖淫嫖娼等违法犯罪行为大大增加。在个别出生性别比不平衡的地方,已经出现了跨境非法婚姻、跨境强行拐卖和强迫卖淫等社会问题。
目前,国家推行的扭转出生人口性别比失衡的措施主要有以下几种:首先,改变重男轻女的传统观念,倡导男女平等。采取关爱女孩行动,传播女孩也能传宗接代的理念;其次,改变婚后男居制习俗,提倡男到女家的招赘婚姻,使得婚居模式实现多样化;第三,为农村独生子女户和双女户发养老金,使农村的计划生育从单纯的行政命令向利益导向转变;第四,打击性别选择性终止妊娠行为,打击B超对胎儿性别的鉴定。
总之,出生人口性别比失衡的问题已经引起国家的高度重视,希望能够通过全国人民的共同努力遏制其发展势头,使之最终回归正常范围。

中国社会科学院社会学研究所编写的《当代中国社会结构》一书提到,改革开放以来尤其是上世纪80年代后期,我国出生人口男女性别比越来越大。2005年全国1%人口抽查显示,出生男女性别比在1.3以上的省份有5个,在1.2—1.3之间的省份有7个。另外,农村出生性别比明显高于城市。

另外根据其他的调查,中国东部一些自然村中,平均每个村子有大龄未婚男性8名;西部地区达到10名。实际上的数字可能远远不止如此。

这样的地图,不知会让多少未婚男性产生危机感。

掌握手机定位的数据,

就能像上帝一样观望人口流动

17世纪,英国经济学家,同时也是英国皇家学会创始人之一的威廉·配第出版《政治算术》一书,宣告着统计学的建立。这本书论述了所有的政府事务及与君主荣誉、百姓幸福和国家昌盛有关的事项,都可以用算术的一般法则来证实。作者以极其普通的科学原理,试图解释纷繁错综的世界。

红色区域喧闹繁华,蓝色区域比子夜还要冷清
这是一组通过不同时段开启手机定位服务的人群反馈,也就是LBS(基于地理位置的服务)数据制作的上海市人口流动的数据图。城市中心就像一块磁铁,在白天吸引人群沿磁力线般的轨迹运动。图中红色区域代表比0点时人口密度数据高,蓝色区域则代表比0点时人口密度低,具体的相对密度表示颜色如图例标尺所示。
在上午,人员大量的从城市周边向中心涌入,城市中心人数增加,周边区域的人数减少。在上午9—10点,人员涌入市中心的速度达到高峰,此后缓缓减少;在下午,没有大规模的人员流动,市区中心人口达到峰值,周边地带人口达到谷底。这预示着在这些地区是住宅较为集中的区域,白天人们离开住宅前往市中心,因此这些区域人口达到谷底,例如北面中环以北和南面外环沿线的地区。在傍晚,人员开始由市中心向周边迁移。18点前后人流量达到顶峰;在18点与20点的图上,表示人员流动的线条汇聚的地点有所差异,这其实体现出人员流动的不同模式:一些人在
下班后并不着急回到住处,而是在靠近市中心的地方购物或者娱乐,稍晚再回到郊区的住处;一些住在更远地方的人则要在回家途中消耗更多的时间。
数据提供/清华大学自动化系系统工程研究所

随着技术发展,岁月更迭,如今生活中各种可量化、可收集的数据呈现出几何级数般的增长。如何用更加独特的视角来解读经济发展中出现的种种现象,进而让数据产生更大的社会价值?“大数据”一词在这样的时代背景下应运而生,大量、高速、多样和价值,被定义为“大数据”的特点与精髓所在。

10月份某工作日,上海人口聚集度变化热力分布图

2014年春节期间,百度地图推出一个基于手机定位可视化数据而制作的国内城市间人口流动实时地图。春运可以说是短时间内极大规模的人口迁徙行为,而流动人口所携带的手机如果开启了定位功能,那么这些定位数据反馈到计算平台,就可以相对准确和及时地表现出地图上任何一个地区人员的迁入与迁出状况。

这样的数据反馈,也可以揭示一天内某一地区人口密度的变化。以北京或者上海的某个地铁站为例,如果把每一个出站的、开着手机定位的人做出一个标注点,那么点的密度几乎是与实际人数成正比的。

通过标注点的密度,我们可以查看哪个出口人多,哪个出口冷清,将这些数据分享给政府部门,可以从公交车站、餐饮车、报刊亭等诸多方面对地铁站周边的服务设施进行优化。

把手机定位的海量数据扩大到更大的范围,比如说一座城市,就可以从中读出更多的信息。从商业上看,哪些商圈在哪些时间段人流量大,结果一目了然,这些数据对于商业区的宏观规划以及商家对于店铺位置的选择都有着重要参考价值;而在出行时,人流密度的数据反馈比起道路上的路况信息没有时间滞后,可以帮助用户更有效地挖掘出最佳的行车路线,避开拥堵。

周成虎
中国科学院院士
中国科学院地理科学与资源研究所研究员
地图诞生于古老的时代,持续绵延几千年,实现了对地球整体的描述。作为一种空间分析模型,地图是一种基于空间联系的空间思维体系,并成为我们日常生活和生产中不可或缺的基本要素,其生命力在于与时俱进,不断创新。
在当今的信息社会,我们已经习以为常地用电子地图去查找商场与酒店。而百度地图制作的景区热力图,利用得到的实时人流数据,可以动态地展现人群的分布,识别热点区。这些实时、动态的地图可以帮助我们优化空间路线、识别潜在危险等。
如今,移动互联和大数据时代正在改变着地图的生产与应用方式。地图不仅应用于感知客观的物质世界空间,而且可应用于感知虚拟的精神空间。大数据要求人们改变对精确性的苛求,转而追求混杂性;要求人们改变对因果关系的追问,转而追求关联关系。这是一种革命性的思维转变。
因此,许多专家与学者,从制图、信息实时集成、使用等角度,表达了对未来新型地图的期待。这种新型地图,将以人为本,自适应用户需求,全方位动态关联与位置相关的泛在信息,以四维地图形式表达。它将表现出以下三个特点:高精度、精细化、真三维;高动态、个性化;同移动互联网及物联网紧密结合。

其实不光是手机定位反馈的信息,还有很多看似无关的数据,同样可以透露出不同地区,乃至不同城市的繁华程度:比如银行的密度、机场的吞吐量、公交线路的密度乃至公共厕所的密度等等。

9时起,人群逐渐在国贸、中关村集中
10月10日,北京人口聚集度变化热力图
图中蓝色、绿色的冷色调区域表示开启手机定位服务的人流密度相对较低,红色则表示人员密集。以首都北京2014年10月10日的数据为例:零点到7点的睡眠时间段中,热力点比较稀疏,说明当前在使用LBS定位服务的人比较少;7点后居民陆续出行上班;9点图中开始出现红色热点区域,之后至17点人群密集地主要集中在国贸CBD、中关村、金融街等区域;19点人群陆续下班回家,回龙观、通州、亦庄等远离金融中心的大型居民区人口密度逐渐上升。数据提供/百度地图—LBS开放平台

当然要想更加精确、及时地在地图上呈现出某些信息,除了用更独特的视角和方法去挖掘数据,还需要用更加复杂的方法来对数据进行收集和运算——不同数据源的叠加和融合,往往可以把很多曾经难以量化的内容精确地呈现、甚至预测出来。

“百度迁徙”直播蛇年岁末春运
离京人群最多去向哪里?
在2014春节前后,百度公司一个名为“百度迁徙”的产品引起了社会的关注。百度地图基于其拥有的LBS大数据进行计算分析,动态、即时地在中国地图上展现了那段时间人口大迁徙的轨迹与特征。截至2013年8月,百度地图开放平台反馈的日处理用户定位请求超过35亿次,海量的数据让我们得以像上帝一样观望人口的迁徙转移状况。以腊月二十六日晚上9点至10点从北京通过火车、飞机等交通工具向外扩散的人群为追踪目标,百度地图直观地显示了扩散人群最为集中的目的地。
理论上看,开启手机定位的人群,在全天中尤其是工作时间大致是和一个地区的人口密度成正相关的。除了春运,在某个城市或者城市某地区,海量的LBS数据同样对人群的行为洞察、商圈的竞争格局、舆情跟踪,以及对景区、地铁站的拥挤程度等给出极具参考价值的实时可视化信息。数据提供/百度地图—LBS开放平台

一系列采访的最后,我在中国科学院地理科学与资源研究所见到了中国科学院院士周成虎先生。他讲述了一个用大数据来预测疾病暴发的案例:2008年11月11日谷歌启动了“谷歌流感趋势”,也就是通过跟踪分析用户输入的关键词,创建地区流感图表和流感地图,以显示流感的传播方向与范围。到了2013年2月初,美国疾病控制与预防中心发布报告说,大西洋沿岸中部地区暴发了流感,但谷歌汇总的搜索数据在两周前就表明了这一状况。

当我离开地理科学与资源研究所的时候,天色已晚。面对我的种种疑问,陪同我出来的一位做数据收集的研究生,半开玩笑地说起捷克作家米兰·昆德拉的名言:“碰巧的另一种说法,就是命运。”

人类活动足迹分布图
如何去寻找世界上的繁华之所与荒野之地?面对这样的问题,旧时大多是以一种或几种客观指标来转换概念,比如以世界人口密度的分布(图1)来表现各地繁华程度的差异,进而将结论在地图上呈现出来。但人群的流动扩散以及经济建设的发展,难免让这样的结论显得简单草率。现在多家国际组织和高校,通过城市扩张、土地利用、道路水路分布以及夜晚灯光等多元数据的计算整合,制作出“人类足迹指数分布图”。充分的数据与尽可能严密的算法,正在把这个看似虚无的问题解释得更加准确。制图/国际应用系统分析研究所(IIASA) 刘伟

诚哉斯言。万物看似随机,但都有其统计学的宿命。而这一切,都离不开浩如烟海的数据信息。将这些数据通过思想和技术进一步分析、提炼、归纳,大千世界的纷繁复杂,就可能简洁有序地呈现在我们面前。

责任编辑 / 高新宇 雷东军  图片编辑 / 宋文 

版权声明

凡中国国家地理网刊登内容,未经授权许可,任何媒体和个人不得转载、链接、转贴或以其它方式使用。
已经本网书面授权的,在使用时必须注明来源。违反上述声明的,本网将追究其相关法律责任。

要评论?请先 登录 或者 注册 ,您也可以快捷登录: