基于开源大数据的餐饮业分布格局研究——以南京市为例文献综述

 2022-07-07 01:07

基于大数据的城市餐饮业格局分析研究进展

0.引言

随着生活水平的不断提高,人们对于餐饮水平越发注重,这给餐饮服务业的蓬勃发展提供了机会,给我国餐饮业带来了生机。餐饮业作为城市格局的重要组成部分,长期以来一直是城市地理中的研究热点。随着信息化社会的发展,大量空间数据的产生使得城市空间分析所需的数据获取更为便利,基于网络大数据的研究方法逐渐代替了传统的采集取样的方法,空间大数据的空间分析方法应运而生,传统机器学习中的各种聚类算法等各类算法的进步也为更好的进行大数据空间分布规律分析打下了基础,可以对样本对象进行密度分析,层次分析等操作,帮助研究者们更便利的探索了解城市发展的规律和特点。

1城市餐饮业空间格局分析的数据源

在大数据时代到来之前,研究者们对于城市空间分布格局已展开相关研究。张旭等通过在网络上搜索,结合实地调研各类餐饮设施的方法获取到了南京4815家餐饮店的空间信息[1]。邬伦等则采集了香港岛部分地区的其中的62个餐饮店、53个公交站和68个旅游景点作为研究对象进行研究[2]。这些研究运用采集数据和官方统计数据对城市餐饮业分布结构进行分析,对城市规划和发展具有一定的指导性意义,是对城市餐饮业在微观上的分析。在当今不断发展的大数据时代,用大量的样本数据点来分析提取城市餐饮业空间集群的需求应运而生,对于城市的不同区域的餐饮业分析需要更精确更广泛的数据,从宏观层面上进行城市空间分析。

近年来互联网和移动设备的发展使得地理空间信息的数据呈爆炸式增长,这为空间大数据的获取以及城市空间分析提供了新的平台和方式。在这样的形势下,结合开源大数据进行城市空间结构的分析已经成为当下学者研究城市空间的主流方向之一。而在城市空间中,餐饮业作为城市服务业的一个极其重要的环节,对城市组成影响深远。因此,用餐饮大数据研究其空间集聚特征及影响其布局的社会、经济、文化等因素,可以辅助政府部门和规划部门审视和剖析处于快速发展中的城市空间结构,指导城市规划建设和产业选择,具有十分重要的研究意义。而且伴随着算法和计算方法的进展,利用空间大数据进行空间分析的方式也变得多种多样。如徐晓宇等、谭欣等、杨帆等运通数据挖掘技术(网络爬虫等)从互联网上获取了所需的地理信息数据[3][4][5]。Liao C等结合当今大数据分析的发展指出,通过大数据平台进行空间分析是时代所趋,是非常高效的分析方法[6]

2. 城市餐饮业空间格局分析方法

目前已有学者采用多种方法对城市餐饮业的空间格局展开研究。张旭等运用ArcGIS软件,通过对南京市的部分不同种类餐饮店的分布进行统计分析,发现餐饮店的分布和区域经济情况、人口分布、交通状况有着紧密联系,市内餐饮店分布呈现出较大差异性的特点[1]。邬伦等根据采集到的POI数据,运用网络K函数法,揭示了香港岛的餐饮业分布与交通设施的分布呈现出显著聚集的关系[2]。这些研究运用采集数据和官方统计数据对城市餐饮业分布结构进行分析,对城市规划和发展具有一定的指导性意义。谭欣等运用圆圈统计图分析离群点,并使用核密度分析法从空间分布、人均消费和网络口碑3个视角发现北京餐馆的空间分布格局存在“一主两副多中心”的特点[4]。核密度分析是用于空间密度分析最常用的方法之一,秦萧等运用核密度分析法,基于大众点评的商家信息,得到了南京市的餐饮业集中于主城区典型商圈的结论[7]。万傲青等用标准差椭圆分析法和最邻近距离法辅以核密度分析法,揭示了武汉的呈多中心分布,且多位于二环以内的餐饮业分布特征[8]。曾璇等则运用了改进后的网格核密度方法,搭配网络双变量K函数法,发现海珠区餐饮店呈现“西密东疏”的空间分布模式,具有多中心的空间分布特征[9]。Shixiao Zhai等运用核密度分析法和空间异质性分析中的莫兰指数对杭州的餐饮分布进行分析,发现杭州市的餐饮主要分布在老城区的特点[10]

数据挖掘的聚类算法也是空间格局分析中被广泛运用的算法。与其他的空间分析方法相比,空间聚类分析考虑到了空间拓扑关系,可以更好地解决空间密度问题,识别出空间簇形态多样性,是现代空间分析的热点方向之一,如徐晓宇等运用CFSFDP算法来提取餐饮店的聚类中心,发现北京市的餐饮店在总体上 呈现东多西少,且由主城区为核心向外聚集程度逐级递减并沿交通线扩展的特点[3]。张庆等使用了聚类算法中的K-means算法得到杭州市具有四个等级的生产性服务业聚集区[11]。李江苏和杨帆等运用了DBSCAN聚类算法分别对郑州市郑东新区及广州市的餐饮店地理数据进行聚类分析,结果为两地餐饮店分别呈“414”空间分布体系和“一主两副”的空间结构的特点[12] [5]。M.Parimala等指出DBSCAN算法可以对任意形状的稠密数据集进行聚类,适用于大型数据库。具有能发现异常点,对数据集中的异常点不敏感,结果没有偏倚等优点,被广泛应用于地理空间分析之中[13]

通过对识别出的集群进行几何形态分析,可进一步揭示餐饮业集群的空间特征,也是城市空间分析的重要一环。杨帆等在通过聚类算法得出了广州市的餐饮业类簇后,运用K-means算法将集群进行等级划分为6类,再引入中心地理论模型进行验证,判断广州市的餐饮分布发展是否满足假设[5]。之后计算了各餐饮集群的空间形态指数,按照赖怡琳提出的划分标准判断广州市的形态指标以评价广州市餐饮业分布情况[14]

3城市餐饮业空间格局的影响因素

在提取了餐饮业的空间分布特征后,对其形成原因进行分析也是城市餐饮业空间格局的重要研究内容。曾璇等运用网络K函数法分析得到餐饮店分布与公交站点在较小尺度下表现出显著的聚集关系,与居民区的相互聚集关系不显著的结论[9]。网络K函数法可以用于分析两个变量之间的相关性,在空间格局分析中可以用来判断地理分布和不同影响因素的关系。上文中介绍到的邬伦等也运用了此方法,得到了香港岛的餐饮分布与交通设施呈相关性,与旅游景点呈非相关性[2]。相关性分析和多元回归分析同作为判断变量之间的相关程度的方法,王盼盼等运用相关性分析,将西安市的空间分布格局和人口分布、旅游资源、交通便捷度进行分析,得到中观层面的结论[15],万傲青等则用Person简单系数相关分析得到影响武汉市餐饮业空间分布的六个因素,即经济、人口、交通、文化、旅游、和城市空间格局[8]。谭欣等运用了相关性分析来对所研究出的城市餐饮业的分布原因进行分析[4]。曾璇等在另一文中运用了多元回归分析,将餐饮店与居民区、就业分布、交通站点和基准地价建立回归模型,得到不同菜系与不同因素之间的相关大小[16]。程易易等使用空间句法判断成都市交通网对其餐饮业的影响,揭示出成都市道路集成高的地方餐饮业分布集中的趋势[17]。根据多为研究者们的研究结果,可以发现出人口分布和交通分布是影响城市餐饮业分布的主要因素。

4 总结

近年来,大量的学者们一直在致力于城市空间结构的研究,而随着信息化社会和大数据时代的到来,基于大数据的空间分析方法逐步取代了以取样调查为主的空间统计方法。在大数据分析方法中,空间聚类算法又因其准确、稳定得到了广大研究者的青睐。同时,空间格局分析也开始进入研究者们的视野,用以判定城市发展的合理性。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。