新闻资讯

基于栅格的点密度计算与基于矢量的点密度计算在粮食供应研究中的比较

介绍
粮食安全被定义为人们能够实际获得安全且负担得起的食物,从而过上健康和积极的生活。这在不同的空间和时间尺度上可能意味着许多不同的事情。然而,根据粮食及农业组织(FAO)的说法,粮食安全包括粮食供应、粮食获取和粮食利用的支柱,最终目标是粮食稳定。食物供应量代表健康食物与需要者在时间、物理和地理上的接近程度,而获取则代表那些身体上能够通过各种方式购买可用食物的人,例如个性化车辆交通、步行、公共交通、拼车、在某些情况下,粮食供应和获取可以互换使用;然而,在这项研究中,粮食供应是粮食获取的一个子集。因此,食物的获取取决于可用性——容易获得的食物也容易获得,但有些人可能无法获得容易获得的食物。

定量方法阐明了粮食供应、粮食获取和粮食利用之间的关系。他们使用距离、种族/民族、贫困状况和交通便利等指标来提供帮助,但没有完全解释这一点。地理信息系统 (GIS) 是一种强大的工具,用于检查局部或全球范围内食品环境中各种因素之间的定量空间关系。这些因素包括食品成本、来源地点(人们旅行的地方)和目的地(人们旅行的地方),以采购各种形式的食品(健康和不健康),以及存储的社会经济健康环境变量枚举单位内。因此,GIS 在粮食安全研究中的应用在当今的研究中非常普遍。3、6、7、9、22 ] 。 _ _ _ _ _ _ _

在 GIS 范围内测量粮食供应的各种方法有丰富的知识。这包括数量(例如,每个邮政编码的杂货店数量)、距离(到最近的杂货店的距离)、行驶时间(到最近的杂货店的行驶时间)和密度(每平方英里的杂货店数量)或每个邮政编码的人口)指标。此外,RFEI(零售食品环境指数)使用的比率等无单位指标按计数单位衡量不健康食品店与健康食品店的比率。随附的 mRFEI(修正零售食品环境指数)表示一个普查单位内被归类为健康的商店的百分比,进一步阐明了可以充分衡量可用性的多种方式。

一元店(在本研究中被认为是 Dollar General、Dollar Tree 和 Family Dollar 特许经营店)已经在食品环境中站稳了脚跟。在 CAB(商业可用企业)数据库中没有明确表示为超市商店,它们出现在大型超市和杂货店忽视的区域。许多一元店都提供蔬菜、水果、牛奶和鸡蛋等主食,这表明超市、杂货店和健康的饮食环境。2009 年至 2022 年间,仅研究区域内的一元店数量就翻了一番(2009 年为 45 家,2016 年为 77 家,2022 年为 93 家)(图 1)。

虽然这些粮食供应指标具有明显的实用性,但对于哪种指标与其他粮食供应指标最相符,人们却几乎没有达成一致。尽管关于缺乏普遍认可的方法/指标来评估粮食不安全或粮食环境暴露的讨论一直在进行,但研究人员通常采用诸如比率和比例指标[25、28、30 ]或地理信息系统等方法。(GIS) 技术 [ 6 , 14 , 16 , 22 , 23 , 24 ],定性方法 [ 13 ],以及最近的实时信息 [26 ]。此外,很少有工作探索使用基于栅格的密度技术来衡量粮食供应量与矢量 GIS 技术的对比。在这项研究中,在测量一元店的可用性的背景下,并使用基于栅格的点密度度量来测量食物可用性的工作假设与传统的基于矢量的对应物相当,我们将探索:

开发一个模型,利用点密度计算来衡量北卡罗来纳州中部一元店的可用性,以像素尺度并按人口普查区块组进行分组(使用点密度空间分析工具)。

使用这种密度度量来描绘、评估和评价研究区域内社会经济变量背景下最可用和最不可用的街区组。

使用统计技术(使用杰卡德指数工具)将此基于密度的指标与其他传统使用的指标进行比较。

文献综述
粮食供应很大程度上取决于地理,可以使用 GIS(地理信息系统)进行测量,GIS 有助于在数字环境中创建、分析和呈现空间相关信息。虽然研究探索了气候等物理因素在非常低的范围内影响粮食安全[ 29 , 31],正如本研究所应用的那样,GIS 用于使用各种方法在更高的尺度上测量粮食供应情况。这些度量是在各种尺寸的各种多边形单元内测量的。县、州的分区通常规模过于粗略,无法表达本研究试图做到的地方一级粮食安全。更精细的单位包括人口普查区、县和人口普查区块组的细分、人口普查区的细分。其他单位包括不属于人口普查一部分的邮政编码(区域改进计划)。它们比县小,但比人口普查区大。然而,它们与人口普查单位不重叠的县重叠。

衡量可用性的一种方法是欧几里德距离,它测量源或普查单位中心(例如人口普查区或街区组)与最近的食物源(例如杂货店)之间的直线距离。这种方法已在多项研究中使用,包括 Misiaszek 等人的研究。[ 17 ],经济研究服务(2015),Zenk 等人。[ 33 ],刘易斯等人。[ 15 ]和莫里斯等人。[ 19 ],所有这些都利用地理信息系统内的直线距离来测量粮食供应量。这些分析中的计数单位有所不同,其中 Misiaszek 等人。[ 17 ],Zenk 等人。[ 33](2005)和经济研究服务(2015)利用人口普查区,Chenarides 等人。[ 9 ] 利用嵌段基团,Lewis 等人。[ 15 ]实施邮政编码,美国农业部食品获取地图集(2019)使用在整个研究区域进行调查的 500 米单元格/网格的质心。

然而,虽然欧几里得距离很容易计算,但它并不能准确地代表实际的食物环境,因为人们不会直线行驶去采购食物。因此,资源密集型网络计算可以在给定来源(出发地点)、目的地(前往的商店)以及具有阻抗(速度限制或旅行时间)的道路或人行道网络的情况下得出驾驶和步行距离/时间更好地代表实际食品环境。例如,皮尔逊等人。[ 27 ]以及后来的Morland和Evenson[ 18 ]利用了个人地址和食品地点之间的网络距离,而Algert等人的工作。[ 1 ],马尔鲁尼等人。[ 22 ] 以及穆兰古和克拉克 [20 ]利用行驶时间指标。切尔维尼等人。[ 7 ] 使用这些网络工具测量步行时间和等时线。

尽管网络计算有很多好处,但它们也有其挑战,特别是在源和目的地的选择方面。虽然将健康食品店定义为目的地很容易,但旅行来源的使用会对结果产生重大影响。在 GIS 中使用多个源在时间和资源方面可能会很昂贵。例如,在 Mulrooney 等人的一项研究中。[ 22],超过 177,000 个住宅地址被用作前往北卡罗来纳州 193 个潜在目的地的来源。使用 Dijkstra 的最短路径优先 (SPF) 算法和具有超过 98,000 个顶点的道路网络,仅计算一条路径就需要 177,000 到 90 亿次计算。存在多种抽样方法来近似来源,包括使用人口加权块组质心,如 Berke 和 Shi [ 4 ] 和美国农业部食品获取图集 [ 10 ] 所示,以及随机点 [ 24 ] 和分层随机点分布按面积和人口划分 [ 12]。对具有超过 177,000 个个人地址的 291 个人口加权区块组进行比较后发现,通过 t 检验和等价性检验进行相似性和相异性检验,行驶时间和行驶距离均在人口加权区块组质心的可接受容差范围内。

除了基于距离的测量之外,还可以使用空间连接功能在 GIS 范围内计算特定枚举单元的基本计数,该功能可对枚举单元内表示为点的食物源数量进行计数。这些计数值可以与其他计数值进行比较,或者使用缓冲液或归一化值进行进一步分析。按人口、面积归一化的计数值或将两种技术与缓冲区相结合可以提供更精细的分析。例如,Brown-Amilian [ 6 ] 发现一元店较少的人口普查区具有较高的教育程度、较少的种族/民族多样性和较高的收入。桑顿等人。[ 30] 在此基础上,通过查看枚举单位一定距离内的目的地数量,提供更详细的分析。布洛克等人。[ 5 ]探讨了按人口普查区面积标准化后,人口普查区特定距离内快餐店的密度。

无论采取何种措施,利用 GIS 评估食品环境时都存在各种限制。它们包括(1)使用质心作为真实源位置的适当代理;(2) 查点单位的大小以及奇数和沿海形状,特别是在北卡罗来纳州东部,可能会影响结果;(3)一个普查单位内食物源的相对位置,其中一个区域边界附近的食物源可能被另一个区域的许多人光顾,但根据所采用的聚集方法(计数)不计入该区域;(4) 标准化的必要性和采用的方式。然而,它们提供空间明确信息的潜力可以帮助确定需要采取干预措施来解决与食品相关的健康差异的领域。

在本研究中,将创建使用点密度计算的基于密度的栅格表面,以评估和评价北卡罗来纳州中部一元店的可用性。栅格数据可用于表示连续现象,例如高程或卫星图像,以及在本研究中存储密度。该领域的先前工作已经探索了到给定目的地的距离和/或行进时间导致行进时间表面。这与研究团队之前进行的基于栅格的食物荒漠分析一致[ 24 ]。基于成本的表面的应用在粮食安全研究中并不新鲜。Yeager 和 Gatrell [ 32 ] 通过创建插值行驶距离曲面,为伊利诺伊州农村地区开发了行驶时间曲面。哈利特和麦克德莫特 [[11 ] 还开发了一个成本面,代表根据 IRS 的机动车辆运营成本值(0.505 美元/英里)前往最近的杂货店所花费的美元成本。Chen 和 Clark [ 8 ] 将通过光栅和 3D 表面的食物获取表示为空间获取和商店营业时间的产物,从而创造了每日变化的食物荒漠。虽然在粮食安全分析中使用栅格数据可能存在其他限制,但它不会受到地理信息系统粮食环境分析中最常使用的矢量数据的离散性质的限制。使用统计方法,该密度度量的结果将与之前使用的和前述的度量进行比较,以确定它与基于矢量的对应物的比较方式和程度。

材料和方法
研究区
作为北卡罗来纳州粮食供应大型研究项目的一部分,我们在北卡罗来纳州的六个中部县进行了试点研究,包括阿拉曼斯、卡斯韦尔、查塔姆、达勒姆、奥兰治和帕森。选择该研究领域是因为 (1) 靠近作者所在机构;(2)具有可管理数量、可在本项目范围内经营的一元店的区域;(3)研究区农村到郊区和城市的结合。该地区以其强劲的经济、高品质的生活以及繁荣的文化和艺术氛围而闻名。该地区的种族和民族也很多元化,非裔美国人、西班牙裔美国人和亚裔美国人占很大比例,总人口超过 70 万。研究区域面积为 2675 英里2(6936.5 公里2)。该地区拥有几所主要大学,包括北卡罗来纳大学教堂山分校、北卡罗来纳中央大学、埃隆大学和杜克大学,提供受过高等教育的劳动力并推动创新和经济增长。研究区内有多个商场和购物中心以及一个大型户外购物中心。对于杂货,有很多选择,包括 Target、Food World、Food Lion、Harris Teeter 和 Walmart。家庭商店在所有六个县也随处可见,包括 Dollar General、Dollar Tree、Family Dollar 和 Big Lot。这些商店以实惠的价格提供种类繁多的产品,使其成为家庭和精打细算的购物者的热门选择(图 2)。

数据采集
本研究使用县边界、人口普查区和美元商店的 GIS 矢量数据进行空间分析。边界数据取自 NC OneMap ( http://www.nconemap.gov ),这是北卡罗来纳州空间数据的公共存储库。Dollar store 数据集是从 DataAxle 提供的美国商业要素类中提取的。使用“按属性选择”和“按位置选择”从具有研究区域和研究区域内 10 英里缓冲区的所有企业中按其名称(Dollar General、Family Dollar 和 Dollar Tree)提取 Dollar 商店ArcGIS Pro (v. 3.0) 中的工具,有效期至 2022 年中期。研究区域内共有 94 家一元店(10 英里边界内有 163 家),而 2009 年有 49 家(10 英里缓冲区内有 98 家)。研究区域内有 420 个人口普查区块组,人口范围为 4 至 9460 人,面积范围为 0.075 mi 2 (0.194 km 2 ) 至 63.701 mi 2 (165.182 km 2 )。

数据处理和地统计分析
所有地质统计分析均通过 Esri ArcGIS Pro 软件在地理处理工具集的帮助下进行。除了作为本研究重点的点密度指标之外,还执行了其他六种美元商店可用性分析指标,然后进行相互比较。空间分析工具集、网络分析求解器和数据管理工具集中的地理处理和统计工具用于本研究中的可用性测量。表1中描述的每个指标在下面突出显示:

A。
点密度:在此测量中,可用性被测量为在特定像素 3 英里内的像素级别测量的美元商店的密度,然后分组到块组中。点密度曲面是通过计算研究区域中每个像素位置的指定距离内的点数并将结果表示为连续曲面(栅格图层)来生成的。空间分析师ArcGIS Pro 软件的扩展模块计算每个输出栅格单元周围点要素的密度,以定义每个栅格单元周围的邻域。我们利用点密度空间分析工具来计算每个栅格单元周围 3 英里邻域内每单位面积的美元存储量。为了将其与在人口普查区块组级别收集的其他可用性指标进行比较,使用区域统计工具(也在Spatial Analyst扩展模块中)提取了生成的栅格值。这位空间分析师扩展是一套明确专注于栅格数据计算的工具。通过将区域统计表连接到人口普查块组要素类,为每个人口普查区中包含的每个像素分配一个平均点密度值。所得指标是基于该平均像素密度的密度值,如图6所示。

b.
行驶时间:在此指标中,可用性是在块组规模上衡量的,即块组质心和最近的美元商店之间的行驶时间。Network Analyst工具栏中的“最近设施”计算用于计算每个源(420 个块组质心)和最近的可能目的地(代表研究区域 10 英里内的 164 个 Dollar 商店)之间的行驶时间。此结果是每个区块组的行驶时间计算结果(以分钟为单位)。

C。
加入计数:在此指标中,可用性以位于人口普查区块组内的一元店数量来衡量。此方法仅涉及使用空间连接处理工具来计算研究区域中人口普查区块组内的 Dollar 商店数量。一些研究人员采用这种方法来衡量食物荒漠的可用性和可达性[ 2 , 6 ],所得的度量只是一个数字,代表街区组中的商店数量。

d.
缓冲区(3 英里):在此指标中,块组的可用性计算为块组 3 英里内(以及块组内的美元商店)的数量。实现了空间连接工具;但是,空间连接参数中指定的搜索半径为 3 英里。得到的度量只是一个数字,代表街区组内的商店数量以及 3 英里缓冲区。

e.
欧几里德距离:在此度量中,可用性计算为块组质心与最近的美元商店之间的欧几里德(直线)距离。这是使用近地理处理函数完成的,该函数计算输入要素(块组质心)和近要素(美元商店)之间的距离。生成的度量是以英里为单位的距离。

F。
按区域划分的商店密度:在此衡量标准中,街区组级别的可用性衡量为街区组 3 英里区域内的商店数量(方法 d),并按街区组面积标准化。此方法仅根据其大小过滤掉可能具有高缓冲区值的较大块组,结果表示为每平方英里的美元商店数量。

G。
按人口划分的商店密度:在此衡量标准中,街区组级别的可用性衡量为街区组 3 英里区域内的商店数量(方法 d),按街区组人口标准化。该方法过滤掉可能拥有更多美元商店的区域,因为这些区域的人口较多,结果表示为块组中每 1000 人的美元商店数量。

数据标准化
该项目的一个主要目标是测试衡量粮食供应的新指标(方法 a)与经过验证的现有指标(方法 b-g)的有效性。鉴于其不同的测量单位,每个指标之间的简单变化检测技术(例如,从一个指标中减去另一个指标的值并映射或分析它们的差异)是不可行的。此外,虽然每个测量单位本身都具有强大的计算价值,但它们对于非专业用户来说几乎没有价值。因此,对于每个指标,每个块组都会根据该特定指标的五分位分类分配三个值之一(最可用、最不可用、两者都不是)。例如,420 个块组的点密度(方法 a)值范围为 0 到 0.527214。“最少可用”块组表示为 84 (420 ÷ 5) 个块组,其最低值范围为 0 到 0.020521。“最可用”块组是具有最高点密度值的 84 个块组,其值范围为 0.310435 到 0.527214。对于该指标,其余 252 个块组被归类为“两者都不是”。对于其他六个指标也重复了这一点。除了 Join Count(块组内的商店数量)方法之外,大多数类都相当容易提取。计数分析的结果只有从 0 到 4 的 5 个值。由于缺乏粒度,恰好有 84 个块组具有一个或多个美元商店,这些块组被归类为“最可用”。

使用杰卡德指数的比较分析
杰卡德指数(JI),也称为杰卡德相似系数或杰卡德相似指数,是用于衡量两个数据集之间相似性的统计量。它的计算方式为两个集合之间的交集与其并集的比率。Jaccard 指数的范围为 0 到 1,值越高表示两个集合之间的相似性越高。

虽然 Jaccard 索引还可以考虑二进制向量(例如,最小可用和空),这将改变联合的大小,但此分析将使用 420 作为联合值,因为所有块组都已分配一个值并且没有空价值观。而杰卡德指数可以通过运行一些按属性选择来计算查询并除以代表两个指标并集的块组总数 (420),研究团队使用内置的 Python 工具箱模板创建了自定义 Jaccard 指数计算工具来派生输入参数(输入数据集、属性、类型)计算)和自定义 Python 代码来运行计算并输出结果。我们的 Jaccard 指数计算工具对于任何寻求分析和理解数据字段之间相似性的研究人员或专业人士来说都是一项资产(图 3)。

研究团队使用这种基于Python编程的ArcGIS杰卡德指数计算工具来对城市的不同定义进行比较分析[ 23 ]。

结果
利用很少使用的Spatial Analyst (在食品环境领域)工具创建了点密度指标(图5 ) ,然后将其分组为北卡罗来纳州中部的 420 个区块组(图6 ))。从外观上看,它与基于矢量的对应物非常相似。还计算了取自先前研究工作并在矢量 GIS 环境中计算的其他六种流行的粮食供应指标,并且根据由于简单的变化检测分析技术是不可能的,因此对每个指标进行简单的五分位数分类。在每个指标与其六个对应指标之间执行成对杰卡德指数计算(例如,点密度与欧几里得距离)。

表1表示所有七个差异度量之间的杰卡德指数值。接近 1 的值表示测量方法之间较高的一致性或相似性,而接近 0 的值表示方法之间的相似性较弱。例如,“最不可用”、“最可用”和“按面积划分的点密度”和“存储密度”指标在 420 个块组中的 81%(与所有 21 个成对计算之间的最高值并列)彼此一致。对于研究区域 420 个区块组中的 56% ,这两种分类都不一致,但欧几里得距离和按人口存储密度彼此一致(图4、5 )。

每个成对计算的杰卡德指数针对每个列/度量进行平均,从而得出与其六个对应项最一致的指标。基于此,一般观察表明点密度优于本研究中采用的其他可用性衡量标准。到目前为止,Join Count 方法的性能最差,平均 JI 值为 0.23。然而,这种糟糕的性能是由于连接计数数据被分类为“最不可用”或“最可用”的方式造成的,并且由于缺乏值的粒度而没有分配“两者都不是”类别。即使从每个指标中删除此连接计数异常值的平均值并重新计算平均值,点密度指标与其他五个食品可用性指标的比较也很好。这些在图中突出显示。 2和3。

讨论
虽然经常与食物获取的概念混为一谈,但食物供应的概念本质上主要是地理性的,代表食物来源与某个地点的接近程度。粮食供应量是粮食安全的支柱之一,并且可以在地理信息系统 (GIS) 范围内轻松地跨地点和空间进行测量。

虽然研究团队对这些分析和结果感到满意,但必须注意的是,本研究中用于衡量一元商店可用性的方法在很大程度上受到个别工具参数、限制和研究团队选择的影响。

为了支持这项研究,研究团队开发了一个临时工具来运行两个属性之间的成对杰卡德指数。它由一个使用 ArcGIS Pro 工具构建器的界面组成,请求四个参数:输入要素类、类属性 #1、类属性 #2 和 Jaccard 指数计算的类型(二进制向量或集合)。底层自定义 Python 代码计算 Jaccard 指数并输出结果。虽然可以使用“按属性选择”来计算该杰卡德指数通过功能和手动计算,研究团队预见了生物地理学、农业、遥感、环境科学、社会学和刑事司法等领域的名义和类别属性比较的实用性,并计划开发一种自定义工具来在向量内执行此操作和栅格数据环境。

结论
在本研究中,使用传统矢量技术以及引入基于栅格的密度计算来计算 Dollar General、Family Dollar 和 Dollar Tree 等 Dollar 商店的可用性。之所以选择一元店作为食物来源,是因为它们的样本量足够大,而且在北卡罗来纳州中部 6 个县的研究区域内的城市/郊区/乡村景观中无处不在,该区域有超过 70 万人口。为研究区域创建的基于栅格的密度度量本质上测量了研究区域内以及研究区域 10 英里缓冲区内的美元商店的密度。这样做是因为居住在研究区域内的人们可能与研究区域外的一元店“更接近”(无论每个指标是如何定义的)。 (图 6)被分为人口普查区块组(图 7 ),区块组根据所得密度指标的简单五分位数分类被分类为“最不可用”、“最可用”或“两者都不是”(图10 )。其他可用性指标,例如到最近的一元店的行驶时间(图 8a)、连接计数(图 8b)统计数据,该统计数据基本上计算每个街区组内的一元店数量和区域密度(图 9 )a) 还计算了一元商店的密度(每平方英里街区群 3 英里内的商店数量)。由于每个测量都有其自己独特的测量单位,不允许进行简单比较,因此每个块组根据上述五分位数分类被分类为“最不可用”、“最可用”或“两者都不是”(图10  )。研究团队创建了一个自定义 Python 工具,其中计算了每个度量的类之间的一致性百分比(通过 0 到 1 之间的值)的成对 Jaccard 指数,并且所有 21 个成对计算随后被放入结果表并进一步总结(表1)。即使删除了异常值,点密度指标的表现也略好于基于矢量的指标。总之,主要结果突出:

用于衡量食物供应量的基于密度的指标易于计算,不需要更强大的网络计算(例如行驶时间和行驶距离)、地理处理计算(例如连接计数和缓冲区),也不需要现场操作(例如密度)(按面积或区域)人口)指标。

使用成对的杰卡德指数进行汇总,然后在相关表(表1)中进行平均,与其他 6 种流行的基于矢量的技术相比,点密度测量评分最高 (0.65)。由于创建粗分类的连接计数统计数据缺乏粒度,因此在没有连接计数杰卡德指数的情况下计算了新的平均杰卡德指数。即便如此,该指标的平均杰卡德指数 (0.74) 仍高于其他 5 个指标,包括行驶时间 (0.67)、缓冲区 (0.70)、欧氏距离 (0.66)、按面积划分的商店密度 (0.72) 和商店密度按人口 (0.67)。

这项研究的辅助结果强调了研究区域的六个县,根据点密度指标,阿拉曼斯县拥有进入一元商店的最佳机会。这很有趣,因为阿拉曼斯县的密度比达勒姆县更高(0.23 比 0.21),而且一元店也更多(34 比 28),达勒姆县的人口几乎是阿拉曼斯县的两倍。该县位于格林斯博罗和达勒姆等大城市之间,是未来更大规模研究的主题。

虽然进一步的工作可能希望将这些空间关系与区块组层面的社会经济变量和长期健康结果保持一致,但这项研究强调了传统上不使用的基于密度的可用性指标的功效和实用性。食品环境的空间表征。该指标不需要强大的网络计算(例如行驶时间计算),并且提供比简单的多边形点甚至空间连接操作产生的缓冲区计算更多的粒度。洞察广告。

未来定量评估粮食供应量的工作,最终目标是制定地方、区域甚至州级政策,应该批判性地、全面地考虑这一指标,将其视为强大而方便的指标,可以由非专业 GIS 用户轻松计算并为任何人所理解。

发布日期:2024-02-26