新闻资讯

使用自组织层次结构减少集体感知的不确定性

介绍
增加机器人群的自主性是一个公开的挑战。例如,在集体决策中,机器人群尚无法自主识别何时需要做出集体决策并触发该过程[ 1 ]。充分的集体自治需要对多种组成能力采取总体任务方法,包括准确的集体感知和可管理的集体驱动。然而,现有的方法通常是特定于任务的,并且准确性和可管理性等特征在群体机器人技术中具有挑战性——如果要显着提高群体自主性,就需要创新。
应对这些挑战的一种方法是将某种层次结构引入到完全去中心化的系统中。自组织层次结构已被确定为未来机器人群的重要研究方向[ 2,3 ]。然而,如果在机器人群中实现层次结构,那么可扩展性和容错性等特性一定不能丢失。事实上,研究自组织层次结构的动机是将集中式控制和分散式控制的各个方面结合起来,理想情况下是在一个系统中获得两者的好处。在本文中,我们基于现有的可合并神经系统(MNS)概念,提出了一种用于集体感知的自组织层次方法[ 4,5 ]]。我们根据经验将所提出的方法与三种完全去中心化的方法作为基准进行比较,评估准确性是否得到提高以及可扩展性和容错性是否得到保留。

在机器人群中,集体感知——即一组以自组织方式协作的智能体对环境的感知——可以被视为一种集体决策[ 6 ]。群体必须​​既收集信息又集中于对该信息的共同理解。群体机器人技术实现集体感知(例如,[ 7 , 8])通常具有可扩展性和容错性,因为它们不依赖于完全连接或静态的通信网络,并且不存在单点故障,例如基站或固定领导者。这些方法还具有强大的自主潜力,因为它们不需要访问外部基础设施或广泛的先验知识。然而,由于完全去中心化的方法通过共识达成集体决策,因此准确性具有挑战性(与完全中心化的方法相比),并且收敛时间可能很长[ 9 ]。

集中感知方法通常利用信息融合。多传感器和多机器人融合问题已经很好理解,现有方法也很强大[ 10-13 ]。然而,这些方法通常使用全球定位基础设施、预定义或静态位置或限制可扩展性或容错的其他解决方案(与群体机器人方法相比)来了解系统中所有机器人或传感器的位置,并且通常还了解系统中的姿态。对于大多数感知问题,完全去中心化的信息融合尚未开发出来。
我们提出自组织层次结构作为机器人在系统范围内理解其相对位置并在某一点融合其集体信息的一种方式,而不依赖于固定位置、完全连接或固定的通信拓扑、外部基础设施或其他限制性特征。先验知识。

相关工作
在本小节中,我们概述了现有的完全去中心化的机器人集体感知方法,其中感知通常被表述为最佳决策问题。我们还概述了现有的不完全去中心化的多机器人感知方法,这些方法通常关注信息融合问题。然后我们讨论自组织系统中信息融合的主题,该主题几乎没有现有的方法。最后,我们简要讨论绝对条件与相对条件的感知。

表中总结了集体和多机器人感知方法。它们是根据感知信息是否在数据级别(例如图像)、特征级别或决策级别融合来组织的,基于[ 13 ]中定义的多传感器融合级别。它们还根据所做出的感知决策的类型进行组织:离散的n最佳决策[ 6 ]、连续值的估计[ 6 ]或目标跟踪,例如移动物体或静止地标,包括用于映射或同时定位和建图(SLAM)。

完全去中心化的感知
所有完全去中心化的集体感知方法都使用未完全连接的动态通信网络(即机器人无法在全球范围内广播,并且本地连接也不是静态的)。这些方法中的大多数都被设置为n最佳决策问题(参见[ 6 ]),其中机器人群根据给定标准比较多个选项。在一种常见的设置中,机器人感知环境中的颜色,并根据最高代表性的标准对它们进行比较 [ 8 , 14 – 18 ]。在另一种设置中,机器人根据质量标准比较离散区域,该质量标准可以从区域中的任何位置进行感知 [ 7 , 19 ,20 ]。在类似的设置中,机器人聚集在某种类型的环境特征上,通过集体决定适当的阈值来检测它[ 21 ]或共享检测到的最大值,以便触发处于局部最优的机器人进一步探索[ 22 ]。在[ 23 ]中,机器人通过共享感知信息来估计散布在环境中的瓷砖的密度,包括样本计数和基于时间的递减值。在[ 24 ]中,机器人利用机器人位置和方向的不完整知识,通过与邻居共享关于目标位置的本地信念来协作跟踪移动目标。

感知不完全分散
所有未完全分散的方法在信息融合期间都使用固定或已知的机器人位置。在大多数这些方法中,机器人使用已知的机器人位置协作跟踪目标,例如通过传感器读数的数据级融合[ 26 ]、感知信息和相关不确定性的特征级融合[ 28 ]或估计的决策级融合。位置[ 27 ],这可以通过在基站合并的手动注释来支持[ 30 ]。在一些跟踪方法中,目标作为映射或 SLAM 的一部分进行跟踪,例如,通过基站估计位置的决策级融合[ 29 ],有时还得到有关环境的先验信息的支持[ 31 ]]。在SLAM中,机器人的位置事先是未知的,但是在融合有关跟踪目标(例如,静止地标)的信息的过程中,可以获取估计所有机器人位置所需的信息。除了目标跟踪之外,文献还包括一些用于最佳决策的非完全分散方法。在[ 32 ]中,机器人建立了一个固定的通信网络来训练一个系统范围的人工神经网络,该网络对环境中的全局光模式进行分类。在[ 33 ]中,具有已知相对位置的静态机器人将红外传感器读数发送到基站以识别预定义集合中的物体。在[ 34],机器人从预定义的集合中识别手势,并根据已知的机器人位置合并他们的意见。在这种方法中,通信网络在信息融合过程中是完全连接的(尽管研究了丢包的影响)。

机器人群融合
大多数现有的多传感器融合方法都需要访问显式或隐式位置信息(参见[ 10-13 ] )。这些方法已经很成熟,如果可以在机器人系统中实现,那么它们将适用于许多应用。然而,如果将这些方法应用于使用全局广播或具有固定拓扑的网络的机器人系统,系统的可扩展性和容错能力将不足。理想情况下,需要位置信息的现有方法将以自组织方式在机器人系统中实现,但这种组合具有挑战性。在表中,有一种方法[ 27 ],它融合了基于已知机器人位置的信息(即,在表)并且可以在动态拓扑下运行(即表中的蓝色和粗体)。然而,这种方法假设完全了解机器人的绝对位置和方向,但不能始终保证其可用性。简而言之,位置引导的信息融合方法目前无法用于自组织集体感知。在本文中,我们提出基于 MNS 概念的自组织层次结构作为通用框架,其中现有的多传感器融合技术可以实现集体感知,而不使用限制性机制(例如,固定的中央协调实体或固定的通信拓扑) )阻碍了理想的群体机器人特性。

感知绝对
文献中完全分散的方法应用于相对条件的感知(例如,红色或蓝色是否更具有代表性)或使用感知信息完成目标动作(例如,聚合[ 22 ])。这些研究的结果不一定可以直接转化为对绝对条件的感知。例如,当感知更具代表性的颜色时,如果群体低估或高估了绝对密度,它可能会在某种程度上一致地对每种颜色这样做,因此仍然能够准确地确定哪种颜色更具代表性。文献中的一个例外是[ 23],其中对绝对密度的感知被评估为辅助贡献(主要焦点是完成有针对性的行动)。在报告的结果中,群体对密度的感知与地面事实存在很大差异。总之,绝对条件的集体感知仍需进一步研究。在本研究中,我们在新的实验设置中测试了一些最准确的相对条件方法,以便在感知绝对条件时对完全分散方法中存在的近似误差(包含偏差和方差)进行基准测试。

纸张结构
本文的其余部分安排如下。在材料和方法中,我们首先讨论集体感知中的统计不确定性,并确定两个不确定性来源,这些来源并不存在于所有空间采样和推理问题中,但在使用移动机器人采样时至关重要。然后,我们介绍并描述了所提出的自组织层次方法、选择作为比较基准的三种完全去中心化方法以及实验的设计和设置。我们在结果中报告比较实验的结果,在讨论中讨论结果和未来的工作,最后在结论中总结我们的结论。

材料和方法
集体认知的不确定性
地面机器人的集体感知通常是一个二维(2D)空间采样和推理问题(参见[ 35 ])。换句话说,机器人需要收集二维空间变化的信息样本,并使用这些样本进行一些估计,例如某个区域的平均值或总值(例如,平均温度、平均噪音水平、总日光覆盖范围、或土壤总毒性)或某些物体在相对坐标系内的位置。

在本文中,我们断言,通过减少或消除集体感知中通常存在的不确定性的关键来源,与完全去中心化的方法相比,精心设计的自组织层次方法可以在不牺牲可扩展性和容错性的情况下提供更准确的估计。接近。我们根据经验检验了这一断言。

问题陈述
我们基于 MNS 概念开发了一种用于集体感知的自组织层次方法,并在模拟实验中针对完全分散的集体感知对其进行了测试。在自组织层次方法(Hier)中,扮演“大脑”临时角色的机器人利用所有机器人按层次合并的集体传感器信息,代表群体形成一种集体意见。在完全去中心化的方法中,每个机器人(显式或隐式地)参与集体决策过程,以形成自己的意见并与同伴达成去中心化的共识。

我们将Hier方法与以下三种完全去中心化的方法进行了测试,作为比较的基准。
•    
投票者决策模型(Vote):每个机器人从自己及其邻居的当前意见中随机选择新意见(基于[ 8 ])。
•    
平均决策模型(Mean):每个机器人对自己及其邻居的意见进行平均(基于[ 8 ])。
•    
Stigmergy(Stig):机器人不会明确地进行交流,而是在环境中为彼此留下观察线索(基于[ 36 ])。
在所有方法中,模拟地面机器人都使用短程机载传感来检测随机分布在未知大小的区域中的一些物体。他们的集体目标是对整个竞技场中物体的密度形成准确的看法。

在本文中,机器人通过检测单个物体来收集样本,然后使用里程计和自身传感器范围的知识来推断竞技场中物体密度的平均值或分布。

绝对物体密度λ  =  b / a定义为每单位面积a的物体b数量。环境中的真实密度λ用λ true表示。机器人不会获得有关物体或场地的大小和形状的任何信息。机器人只知道自己视野的尺寸,并且必须使用这些知识来推断每单位面积的物体数量。

集体感知方法
机器人运行两个并行进程。
•    
流程A:机器人r单独计数检测到的物体并推断其自身视野内的密度。
•    
过程 B:机器人通过过程 A 的输入或输出影响群体的集体意见,机器人r对竞技场中的绝对对象密度 ( λ ) 形成其意见。
机器人仅使用本地或间接通信来影响群体的集体意见,因此每种方法的运动例程和通信规则在过程B的描述中给出。
除了调整参数之外,每种方法( Hier、Vote、Mean和Stig )中的过程 A 都是相同的。每种方法中的过程 B 都不同。

Hier方法基于现有的MNS概念,它是构建和重构自组织层次结构的通用框架[ 4 ]。在MNS框架下,机器人可以自组织动态自组织控制网络,其中机器人临时且可互换地占据领导层级中的某些位置,包括MNS大脑位置(即最高层级位置)[ 5,37,40 , 41]。在 MNS 控制网络中,每个机器人仅与其直接邻居通信,以防止在完全集中式系统中的通信中心出现瓶颈类型。根据任务规范和系统约束,传感器信息可以在向上游传递时合并,控制信息可以在向下游传递时取消合并,并且可以主动管理个体行为与集体行为的平衡。这种灵活性可用于减少或消除整个分层网络中潜在的瓶颈(见图2)。

在本研究中,我们使用了[ 5 ]的MNS实现,其中配备摄像头的无人机(UAV)负责感测地面机器人的相对位置和方向,以便在清扫过程中保持机器人编队在一起。(请注意,本研究中Hier方法中的无人机无法直接感知物体,因此不会增加该方法中可用的总感知范围。如果我们使用能够感知彼此相对位置和方向的地面机器人,则无人机可以删除,并且这种删除不会对集体感知结果产生影响。)我们使用[ 40 ]的扫描技术并将其应用于集体感知任务。

模拟设置
实验在 ARGoS 模拟器 [ 44 ] 中进行,机器人模型使用现有插件实现 [ 45 , 46 ]。这些实验是使用基于扩展 e-puck 机器人 [47-49] 的小型差动驱动地面机器人的运动学进行的,对于 Hier 方法,是基于 S-drone 四旋翼飞行器 [50 ]的四摄像头无人机的运动学。有关所有四种方法的更多实现细节以及 ARGoS 中的实验设置,请参阅开源代码存储库 ( https://github.com/BlueDiamond07/Collective_perception )。
在所有方法和所有设置中,只有地面机器人具有直接感知物体的能力。在除可扩展性之外的所有设置中,每种方法都有 8 个地面机器人。所有方法中的所有机器人都具有相同的平均线速度(7.5 厘米/秒)。实验在机器人开始清扫场地时开始,并在 50,000 个时间步长(2,000 秒)后结束。

调整参数
关于方程中的参数。如图1所示,在Mean和Vote方法中,机器人r的视野面积v基于机载物体感测的传感器范围,而在Stig方法中,v基于机载信息素感测的传感器范围。在Hier方法中,v基于所有地面机器人组合传感器范围的最大界限。请注意,在所有方法中,所有地面机器人都具有相同的传感器范围来检测物体(短程半径ρ 1)。

在手动测试阶段,对每种方法的参数P进行了单独调整,以减少方程输出中可观察到的偏差。每种方法1 个。为了防止依赖先验知识,调整阶段没有调整到特定的密度条件。相对于 MNS 方法的确定性扫描,调整P的目的是补偿分散方法中运动例程的随机性。在Hier方法中,MNS 脑机器人的运动轨迹是确定性的,因此P  = 1。对于每种完全分散的方法,我们调整P通过试错测试阶段,从方程式中获得最高的可观察性能。每种方法1 个。在经验调整阶段之后,我们将P设置如下:选民模型P  = 0.48,平均模型P  = 0.55,stigmergy P  = 1。请注意,原则上P可以在所有方法中进行优化(参见讨论)。


在Hier方法的过程B的运动例程中,机器人自组织成大致线性的队形来清扫环境(详细信息参见[ 40 ])。在Hier方法中,MNS 大脑机器人r检测竞技场边界线并使用确定性过程对其做出反应。MNS 的集体地面机器人传感器范围的尺寸由 MNS 根据编队中地面机器人的数量计算得出,并用作确定性过程中的参数。MNS 使用标准的前后方向运动来反应性地扫描未知环境 [ 42]。反应性侧向运动基于 MNS 对自身尺寸的了解,以便地面机器人的集体传感器范围可以尽可能完整地覆盖环境。

结果
结果表明,在时不变随机场和时变随机场下,与完全去中心化的基准方法相比, Hier方法具有更高的准确性、更一致的准确性和更快的反应时间。

在时变场下,当完全去中心化的方法能够收敛时,这三种方法都比Hier方法显示出明显更多的错误。在时变随机场的所有变化下, Hier方法的反应也比其他方法快得多。这和Vote方法收敛速度相对较快,但Stig方法收敛速度相对较慢,且波动较大。它无法在 400 秒内收敛(见图5 D)。在快速波动下,这些模式会加剧(见图5 A 和 C)。平均值和​投票方法在快速、微小的波动下几乎没有足够的时间收敛,而在快速、大的波动下根本无法收敛。在转向更高的λ true后,Stig方法永远没有足够的时间来接近收敛。当完全去中心化的方法在快速波动下收敛时,其精度与慢速波动下的精度相同。
总体而言,Hier方法显示出最低的误差(详细信息请参阅表S1至S5 )。在时不变场下(见图4),Hier方法的平均误差非常小,几乎可以忽略不计。

可扩展性
在可扩展性设置中,在测试的组大小中,没有一种方法显示出随着组大小的增加而精度下降(见图7),这意味着尚未达到机器人间干扰可能对精度产生负面影响的阈值。(请注意,这也意味着没有一种方法,包括Hier方法,在这些大小下显示出瓶颈。有关 MNS 方法中瓶颈的更多讨论,请参阅 [ 43 ]。)相反,我们看到某些方法的性能适度下降。随着群体规模的减小而接近。组大小之间的准确度差异平均方法是最引人注目的,但仍然相对较小;然而,在较小的组规模中,其准确性也不太一致,显示出更大且更频繁的峰值。Hier和Stig方法中组大小之间的准确度差异非常小,而Vote方法显示组大小之间没有差异。总体而言,所有四种方法都显示出良好的准确性可扩展性,随着组大小的增加,准确性保持不变或提高。投票方法还显示出对较小群体规模的相对较好的弹性。然而,值得注意的是,尽管该投票的准确性方法的准确性不会因为较小的组而变差,但它在所有组大小中都显示出比希尔或斯蒂格以他们最差的团体规模接近。

容错能力
在容错设置中,随着机器人故障百分比的增加,所有四种方法的准确性均显着下降(见图8)。这是预料之中的,因为容错设置非常具有挑战性——失败的机器人继续移动和通信,但总是记录它们直接检测到零个物体,从而在采样方法期间引入额外的偏差
一些容错变体可以被认为具有匹配的相应可扩展性变体,例如,50%故障的容错条件使群拥有 4 个故障和 4 个正常工作的地面机器人,这与 4 个地面的可扩展性条件匹配机器人。当将 50% 故障下的准确度与匹配的可扩展性变体进行比较时,Hier和Mean方法仅显示出稍多的错误,而Vote方法显示出更明显的错误增加。相比之下,Stig方法没有显示出明显的差异。所有四种方法都显示错误率同样大幅增加,从 50% 失败增加到 75%。在 75% 故障(最高故障率)下,Hier方法的误差明显小于平均值和投票方法。在 75% 失败率下,Hier方法显示的错误略小于Stig方法,但一致性较差(峰值明显较高)。

总体而言,Stig方法显示从无失败到 75% 失败的错误增加最少,而其他方法显示出类似的增加量。然而,在无故障、25% 和 50% 故障情况下, Hier方法的平均误差低于Stig方法,并且在 75% 故障情况下的平均误差相当(但仍略低)。在所有故障率下,平均法和投票法比其他两种方法显示出更多的错误。因此,Hier方法显示容错设置中总体误差最小。

总体而言,所有四种方法在准确性的容错性方面大致相当,Hier方法的总体误差最小,Stig方法的容错性最一致。

概括
实验结果可概括如下:(a)Hier方法比其他三种方法表现出更高、更一致的精度,并且反应更准确、更快;(b) Vote方法在群体规模变化的情况下显示出最小的准确度变化,但Hier方法在所有群体规模下显示出最高的总体准确度;(c) Stig方法在故障率变化下显示出最小的准确度变化,但Hier方法在所有故障率下显示出最高的总体准确度。

讨论
根据本文的断言,在机器人没有故障的情况下,Hier方法应该能够以非常低的不确定性进行集体感知。

在空间不均匀的环境下,将结果与密度测量的参考集进行比较,所有四种方法的意见分布都显示出与参考分布的相似性,四种方法之间的性能差异尚无定论。总体而言,经验结果表明分布估计(给定环境实例中的密度分布λ true或λ true的总体概率分布)原则上,这四种方法中的任何一种都是可行的,并且需要进一步研究来评估它们之间的性能差异。然而,在实践中,完全分散的分布估计方法(例如,概率分布拟合)将使每个机器人只能访问总样本的子集,或者访问关于整体分布的异步更新的意见,从而引入额外的不确定性来源。相比之下, Hier方法中可用于分布估计的信息将与图6中所示的相同,没有额外的不确定性来源。
同样基于本文的断言,在测试可扩展性和容错性的设置中,与完全去中心化的方法相比, Hier方法应该能够进行集体感知,而不会出现任何有意义的错误增加。事实上,在所有可扩展性和容错设置中,Hier方法中的误差不会增加到超过与任何其他方法相当的水平,并且在大多数这些变体中,Hier方法的误差低于所有其他方法。因此,实证结果再次符合预期:Hier的可扩展性和容错性可以认为该方法与其他方法相当。因此,结果支持这样的断言:自组织层次结构尽管引入了集中控制的某些方面,但仍可以保持分散控制的有益方面。

投票方法的性能不佳
尽管选民决策模型已被证明在离散的最佳决策(例如,选择几种颜色选项之一)方面相对准确,但这是因为它能够很好地准确地收敛于一个问题中最常见的意见。团体。当处理连续随机场的高方差样本时,它没有机制来补偿采样中的偏差或减少方差——它本质上是对群体成员之间的几个高度偏差的意见进行洗牌,因此投票者前后的意见分布决策模型过程在统计上是无法区分的。

结论
我们已经确定了集体感知问题中存在的不确定性来源,特别是在没有先验知识的情况下感知绝对条件时,并详细说明了为什么通过使用自组织层次结构可以减少这种不确定性。我们通过证明概念验证自组织层次方法(基于 MNS 框架)通常比完全去中心化的基准方法更准确、更一致和更快,从经验上支持了这一主张。我们还表明,与完全分散的基准方法相比,集体感知的自组织层次方法除了产生更准确的空间数据估计之外,不会遭受实质性的可扩展性或容错性缺点。我们还测试了具有高度异质性的空间不均匀环境,并表明与参考样本相比,自组织层次方法在准确性方面与其他方法相当。因此,可以利用在自组织层次结构下设计系统范围行为的相对容易性,而不会降低通常与群体机器人方法相关的性能优势。

发布日期:2024-03-11