新闻资讯
介绍
眼球追踪技术和研究的进步凸显了一个诱人的前景:有可能开发出一种依赖于眼球追踪的标准化词汇评估。这种评估将有利于评估那些难以用手指或发声来表达其知识的人群的语言知识,包括患有脑瘫等运动障碍的儿童 [ 1 , 2 ]、自闭症儿童 [ 3 , 4 , 5 ] 或年幼的婴儿 [ 6 , 7 ]。众所周知,这些人群中的儿童由于任务的行为要求而难以进行标准化评估,通常无法参与(例如,[ 4,5 ])。通过这种方式,眼动追踪评估是满足主要临床需求的理想解决方案。
例如,眼动追踪可以用作评估的一部分,以收集临床医生可能无法获取的有关接受性语言的信息(例如通过具有高行为要求的标准化评估)。掌握接受能力对于临床决策至关重要。接受性语言眼动追踪评估可以深入了解说话晚者或很少说话的自闭症儿童除了观察到的表达能力之外是否存在接受能力延迟。反过来,这将指导目标设定和干预方法。
目前,临床医生尚未采用眼动追踪技术,这主要是由于技术成本和可用性过高,但也可能是由于缺乏可用的评估和解释指南。然而,随着技术和人工智能领域的快速发展,可以想象,眼球追踪评估有一天会得到普遍应用。目前,研究环境中经常使用眼动追踪来评估词汇量,以解决有关语言发展的各种问题。具有里程碑意义的研究表明,通过眼球追踪测量的词汇处理速度可以预测典型发育儿童的并发和后期语言能力[ 8,9,10]和迟到的说话者[ 11 ]。其他研究表明,在自闭症儿童中,眼动追踪比标准化评估更好地捕捉词汇知识 [ 12 , 13 ]。Lany [ 14 ] 最近证明,通过眼动追踪测量的语言处理速度可以预测幼儿同时进行的名词学习能力。总而言之,这些研究证明了使用眼动追踪来评估接受性词汇的价值及其作为更好地理解语言发展如何展开的工具的潜力。
在本文中,我们特别关注如何使用当前的眼球追踪范式和测量方法来评估具有不同语言能力的人群的接受词汇。我们的结果为眼动追踪词汇评估的发展提供了进展,但也凸显了我们知识中仍然存在的差距。如前所述,使用眼动追踪评估接受性词汇目前是一个临床白日梦,但通过解决我们已经发现的差距,我们有一天可能会使这种评估变得可行。此外,此类基础工作可以支持进一步的研究工作,以更好地了解正常发育的儿童和具有不同语言能力的儿童之间语言发展的差异。
数十项研究已经证明了使用眼动追踪来评估儿童接受词汇的可行性(例如,[ 4,8,15,16,17 ] )。总的来说,这些研究遵循相同的实验范式。每次试验都从“基线阶段”开始,在此阶段,孩子们预览多个潜在的候选场景(例如,球和鞋子的图片)。在“提示阶段”,孩子们被引导看一个场景(例如,“球在哪里?”),有时场景上会显示图片(作为“边听边看的范式”,例如,[ 8 ]),有时没有(作为“联运优先寻找范式”,例如,[ 16])。此语言提示之后的时间是试验的“测试阶段”,在此阶段分析儿童的眼睛注视行为以确定知识。
这些研究大多数只关注一种类型的词汇:标记物体或动物的名词。然而,全面的评估应该包括多种类型的词语。我们认为动词是非常重要的考虑因素。动词含义与它们出现的句子结构密切相关,并且动词知识比名词知识更能预测后来的语言结果[ 18 , 19 ]。此外,有限的动词知识被认为是后来诊断语言障碍的一个警告信号[ 20],并且据推测,了解晚说话者的动词词汇尤其可以帮助研究人员和临床医生最终区分那些最有语言障碍风险的人和那些可能“赶上”典型发展同龄人的人[21 ]。因此,任何接受性词汇的评估都必须包括大量的动词。
然而,在眼动追踪评估的背景下,测试动词知识提出了独特的挑战。先前使用眼睛注视来评估名词知识的研究主要使用静态图像,例如球的图片。由于大多数早期习得的动词都表示随着时间的推移而展开的动态事件,因此静态图像并不能很好地描述它们;例如,考虑一下用单个静态图像区分“接住”和“投掷”的困难。尽管一些标准化评估,例如皮博迪图片词汇测试[ 22 ],使用静态图像描述了动词所指对象,但这对于年幼的孩子来说并不理想,因为他们很难解释用于表示动态动作的符号(例如,表示运动的线条)并进行推断他们的运动 [ 23 , 24]。
相反,动态场景的视频更好地说明了动词的含义。然而,使用动态场景需要重新思考如何操作眼睛注视测量,因为与静态图像相比,观看动态场景时注视行为有所不同(例如, [ 15、25、26、27 ] )。相对较少的研究使用动态场景来描述动词,并且在那些研究中,对于什么眼睛注视测量最好以及它们应该如何操作还没有达成共识[ 6,15,16,17,28,29,30 ] 。
到目前为止,使用动态场景来描述词汇评估中的动词所指对象的研究仅包括典型发育中的儿童。然而,在对患有语言和沟通障碍的儿童进行评估时,我们必须考虑他们的表现与正常发育的同龄人有很大不同的可能性。尽管研究结果参差不齐 [ 11 , 13 , 30 , 31 , 32 , 33 , 34 , 35 , 36 , 37 , 38 , 39 , 40],一些研究表明,说话晚的人、患有发育性语言障碍的儿童和自闭症儿童都是语言处理速度较慢的儿童,通常是发育中的儿童[ 11,13,30,31,33,38 ] ,这意味着他们可能需要更长的时间才能稳定目光在描绘正确所指对象的场景上。
研究人员了解如何针对不同能力的儿童调整接受性词汇任务至关重要。例如,布雷迪等人。[ 3 ]认为,由于指向自闭症儿童具有挑战性,如果我们能够可靠地解释他们的凝视行为,那么使用眼睛凝视将更恰当地捕捉他们的词汇知识。一些研究探索了使用眼睛注视评估自闭症儿童词汇量的可能性(例如,[ 3,4,41,42,43,44,45,46 ]),但他们几乎只关注名词词汇和静态图像目标。
然而,一些研究也着眼于语言发育迟缓的幼儿的句子级处理,而且重要的是,这些研究都依赖于动词处理。例如,最近的一些研究调查了 3 至 5 岁的自闭症儿童 [ 12 , 13 , 39 ] 和 2 岁的说话晚者 [ 36]是否] 进行增量句子处理,动词充当客观名词的提示。总而言之,这些研究表明,语言发育迟缓的幼儿可以处理熟悉的动词来预测他们的对象,但他们的速度通常比正常发育的同龄人慢,这取决于他们的年龄和接受词汇知识。这些发现表明,我们在当前的研究中对年幼的自闭症儿童和说话晚的人进行的额外工作应该检查他们如何处理词汇本身,而不需要使用它来预测即将出现的名词的额外任务。
在这项研究中,我们解决了文献中的这些空白。我们的目标是增进对眼睛注视词汇评估潜力的理解。首先,我们特别关注动词,将动词所指对象描述为动态场景而不是静态图像。其次,我们包括有语言迟缓和障碍的儿童。具体来说,在实验1中,我们研究晚说话者的接受性动词知识,在实验2中,我们研究自闭症儿童的接受性动词知识。先前的研究表明,与正常发育的儿童相比,两个人群在接受性词汇任务中的眼睛注视行为有所不同,至少在给定名词试验和静态图像时是如此[ 3,4,11,41,46 ]。
实验 1 比较了晚说话者和典型发育儿童在接受性动词词汇任务中的表现。大约 15% 的 2 岁儿童属于说话晚者,其定义是其表达词汇量相对其年龄而言异常小,且没有已知的认知或发育障碍[ 47 ]。说话晚的人患发育性语言障碍的风险增加[ 48,49,50 ]。许多说话晚的人也有接受性语言延迟,但其他人则没有[ 51 , 52 ]。重要的是,晚说话者构建词汇的方式似乎存在差异[ 53、54、55、56],特别包括他们的动词词汇[ 57 , 58 ]。
在实验2中,我们考虑了自闭症儿童的表现。自闭症儿童具有众所周知的异质语言能力[ 35,59,60,61 ] ,从不会说话到没有表达或接受性语言缺陷。然而,大多数自闭症儿童的语言能力低于年龄,包括词汇知识(例如,[ 61 , 62 ])。接受性语言能力差异很大,但对于某些人来说,接受性语言甚至比表达性语言受损更严重,至少在早期语言发展中以及通过标准化评估进行测量时
准确性——或者说孩子是否知道目标词——被操作化为观看目标场景的时间的比例。有两种常见的计算精度的方法。一种方法 [ 8 , 11 ] 是比较测试阶段期间查看目标场景与干扰场景所花费的时间比例。如果孩子更喜欢目标而不是干扰物,则认为他们知道目标词。另一种方法 [ 7 , 9 , 64] 是比较提供语言提示之前和之后查看目标场景所花费的时间比例(即,基线与测试)。如果这个比例增加了预定的阈值,通常是 15%,那么孩子就被认为知道了目标单词 [ 7 ]。我们使用第二种方法,因为它考虑了孩子们对一个场景相对于另一个场景可能有的特殊偏好。第二种方法已用于静态图像和名词目标 [ 9 , 64 ] 以及动态场景和动词目标 [ 9 , 17 ]].
与使用静态图像查看名词试验的典型发育幼儿合作,在语言提示后使用 300 至 1800 毫秒的时间窗口进行准确性计算。儿童需要 300 毫秒的时间来协调并向目标发起眼球运动,并且在注视 1.5 秒后,他们的注意力模式就不太一致。但是,对于动态场景刺激或发育不正常的儿童的动词试验呢?
Valleau 和同事 [ 17 ] 观察到,当幼儿在动态场景中进行动词尝试时,这个 300 到 1800 毫秒的窗口可能不适合他们。在一项针对 22 至 24 个月大的典型发育幼儿的研究中,Valleau 等人。研究发现,在名词试验中,幼儿在询问目标名词后 300 至 1800 毫秒内表现出更喜欢目标场景的证据,这与 Fernald 及其同事的研究一致。然而,在动词试验中,这些幼儿需要额外的时间来调整他们的目光。在给定动词目标和动态场景的情况下,应该使用什么窗口来计算准确性,这仍然是研究中的一个悬而未决的问题。
此外,对于正常发育的儿童和患有语言迟缓和障碍的儿童,计算准确性的适当时间窗口可能有所不同。例如,较晚说话的人的词汇处理能力比一般发育中的幼儿慢,因此可能需要更长的时间才能适应正确的场景[ 11 ]。自闭症儿童的语言处理能力也比一般发育中的同龄人慢[ 33 ],并且表现出高度可变的语言能力模式[ 61 ]。因此,我们不能依赖先前建立的窗口来计算这些人群的准确性。
鉴于在准确性计算中没有关于测试窗口何时或多长的先验假设,我们使用基于引导的基于集群的排列分析来确定适当的窗口[ 66 ]。基于引导聚类的排列分析是一种系统方法,用于识别具有时间锁定数据的研究(例如眼动追踪或脑电图研究)中群体或条件之间的行为何时以及持续多久存在差异。这种方法已成功用于一系列眼球追踪研究,包括自闭症个体
为了评估处理速度,研究人员通常会测量儿童看向目标图像的延迟时间,即在听觉提示后,儿童第一次看目标需要多长时间,无论他们随后是否或何时将目光移开。延迟已广泛应用于眼动追踪研究中,以解决有关语言发展的众多问题;我们在这里专注于专门针对熟悉的词汇项目的研究。来自涉及静态图像来描述熟悉的名词目标的研究的有力证据表明,这种测量可以预测并发语言能力 [ 8 ]、并发名词学习能力 [ 14 ] 以及后来的语言和智力 [ 10 , 11 , 67]]。这种措施是否也可以用于动态场景刺激还不太清楚:如果孩子们碰巧先看到干扰物,他们可能需要比静态图像更长的时间才能在视觉上脱离它。事实上,瓦洛等人。[ 17 ]发现在2岁以下发育正常的儿童中,动词和动态场景的潜伏期和词汇量之间没有关联。这可能意味着,由于动态场景与静态图像相比如何吸引注意力,它们首先看到目标的速度并不是一个有用的衡量标准。然而,年龄也可能是一个因素:Koenig 等人。[ 28 ] 发现,对于通常发育中的 3 岁孩子来说,他们可能更有能力满足任务要求,潜伏期与名词和动词试验中的词汇量相关。
在考虑患有语言迟缓和障碍的儿童时,考虑到静态图像的名词试验,延迟已被证明是一种预测措施。例如,Fernald 和 Marchman [ 11 ] 证明,说话较晚的人比一般发育中的幼儿有更长的潜伏期,而且说话较晚的人的潜伏期可以预测 18 至 24 个月之间词汇量的增长。自闭症儿童的语言处理能力也较慢,这与其他语言测量相对应(例如,[ 31,33,68,69 ]),包括他们在眼球追踪接受性词汇任务上的准确性[ 4]].
最终样本包括 从大波士顿地区招募的45 名儿童(17 名女性,28 名男性),平均年龄为 28.5 个月( SD = 3.0 个月,范围 = 24.5–34.7 个月)。样本偏向男性,因为我们将招募重点放在说话晚的人身上,他们更有可能是男性[ 49 ]。对参与者进行了听力损失或耳管病史的预先筛查;此外,儿童在就诊时使用《幼儿自闭症改良检查表》(修订版)(M-CHAT-R:[ 70])。最终样本中的所有参与者都被归类为“低风险”。根据家长报告,所有孩子至少有 70% 的时间接触英语。参与者没有报告除语言以外的发育障碍:据报告,三名儿童有与语言相关的诊断,要么是“表达性语言发育迟缓”,要么是“语言发育迟缓”。另外 7 名儿童参与了研究,但由于长期耳管病史 ( n = 2)、舌系带病史 ( n = 1)、参与后一周内诊断为自闭症谱系障碍 ( n = 1) 而被排除在最终分析之外),或因烦躁而未能完成实验(n = 3)。
我们要求家长报告种族/民族和家长教育情况。一个家庭没有提供有关种族/民族的信息,三个家庭没有提供有关家长教育的信息。在参与的人中,参与者主要是白人(91%),2% 是亚洲人,5% 是多个种族。几乎所有儿童 (96%) 都至少有一位父母拥有大学或更高学位,其中 35% 的儿童至少有一位父母拥有博士学位(博士、医学博士或法学博士)。
使用麦克阿瑟-贝茨交际发展清单 2 级简表 A(MBCDI:[ 71 ])评估表达词汇。据报告,儿童平均能说出 100 个单词中的 69 个(SD = 27,范围 = 1-100)。学前语言量表,第五版(PLS:[ 72 ])用于表征更广泛的语言能力。 儿童在听觉理解分量表 (PLS-AC) 上的平均标准分数为 106 ( SD = 17 ),在表达沟通分量表 (PLS-EC) 上的平均标准分数为107 ( SD = 16)。最后,早期学习马伦量表(MSEL-VR:[ 73 ])的视觉接收子量表被用作非语言智力的代表。
仪器
刺激显示在 24 英寸 Tobii T60 XL 角膜反射眼动追踪监视器上,该监视器大约每 17 毫秒采样一次凝视,并在每次实验开始时使用 5 点校准程序进行校准。孩子们坐在距离显示器 20 英寸的汽车座椅上,或者坐在父母的腿上,而父母则戴着眼罩。
刺激
这些刺激最初是由 Konishi 等人开发的。[ 74 ] 并由 Valleau 等人针对眼球追踪程序进行了修改。[ 17 ]。小西等人。总共选择了 36 个动词和 14 个名词,这些动词和名词在典型语言发展的早期就被高度形象化。他们拍摄了 6 秒的视频剪辑来描述每个动词的所指动作,并选择了描述每个名词所指对象的静态图像。瓦洛等人。记录伴随的听觉刺激并将刺激排列成图 1所示的试验结构。实验 1 包括来自 Valleau 等人使用的刺激的十个动词试验的子集,如下所述,每对仅包括一个项目(例如,“拍手”但不“伸展”),以及四个动词试验名词试验,充当打破会议的填充物。所有参与者都以相同的顺序观看了 14 项相同的试验。孩子们每次试验都看过一次。请参阅附加文件1:附录 A 了解试验列表。
视觉刺激
动词试验以两个并排的动态场景为特色。两个动词试验的特点是只有一个演员的动态场景(例如“拍手”和“伸展”),八个试验的特点是一个演员和一个物体的动态场景(例如“摇动”和“打开”礼物)。在每次试验中,两个动态场景中的演员和物体都是相同的(例如,在描绘“挠痒痒”和“亲吻”的试验中,一个场景描绘了一个女孩给泰迪熊挠痒痒,而另一个场景描绘了同一个女孩亲吻同一个泰迪熊)玩具熊)。视频被循环播放以提供对事件的连续描述;有些事件是持续性的,因此是连续的(例如,“跑”),而其他事件则在两次(例如,“踢”)和五次(例如,“休息”)之间准时发生。针对名词的填充试验以两个并排的静态图像为特色。
听觉刺激
一位讲美式英语的女性在一个隔音室里记录了听觉刺激。孩子们听到引人注目的短语(例如,“哇!”)和寻找目标的指令。对于同时包括演员和物体的试验,使用及物语法来定位动词(例如,“她在哪里给熊挠痒痒?”),而仅包括演员的试验则使用不及物语法作为目标(例如,“她在哪里鼓掌?”) )。孩子们还会听到中性语法的提示(例如,“寻找鼓掌!”)。
设计
每个试验包括检查阶段、基线阶段、提示阶段和测试阶段(见图 1)。动词试验和名词填充试验的结构相同;然而,名词试验的检查和基线阶段比动词试验短,因为静态图像不会随着时间的推移而改变,我们不希望孩子们厌倦看它们。
在检查阶段(动词试验 8 秒;名词试验 4 秒),孩子们分别预览每个视觉刺激,一个在左边,另一个在右边。侧面(左侧或右侧优先)和顺序(目标或干扰物优先)被平衡。基线阶段(动词试验 6 秒;名词试验 3 秒)在检查阶段出现的相同位置同时描绘两种视觉刺激。检查和基线阶段包括吸引注意力的短语,以将儿童的注意力引导到屏幕上(例如,“看!”、“哇!”)。
在提示阶段(动词和名词试验4秒),孩子们听到提示找到目标场景或图像。仅包含演员的场景以不及物语法查询(例如,“她在哪里鼓掌?”),而包含演员和经纪人的场景则以及物语法查询(例如,“她把气球扔到哪里?”)。因为成对的场景总是以相同的演员和物体为特色,所以名词和代词并不是目标与干扰物的提示。位于中央的星星将孩子们的注意力引导到屏幕的中央。在测试阶段(动词和名词试验 6 秒),视觉刺激重新出现在原来的位置。两秒后,孩子们会听到中性语法的附加提示(例如,“找到鼓掌!”)。
程序概述
参与是波士顿大学机构审查委员会批准的两次访问协议的一部分。第一次就诊时,家长提供了书面同意书并填写了人口统计调查问卷、MBCDI 和 M-CHAT-R。第一作者是一位有执照的言语病理学家,负责实施 PLS。孩子们还参加了一项不相关的实验任务。在大约两周后的第二次访问中,孩子们参加了另外两项实验任务,本研究是其中的第二项。第二次就诊期间还进行了 MSEL-VR。
排除标准
测试阶段期间轨迹丢失(例如闪烁)超过 50% 的所有试验均从分析中删除。在这些删除之后,平均而言,10 项动词试验中的 9 项(SD = 1,范围 = 5-10)被纳入典型发育儿童的测试中,而 10 项动词试验中的 7.5 项(SD = 2,范围 = 4-10)被纳入晚期说话者的测试中。 ; 这种差异是显着的(t(43)= 3.35,p = 0.002)。鉴于晚说话者在实验任务中表现出注意力差异,纳入试验数量的差异并不令人意外[ 75 ]。然而,这种注意力不集中的情况也可能是由任务难度造成的。例如,说话晚的人可能会向家长或考官寻求线索,因为他们不确定目标词的含义。
分析
我们的分析考虑了儿童的 (1) 准确性和 (2) 处理速度。对于每一个,我们都进行了混合效应回归以确定是否存在组间差异。这包括眼睛注视行为的结果变量(准确性或处理能力);参与者和试验的随机效应;年龄、性别和群体的固定影响(说话较晚或正在发育中)。使用R [ 77 ] 中的 lme4 包(版本 1.1-12;[ 76 ])运行回归,并使用 drop1() 函数和卡方检验进行模型比较。
准确性
遵循 Reznick [ 7 ],我们计算出基线(在提示儿童寻找目标之前)和测试(在听觉提示之后)之间目标寻找的准确性增加了 15%。为了确定我们应该在 6 秒测试窗口中的哪个时间点进行此计算,我们使用 eyetrackingR 包 [ 78 ] 应用了基于引导集群的排列分析 [ 66 ]]。我们假设说话较晚的孩子可能需要比一般发育中的幼儿更晚的时间窗口来展示词汇知识,因此我们对每组进行了单独的分析。聚类分析比较了基线和测试之间儿童的注视行为,以确定儿童在测试阶段是否以及何时更喜欢高于或超出基线注视率的目标。对于基线阶段,我们对所有时间点和试验中对目标场景的观看比例与其他地方的观看比例进行了平均,以获得此阶段期间每个组对目标场景的整体偏好的单一衡量标准。这是因为我们对他们在基线期间对目标场景的注意力的动态不感兴趣,而是对他们更愿意从整体上看待它的程度感兴趣。对于测试阶段,我们对儿童注意力随时间变化的动态感兴趣,我们计算了每个 50 毫秒窗口中儿童注视目标场景与其他地方的平均比例。在这两种情况下,当计算注视目标的比例时,我们既不注视目标也不注视干扰物(例如,注视两个场景之间)和跟踪损失作为比例的分母;这些外观可能反映了孩子们的不确定性,我们不想删除这些数据点。查看两个场景之间)和比例分母中的轨迹损失;这些外观可能反映了孩子们的不确定性,我们不想删除这些数据点。查看两个场景之间)和比例分母中的轨迹损失;这些外观可能反映了孩子们的不确定性,我们不想删除这些数据点。
我们计划的用于识别集群的模型是一个混合效应回归,其因变量为目标场景相对于其他地方的观看比例、阶段的预测变量(基线或测试,虚拟编码为“0”和“1”),以及试验和参与者的随机效应。我们应用了p = 0.05的阈值 ,这意味着时间区间必须达到此统计显着性水平才能包含在聚类中。相邻的簇和仅相距 50 ms 的簇被组合成更大的簇。然后,我们对 1000 个排列进行排列分析,以确认即使数据被打乱,这些窗口也会出现。两个配对t检验(如下,例如,[ 79]),一个包括 LT 组中的所有儿童,另一个包括 TD 组中的所有儿童,对于每个儿童的每次试验,比较每个试验的整体基线外观与识别的集群之间对目标场景的平均比例。
最早具有统计显着性的聚类用于识别准确性分析的响应窗口。响应窗口(每组分开)从最早的重要簇的开始开始,其中孩子们在测试阶段比在基线中更多地关注目标场景。我们将响应窗口的持续时间标准化为 1500 毫秒,就像在接受性名词词汇任务中所做的那样(例如,[ 8 ])。
然后,通过比较基线阶段整个 6 秒内的平均外观比例和测试阶段的响应窗口,逐个儿童进行试验,计算准确性。如果孩子的外貌从基线到测试增加了至少 15%,则被认为了解目标动词的含义。
处理速度
处理速度被操作为延迟,即每次试验的测试阶段内孩子看向目标场景的最早时间点。正如瓦洛等人所言。[ 17 ],在测试阶段根本没有看目标场景的孩子被给予 6000 毫秒的延迟。还关注 Valleau 等人。[ 17 ],我们排除了测试阶段前 50 毫秒的外观,因为这还太早,无法归因于听到听觉刺激;编程和启动扫视大约需要 300 毫秒(例如,[ 80 ])。
结果
开放科学框架 ( https://osf.io/ghp7q )上提供了去识别化的注视数据。图 2描述了随着测试阶段的展开,孩子们对目标场景的偏好随时间的变化;目标偏好计算为儿童观看目标场景的帧与所有其他位置的帧的比例。基线查看偏好由虚线表示。在测试阶段,说话较晚的儿童平均注视目标场景的比例比一般发育中的儿童要小(M (LTs) = 0.39,SD (LTs) = 0.08;M (TDs) = 0.49,SD (TDs) = 0.09;t (43) = 3.8, p < 0.001)。相反,在纳入的试验中,晚说话者的平均跟踪丢失率高于正常发育儿童(M(LTs)= 0.28,SD(LTs)= 0.09;M(TDs)= 0.22,SD(TDs)= 0.09;t(43)= 2.3,p = 0.024)。然而,观看干扰场景的平均比例没有组间差异(M(LTs)= 0.33,SD(LTs)= 0.06;M(TDs)= 0.29,SD(TDs)= 0.07;t(43) ) = 3.8,p = 0.16,纳秒)。我们从图表的目视检查中观察到,两组在测试阶段都更喜欢高于基线观看率的目标。这表明,总体而言,孩子们至少知道一些所查询的目标动词。
准确性
对于说话较晚的人,基于引导聚类的排列分析揭示了三个聚类,其中基线观看率 ( p = 0.40) 和测试阶段之间观看目标场景的比例有所不同。第一个簇持续 0 到 600 毫秒:在这里,较晚说话者在测试中较少关注目标场景,而不是在基线中(t (104) = 15,p < 0.001)。考虑到试验结构,这并不奇怪:回想一下,孩子们在开始测试阶段时会看着屏幕中心,因为他们刚刚看到了中心注视星。第二个簇开始于 1550 ms,持续到 3100 ms ( t (104) = − 2.5, p = 0.01); 在这里,后期说话者更多地关注测试中的目标场景而不是基线。第三个簇,从 4850 到 6000 ms,在排列分析和t检验后没有统计显着性(t (104) = − 1.3, p = − 0.19, n. s . ) 。根据此分析的结果,为进行准确性分析,较晚发言者获得了 1550 至 3050 毫秒的响应窗口(因为我们将窗口的持续时间标准化为 1500 毫秒)。
对于正常发育的儿童,出现了两个显着的聚类,其中基线 ( p = 0.43) 和测试之间注视目标的比例有所不同 。第一个簇持续 0 到 600 毫秒。与说话较晚的人一样,典型发育中的儿童开始测试阶段时对目标场景的关注程度低于基线(t (276) = 19,p < 0.001)。第二个集群持续了 900 到 6000 毫秒。在这里,典型发育中的儿童在测试期间观察目标场景的次数明显多于基线期间 ( t (276) = − 5.7, p < 0.001)。因此,我们使用响应窗口对典型发育儿童的 900 至 2400 毫秒进行准确度分析,以标准化持续时间,但我们注意到有趣的是,典型发育儿童的原始簇比晚期说话者的原始簇要长得多(5100 毫秒) (1600 毫秒),这表明,一旦正常发育的儿童确定了目标,他们就会将注意力持续更长时间。
使用基线和响应窗口之间增加 15% 的阈值,晚说话者知道他们贡献的试验中 51% 的目标动词(SD = 0.22,范围 = 0.125–1)。 通常发育中的儿童知道他们参与的试验中49% 的目标动词(SD = 0.19;范围 = 0.0–0.9)。回归模型表明儿童的准确性与任何固定效应之间没有显着关系,包括(b组 = 0.02,t组 = 0.34,p组 = 0.70,ns;b年龄 = 0.02,t年龄 = 1.88,p年龄 = 0.054,纳秒; b性别 = − 0.09,t性别 = − 1.51,p性别 = 0.11,ns )。这表明,当提供足够的时间来展示目标项目的知识时,晚说话者和一般发育中的孩子所知道的动词数量没有显着差异。
根据一位评审员的建议,我们进行了一项事后分析,其中晚说话者被给予与正常发育儿童相同的反应窗口(900 至 2400 毫秒)。考虑到这个窗口,迟到的说话者只知道 35% 的目标动词(SD = 0.20;范围 = 0.0–0.75)。在这里,分析得出了组间差异,其中晚说话者比一般发育儿童知道的动词要少得多((b组 = 0.15,t组 = 2.3,p组 = 0.016);没有其他因素显着(b年龄 = 0.02,t年龄 = 1.86,p年龄 = 0.063,ns;b性别 = − 0.09,t性别 = − 1.79,p性别 = 0.079,ns)。这些发现表明,当评估措施不考虑总体反应时间的差异时,说话晚的人的表现比一般发育中的孩子差。
我们还进行了探索性分析,其中语言被视为连续变量。然而,我们发现语言变量没有显着影响(MBCDI 原始分数b = − 0.001,t = − 0.19,p = 0.84,ns;PLS-AC 标准分数b = 0.002,t = 0.916,p = 0.31,ns) 。
表2举例说明了两组儿童都倾向于了解哪些动词 按组显示最准确到最不准确的试验的排名顺序。我们注意到各组之间存在相当大的差异;说话晚的人在针对“跳跃”(干扰项“跑”)的试验中具有最高比例的准确度,而典型发育中的儿童在针对“舔”(干扰项“休息”)的试验中具有最高比例的准确度。有趣的是,对于说话晚的人来说,“lick”是第二难的动词。尽管很有趣,但我们在此指出,我们的目标是探索围绕我们使用眼球追踪收集此类信息的能力的方法学基础。考虑到这一点,我们建议使用这种方法进行进一步的研究,但专门旨在探索是否像表达性动词词汇一样[ 57 , 58]],说话晚的人和正常发育的孩子在接受性动词词汇的构成上有所不同。
表 2 晚说话者和典型发育儿童所知道的每个动词的比例,按顺序排列(实验 1)。括号中的数字表示按组划分的知道目标动词的参与者比例
全尺寸桌子
处理速度
参与者观看目标场景的延迟时间平均为 1500 毫秒(SD = 502 毫秒)。令人惊讶的是,说话晚的人(M = 1551 ms,SD = 477 ms)的平均延迟并不比正常发育儿童(M = 1477 ms,SD = 519 ms;t(43)= 0.66,p = 0.45,ns)更长。回归分析表明,年龄显着预测潜伏期 ( b = − 72, t = − 4.9, p = 0.004),但组 ( b = − 119, t = − 0.75, p = 0.44, ns ) 和性别 ( b = 36,t = 0.25,p = 0.79,ns)没有。
鉴于准确度分析的响应窗口的开始时间存在组间差异,这一发现可能令人震惊。我们注意到,虽然两者都以某种方式与处理相关,但它们是不同的措施。延迟是孩子们第一次看到目标;它是通过试验计算出来的,与基线阶段儿童的表现无关。相比之下,响应窗口代表所有试验中持续观察的模式,并且是相对于基线观察率计算的。通过这样做,我们可以捕捉到孩子们以多快的速度展示出对目标动词的足够鲁棒的表示,并且超出了随机查找率。例如,孩子可能会首先看向目标作为他们最初的猜测,但他们的表现可能不足以对这个选择感到有信心;81 ]自闭症儿童句子处理中的类似模式)。因此,我们从这两项指标中得出的结论是,LT 和 TD 首次查看目标场景的速度相同(延迟),但 LT 比 TD 需要更长的时间才能在持续的一段时间内确定目标(响应窗口) ,可能表明词汇条目不太健壮。
我们再次进行了探索性分析,其中语言被视为连续变量。我们观察到,更广泛的语言接受能力(而不是词汇量)可以预测表现,因此 PLS-5 听觉理解子测试中标准分数较高的儿童平均延迟更快;在这里,我们也发现语言变量没有显着影响(MBCDI 原始分数b = 1.17,t = 0.245,p = 0.79,ns;PLS-AC 标准分数b = − 15.04,t = − 1.88,p = 0.049) 。
讨论
在实验 1 中,我们对 2 岁说话晚的孩子和典型发育中的孩子进行了接受性动词词汇任务,探索了孩子们的目光注视。我们考虑了孩子们的整体准确性和处理速度。
在计算儿童的准确性时,先前的研究表明,通常用于静态图像和名词刺激的响应窗口(300 至 1800 毫秒)不适合动态场景目标 [ 15 , 17 ]。相反,我们使用引导的基于集群的排列分析来确定响应窗口[ 66 ]。考虑到说话较晚的人的词汇处理能力比一般发育中的幼儿要慢 [ 11],他们比一般发展中的同龄人需要更晚的时间来展示动词知识,这也许并不奇怪。虽然通常发育中的儿童在测试阶段从 900 毫秒开始更喜欢高于基线观看速率的目标场景,但说话晚的人直到 1550 毫秒才这样做。这些发现与对患有发育性语言障碍的年龄较大儿童的研究相呼应,这些儿童在接受性语言任务中表现出延迟反应(例如,[ 82]])。然而,如果提供额外的时间,说话晚的人知道的动词数量与正常发育中的孩子一样多。相比之下,当说话晚的人与典型发育中的幼儿具有相同的期望(即 900 到 2400 毫秒的窗口)时,就会出现显着的群体差异。这种差异凸显了根据所研究的人群调整评估措施的重要性,并考虑到正常发育的幼儿与语言迟缓或障碍的幼儿之间的差异。
虽然与我们的假设不同,但晚说话者和发育正常的儿童对相同比例的测试动词表现出接受性知识的发现并不完全令人惊讶。说话晚的人是根据他们表达词汇量的大小来定义的。先前的研究表明,虽然一些说话晚的人也有较小的接受词汇量,但其他人则没有表现出接受性语言缺陷[ 51]。我们还承认,尽管说话晚的人和正常发育的孩子平均知道相同数量的动词,但他们不一定对这些动词有同样强大的表示。事实上,我们在基于聚类的引导排列分析中观察到,与典型的发育中的幼儿不同,晚说话的人一旦识别出目标场景,就不会在很长一段时间内维持对目标场景的偏好。一种可能性是,这反映了迟到的演讲者对其回答的信心。为了支持这一假设,我们注意到,与一般发育中的儿童相比,说话晚的人由于轨迹丢失而失去了更多的尝试,这表明更多的目光从屏幕上移开(可能是为了寻求线索或确认而转向父母或研究人员)。或者,持续注意力的差异可能表明,晚说话者的表征比通常发育中的幼儿的表征更脆弱。如何最好地实现词汇条目的稳健性仍然是一个悬而未决的问题。一种可能性是,总体查找目标的时间表明词汇条目的稳健性 [83 ],但也有可能的是,拥有丰富条目的孩子会快速查看,然后在对任务感到厌倦时扫描[ 84 , 85 ]。我们主张继续研究如何最好地实现代表性的稳健性,以及这是否会因年龄、语言能力或人口因素而变化。
还值得注意的是,虽然 LT 和 TD 之间的总体准确率没有差异,但儿童最有可能正确识别的动词存在群体差异(表 2)。这与先前的研究一致,表明 LT 和 TD 在词汇组成上表现出差异(例如,[ 54 , 55 , 56 , 57 , 58 ]])。虽然大多数研究都集中在儿童的表达词汇上,但我们也提供了接受词汇可能存在差异的证据。鉴于当前实验中的试验数量较少,并且不同类型动词之间的试验不平衡,无法进行系统比较,因此我们不提供对表 2 列表中差异的 解释,但我们把这个话题留到以后的工作中,应该考虑动词知识、动词学习和后续语法发展的交叉点。我们初步假设,对说话晚者新出现的动词词汇(无论是习得的动词的数量还是类型)的细致入微的理解可能有助于确定哪些说话晚的人患发展性语言障碍的风险最大(与 19 类似,其中包括以下结果):自闭症幼儿)。
延迟是一种成熟的眼睛注视测量方法,用于衡量给定静态图像和名词目标的处理速度,但动态场景刺激的研究得出了不同的结论[ 16,17,28 ] 。尽管在给定名词目标和静态图像的情况下,说话晚的人的平均延迟比一般发育中的儿童要慢[ 11 ],但我们发现动词目标和动态场景的平均延迟没有组间差异。相反,儿童的年龄显着预测了他们的表现,年龄较大的孩子比年龄较小的孩子更快地锁定目标。这些结果可以让我们深入了解先前研究结果的差异。戈林科夫等人。[ 16 ] 和 Valleau 等人。
最终样本包括从大波士顿地区招募的 20 名自闭症儿童(3 名女性,17 名男性)。参与时儿童的平均年龄为 41.9 个月(SD = 10.2,范围 = 26.5 至 64.5 个月)。该项目的数据收集始于 2012 年,并持续了数年。数据收集前期的参与者初步根据DSM-IV进行诊断,数据收集后期的参与者均根据DSM-V进行诊断。根据家长报告,所有儿童均被诊断为自闭症谱系障碍、自闭症或 PDD-NOS;使用 ADOS-2(自闭症诊断观察表,模块 1-3 或幼儿模块)在实验室中确认诊断;[ 86 , 87])。家长报告说,他们的孩子至少 70% 的时间接触英语,并且没有听力损失或合并发育障碍的病史。参与者是白人(90%)或混血儿(10%)。大多数母亲(65%)至少拥有大学学位;有一个家庭没有提供母亲教育信息。另外 12 名儿童参与了研究,但因提供的数据不足而被排除在分析之外(见下文)。
使用 MBCDI 2 级简表 A 评估表达词汇量 [ 71 ]。家长报告说,他们的孩子平均说出了清单上 100 个单词中的 62 个(SD = 32,范围 = 0-99)。两个孩子的父母没有完成 MBCDI。进行了广泛用于自闭症儿童(例如,[ 56 ])的马伦早期学习量表(MSEL:[ 73 ])中的三个子测试。我们将这些分数报告为具有年龄相当的原始数字,因为标准化分数可能无法捕捉狭窄范围内的变异性[ 88 , 89 ]。在表达性语言分量表 (MSEL-EL) 上,平均原始分数为 27 ( SD = 9.4,范围 = 10–48,年龄相当 = 29 个月);接受语言分量表 (MSEL-RL),30(SD = 9.5,范围 = 10–48,年龄相当 = 33 个月);视觉接收分量表 (MSEL-VR) 为 32(SD = 9.4,范围 = 12–50,年龄相当 = 31 个月)。超过一半的儿童在 MSEL-RL 和 MSEL-EL 上的t分数比其实际年龄的平均值低一个标准差以上,表明他们的语言发展迟缓(见表 3)。儿童被随机分配到下述两个刺激列表之一;列表之间在年龄、MBCDI 或 MSEL 分数方面不存在群体差异。
在实验 1 中,我们将儿童按组分组来创建响应窗口,而在本研究中,我们分别为每个孩子创建响应窗口。先前的研究发现自闭症儿童的语言能力存在很大差异,因此不可能在样本中形成统一的反应窗口。因此,我们使用类似于实验 1 的程序为每个孩子创建了个性化的响应窗口。但是,在实验 1 中,我们进行了两项基于聚类的分析,一项针对 LT 组,一项针对 TD 组,而在实验 2 中,我们进行了一项聚类分析使用 eyetrackingR 包对每个孩子分别进行基于基础的分析 [ 78] 在 R 中(版本 3.3.1;78)。使用线性混合效应回归来识别聚类,该回归将在 6 秒基线阶段内折叠的儿童对目标场景的基线外观比例与他们在每个 50 毫秒箱中对目标场景的外观比例进行比较。测试阶段。该模型包括目标场景与其他地方的比例的因变量、试验的随机效应以及阶段的预测变量(基线或测试)。p值小于 0.05的时间段包含在聚类中。
在实验 1 中,我们对每组进行t检验,以确定聚类的显着性。在实验 2 中,我们想要单独评估每个孩子,但是,考虑到每个孩子看到的试验数量很少,我们没有足够的能力对每个孩子进行单独的t检验;没有一个孩子接受过超过 18 次试验,而且许多孩子接受的试验次数更少。我们承认这是这种方法的局限性,需要在后续关于个性化响应窗口可行性的研究中解决。相反,我们执行了配对t对所有参与者一起进行测试,通过试验和儿童比较,基线期间对目标的注视比例与聚类分析确定的该儿童聚类期间对目标场景的注视比例。因此,尽管最初是为每个孩子单独确定聚类,但该步骤与实验 1 中的分组分析是平行的。这使我们能够提供有关基线和测试之间注视行为差异的额外描述性统计数据。
结果
开放科学框架 ( https://osf.io/egwya/ )上提供了去识别化的注视数据。我们首先绘制每个参与者的个人表现图表。参见图 3中的示例。这里描绘了测试阶段期间儿童观看目标场景与其他地方的平均比例(包括不观看任何场景和跟踪丢失)。该条表示基线的所有时间点期间对目标场景的平均观看比例。我们观察到图 3中显示的所有三个参与者在测试期间优先选择高于和超出基线的目标场景;然而,每个孩子在不同的时间点这样做。这对于具有相同 MBCDI 和 MSEL-RL 分数的参与者 V04 和 V07 来说尤其引人注目。参与者V07在测试阶段初期就表现出了对目标场景的偏好,而V04直到后半段才表现出对目标场景的偏好。V20 在 MBCDI 和 MSEL-RL 的所有参与者中得分最高,在测试阶段的中期,它对目标场景的观察最为一致。我们选择这三个例子是因为它们也展示了在我们的样本中观察到的广泛模式:一些孩子 ( n = 7) 倾向于在响应窗口的前三分之一(2000 毫秒之前)达到峰值
结论
在实验 2 中,我们评估了自闭症儿童的接受性动词词汇量,考虑了他们知道的单词数量以及他们处理语言的速度。我们发现,儿童的准确性和处理速度是由同时接受的语言技能而不是表达性词汇来预测的。这可能是由于自闭症儿童接受性语言和表达性语言之间的复杂关系所致。例如,我们的样本包括两名不会说话的参与者(V01 和 V03),其中一名(V03)知道任务中出现的所有动词的近一半。我们认为,这强调了全面、准确评估语言接受能力的重要性。
实验 2 的一个显着贡献是我们在测试阶段建立了针对每个孩子的注视行为进行个性化的响应窗口。这是一种值得未来研究的方法:鉴于自闭症儿童的概况的异质性[ 59,60,61 ],研究人员和临床医生将有利于拥有一种系统的方法来识别个体水平上的正确反应窗口。但是,我们也承认我们提出的方法存在重大局限性。首先,我们的研究总体上包含的试验太少,因此我们无法确定每个孩子的基于引导聚类的排列分析所识别的窗口是否与机会水平显着不同;我们的配对t尽管我们的集群是按儿童计算的,但测试是在团体层面而不是个人层面进行的。然而,更长的研究和更多的试验可能会超出儿童的注意力范围。因此,要解决这个限制并不容易。其次,我们应用了严格的排除标准(必须有足够的数据来运行此引导分析),但这样做排除了本研究最初招募的 32 名参与者中的 12 名。这是相当大的。尽管我们参与任务的儿童数量多于能够完成标准化评估的儿童数量,例如,布雷迪和同事发现,近一半语言能力极差的 4 至 7 岁自闭症儿童无法通过皮博迪图片的筛选项目词汇测试