饮食失调认知自我报告测量的心理测量特性新闻资讯

杂志简介

INTRODUCTION

在线投稿

发表流程

联系我们

刘编辑

QQ:3247895862

李编辑

QQ:2269294467

时编辑

QQ:2324542146

新闻资讯

饮食失调认知自我报告测量的心理测量特性

介绍
饮食失调（ED）的患病率和影响在世界范围内持续增加[ 2,15,32,73 ]。目前，《精神疾病诊断与统计手册》[ 1 ]概述了几种疾病的标准，包括但不限于神经性厌食症（AN）、神经性贪食症（BN）、暴食症（BED）以及其他特定的喂养和饮食紊乱（OSFED）。这些疾病对功能的影响已得到充分证实，现有文献强调 ED 与较高的医疗和精神合并症、生活质量下降和死亡风险增加有关 [ 2 , 90 , 91]。尽管存在各种治疗模式，并且有一些证据表明寻求治疗的人数有所增加[ 73 ]，但治疗结果各不相同，而且疗效通常只能取得适度的收益[ 92 , 93 ]。因此，检查与 ED 开发和维护相关的关键组件仍然至关重要。

ED 理论模型强调 ED相关认知作为发展和维持因素的重要性 [ 21,27,94 ]。与 ED 的发展和维持有关的认知包括想法、期望、假设以及有条件和无条件的信念。从跨诊断的角度来看，Fairburn 等人的[ 27] ED 的认知行为模型强调了对饮食、体重、体型及其控制的过度评价、核心低自尊的作用，以及强调无条件的、通常普遍的、消极的自我观点的作用（例如，消极的，自我参照的信念[“我不可爱]”）。核心的低自尊和消极的自我信念导致自我评价模式日益失调，从而导致对饮食、体重、体形及其控制的过度评价。对这些特征及其重要性的高估往往是 ED 行为（例如限制、清除和暴饮暴食）最初出现和维持的核心。ED 的认知行为疗法（CBT-E）是源自该理论的跨诊断治疗，3 , 24 ]。

ED 的以图式为中心的模型[ 94 ]清楚地描绘了无条件核心信念或图式水平表征在不同饮食病理学发展中的作用。它表明，在AN中，图式补偿的发生是为了防止经历负面影响，从而导致限制性饮食行为，而避免由负面核心信念激活产生的负面影响会导致更多的贪食型病理[ 94]。图式内容可以包括关于跨多个维度和图式域的自我、他人或世界的条件和无条件信念。例如，沃勒等人。描述关于自我的无条件信念（即自我参照信念，例如“我一文不值”）、他人（例如“其他人是评判性的和严厉的”）以及与这些信念相关的可能的适应不良图式（例如， “放弃”或“无情的标准”）。对图式和图式治疗结果的叙述性和系统性回顾确实强调了明显的早期适应不良图式 (EMS) 和 ED 之间的关联 [ 52 , 70 ]，并表明图式治疗干预措施在治疗复杂饮食表现方面显示出一些希望 [ 52 ]。

此外，一些特定于疾病的模型强调了核心、自我参照信念以及其他类型的 ED 认知的重要性。神经性贪食症的认知模型表明，适应不良、消极的自我信念（例如，“我是个失败者”；[ 21 ]）是一个诱发因素，导致消极的自动思维（NAT）增加，进而进一步强化该模型还概述了关于饮食的宽容、积极和消极信念在维持暴食和清除行为中的作用。这些信念可以理解为元认知信念的类型，即一组更高阶的信念反映对自己思维过程的理解、意识和解释[ 97]。例如，关于饮食的积极元认知信念可能是“饮食帮助我控制情绪”[ 13 ]。暴食的综合认知行为模型同样确定了核心低自尊（关于自我的负面核心信念）和饮食信念（即元认知信念）在暴食的发展和维持中的关键作用。11 ]。

Fairburn 等人的模型。[ 27 ] 和库珀等人。[ 21 ]都强调了NAT的作用，反映了对饮食、体重、体形的高估及其在ED维持中的控制。例如，关于食物和饮食的负面想法可能是诸如“我讨厌我喜欢暴饮暴食”之类的陈述，而关于体重和体形的负面想法可能包括诸如“我会增加大量体重”或“我觉得我的肚子太大了。” 根据先前描述的模型[ 11、21、27]，这些消极且通常是自动的想法通过增加负面影响或影响情绪调节来维持 ED 周期，从而强化 ED 行为。这些消极的想法最终也会强化更普遍的潜在认知（即核心的、自我参照的信念）。

尽管上述模型在认知侧重点（认知内容和类型）上表现出一些差异，但每个模型都强调了 ED 认知作为 ED 发展和维持过程因素的基本性质。因此，继续评估和监测 ED 认知作为治疗目标和治疗结果至关重要。理论和实证研究都支持单独测量 ED“思想”和行为的想法，以及将 ED 认知作为一个连续的结构进行评估，这种结构通常在亚临床或前驱人群中发现 [ 53 ]，在这些情况下需要积极预防和早期干预。因此，利用具有强大心理测量特性的测量 ED 认知的评估工具至关重要。

此前，伯顿等人。[ 9 ]对与暴食症状相关的自我报告措施的心理测量特性进行了系统回顾。此外，最近的两项系统综述报告了与身体形象相关的可用措施和方面[ 48 , 69 ]。然而，这些评论中的每一篇都没有提供与所有 ED 和更广泛的相关功能相关的全面摘要。最近的另一篇综述总结了成人 ED 评估中使用的工具 [ 77]，概述了常用和最近开发的 ED 症状学测量方法。然而，本次审查的重点仅在于经常使用和最近开发的评估措施。它没有具体报告认知测量，即那些关注 ED 信念、期望、假设和想法的测量。因此，为评估 ED 相关认知而开发的几个重要的现有工具没有得到审查。一些例子包括饮食信念问卷 18 (EBQ-18) [ 10 ] 和饮食失调核心信念问卷 (ED-CBQ) [ 28]。此外，没有使用标准化的、已发布的质量评估工具对已确定的措施的心理测量特性进行彻底评估，相反，审查的重点是提供信息而不是评估性[ 77 ]。

因此，迄今为止，还没有对 ED 认知的可用自我报告测量进行全面评估，也没有对其心理测量特性进行全面评估。本次综述的目的是系统地识别和评估现有 ED 认知自我报告测量的心理测量特性。这些认知自我报告测量的心理测量特性将使用 Terwee 等人开发的充分性评估工具进行评估。[ 87]。该标准化工具通过使用九个质量标准来指导质量评估，包括内容有效性、内部一致性、标准有效性、结构有效性、再现性（一致性）、再现性（可靠性）、响应性、下限或上限效应以及可解释性。Burton 等人之前曾使用过该工具。[ 9 ]对暴食症状的自我报告测量的回顾，以及其他领域的其他几个系统回顾[ 59 , 84 , 101 ]]。本研究旨在利用这些标准，系统地总结认知性勃起障碍自我报告测量工具的现有发现，提供对其心理测量特性的全面理解，并为研究人员和临床医生评估、比较和利用这些测量提供指导。

方法
搜索策略
使用国际前瞻性系统评价登记册（PROSPERO；CRD42023440840）注册系统评价方案。检索策略遵循系统评价和荟萃分析的首选报告项目（PRISMA；[ 66 ]）中概述的指南。利用最佳数据库组合的指南进行文献检索[ 8]，检索是使用三个电子数据库进行的：PsycINFO、MedLine 和 Embase。根据出版时间，检索没有限制。扫描了所有纳入研究的参考文献列表，以确定任何其他相关出版物。在 2023 年 8 月 17 日进行最终分析之前再次进行了搜索。为了确定符合条件的研究，使用了与 ED（例如，“饮食失调”、“神经性厌食症”、“神经性贪食症”、“暴食症”等）、自我报告措施（例如， “问卷”、“量表”、“工具”、“评估”、“测量”等）和心理测量属性（例如“心理测量”、“可靠性”、“有效性”等）。进行了全面的检索，包括检索标题、摘要和关键词，映射主题词，在某些情况下，爆炸函数被用来扩展相关结果。为所有三个数据库创建的完整检索策略是一个公开的补充文件，包含在 PROSPERO 上注册的系统审查协议中。

纳入和排除标准
纳入标准如下：

1.
该研究必须描述 ED 认知自我报告测量的开发、验证和/或心理测量评估。

2.
该测量（或子量表）是专门为评估 ED 认知（即想法、期望、假设或信念）而开发的。

3.
该措施以英语为母语人士制定和实施，并以英语在同行评审期刊上发表。

4.
利用成年人群（17 岁以上，临床或一般）进行开发、评估或调查目的。

排除标准如下：

1.
非心理测量研究（例如文献综述、系统评价或荟萃分析）。

2.
测量（或子量表）的设计目的不是评估 ED 认知（例如，作为筛查或诊断工具，或评估行为或情绪）。

3.
衡量标准不是用英语进行的，不是用英语进行的，也不是在非英语国家发布的。

4.
使用儿童或青少年人群。

5.
书籍章节、非同行评审出版物、发表的博士论文。

选拔流程
文章由两位独立审稿人（AH 和 SB）筛选和选择。使用已识别的数据库，识别并删除重复项，并按标题和摘要筛选文章，以供 AH 纳入/排除。在标题和摘要筛选过程中，与四位作者举行了一系列会议，就这一阶段可用措施的相关性达成共识。之前对身体形象的心理测量系统审查也采用了类似的过程[ 48]。初步筛选后获得了剩余研究的全文，然后两位评审员独立分析每个文本以确定要纳入的最终文本。如果在标题和摘要筛选阶段无法使用衡量标准（在项目级别），则还会在筛选过程的此阶段评估衡量标准（和子量表）的相关性和资格。需要进一步审查以评估其是否符合纳入标准的研究（以及措施）被纳入全文筛选，以评估其在子量表和项目层面的相关性和资格。举行了最终共识会议，所有作者都就所有包含的措施的相关性达成了一致。脚注1两位评审者之间的总体一致性为 96.7%，相当于评审者间一致性 (Kappa) κ = 0.93。

质量评价
Terwee 等人对纳入研究的心理测量特性进行了分析。[ 87 ]测量属性的充分性标准。该质量评估工具旨在评估健康状况问卷，并已在之前的几次系统评价中使用过[ 9,59,84,101 ]。该工具评估九个测量属性，包括（1）内容有效性，（2）内部一致性，（3）标准有效性，（4）结构有效性，（5）再现性：一致性，（6）再现性：可靠性，（7）响应性，（8）地板和天花板效应，以及（9）可解释性。请参阅表1，了解九个属性中每个属性的定义和充分性标准。

表1 心理测量特性的质量标准[ 87 ]
全尺寸桌子
标准给出了以下评价等级；阳性 (+)、中间 (?)、阴性 (−)、无可用信息 (0)。如果对研究方法存在严重疑问，根据使用这些标准的指南，可以给予中间评级[ 87 ]。在进行评级时，必须考虑纳入研究的方法学质量，因为那些方法学质量较低的研究更有可能报告有偏差的结果。此外，内部一致性标准允许研究在进行 Cronbach α 时考虑过去的因素分析或项目反应理论 (IRT) 分析的结果（即，因为每项研究不一定需要进行新的因素分析）。最后，特威等人。[ 87] 表明所有测量属性不一定同等重要，因此，我们遵循建议不提供摘要或总体分数。

此外，通过描述纳入的研究是否为发展研究、进行的任何因素分析、研究人群、样本量、平均年龄和标准差以及性别比例（女性百分比）来总结纳入的研究。通过描述所测量的结构或目标、项目数量、响应类别以及任何子量表或因素来总结所包含的测量（或子量表）。我们试图通过联系资格评估研究的作者来获取缺失或不清楚的信息。不影响纳入的缺失或不清楚的信息仍被记录（为“？”或不适用[N/A]）。在缺乏联系作者的信息的情况下，我们坚持假设，如果参与者被描述为“学院”或“大学”年龄，则他们是成人样本（17 岁以上）的一部分。

结果
搜索策略的结果
初步搜索确定了 7581 项潜在研究。去除 2484 个重复项后，产生了 5097 项潜在研究，其中 57 项被认为符合纳入标准。通过交叉检查感兴趣文章的参考文献列表和搜索谷歌学者，确定了另外两项研究。总共纳入了 59 项研究（纳入研究摘要见表2 ）。选择过程总结在图 1中。

表 2 研究描述
全尺寸桌子
图。1
图1
研究识别、筛选和选择的 PRISMA 图（PRISMA [ 66 ]）

全尺寸图像
总共确定了 31 项符合纳入研究纳入标准的衡量标准（或子量表）（见表3）所包含措施的摘要）。其中九个测量是子量表，九个是原始测量的简短版本或修订版本。这些措施是外貌信念问卷（BASS）、暴食症自动思维测试（BATT）、身体检查认知量表（BCCS）、暴食症认知扭曲量表（BCDS）、暴食症思维问卷（BTQ）、饮食信念问卷（EBQ）、饮食信念问卷 18 (EBQ-18)、饮食失调信念问卷 (EDBQ、饮食失调核心信念问卷 (ED-CBQ)、饮食失调核心信念问卷修订版 (ED-CBQ-R)、饮食失调量表身体不满意量表 ( EDI [BD]）、饮食失调量表 II 身体不满意量表（EDI-II [BD]）、饮食失调量表 III 身体不满意量表（EDI-III [BD]）、

表3 措施说明
全尺寸桌子
每个测量的认知焦点使用四大类来描述：（1）关于食物和饮食的负面想法，（2）关于体重、形状或身体形象的负面想法，（3）自我参照信念，以及（4）元认知-认知信念（见表4）。这些类别是通过检查所包含的测量内容并确定认知内容的主要领域和评估的认知类型而形成的。总共有 15 项措施评估了有关食物和饮食的负面想法，20 项评估了有关体重、体形或身体形象的负面想法，9 项评估了自我参照信念，9 项评估了元认知信念。BCDS、TAQ-ED 和 TAQ-ED-R 考虑了认知焦点的所有四个类别。

表 4 所包含测量的认知焦点
全尺寸桌子
心理测量特性评估
使用 Terwee 等人概述的标准评估每项纳入研究的心理测量特性。[ 87 ]。该评估由筛选和评估研究资格的两名评审员（AH 和 SB）独立进行。评审者对于充分性标准的一致性为 94% (κ = 0.91)。已达成共识以解决两位评估员之间的差异，因此不需要第三位评估员。表5显示了每项措施的汇总评级。

表 5 心理测量特性的质量分析/评级
全尺寸桌子
内容有效性
内容效度是指衡量项目准确反映兴趣结构的程度[ 87 ]。为了获得积极的评级，描述测量发展的研究（测量或子量表）需要提供对测量目标、测量概念、目标人群和项目选择的清晰描述。此外，他们还需要有专家和相关目标人群参与项目选择。十七项措施获得了该标准的积极评价，包括 BASS、BATT、BCCS、BCDS、BTQ、EDBQ、ED-CBQ、ED-CBQ-R、EEI、IFBS、IOET、MACQ-B、MACQ-R、SEDS（ ADC）子刻度、SEDS (BDC) 子刻度和 SEDS (LSE) 子刻度。这些发现表明这些测量（或子量表）表现出足够的内容效度。

内部一致性
内部一致性是指度量中的项目相关的程度，从而评估相同的结构[ 87]。要获得积极的评级，研究必须报告测量（或子量表）足够量级的克伦巴赫α，并使用足够的样本量进行因子分析。当评估子量表的内部一致性时，如果仅在子量表上进行因素分析，则考虑因素分析；如果将所包含的子量表作为因素进行测试，则考虑在整个量表上进行因素分析。十四项措施获得了该标准的积极评价。这些结果表明，BATT、EBQ、EBQ-18、EDBQ、ED-CBQ-R、EDI-III (BD) 子量表、FBES、MACQ、MACQ-R、MDDI (DS) 子量表、PBTS、SATAQ-4 (IT)子尺度、SATAQ-4R (IT) 子尺度和 TQ 已表现出足够的内部一致性。

标准有效性
根据特威等人的说法。[ 87 ]标准，标准有效性是通过与“黄金标准”工具进行比较来确定的，确保新措施在理论上与既定措施相关。鉴于我们对按时间段包含的研究和措施没有施加限制，并且如果研究按照 Terwee 等人的标准评估标准有效性，则没有合适的或广泛认可的评估 ED 认知的黄金标准。[ 87] 定义，我们允许每项研究及其作者为他们对黄金标准的定义提供自己的理由或令人信服的论据。虽然“标准效度”一词确实在一些研究中使用，但作者实际上指的是其他形式的效度（例如，内容效度或结构效度）。没有任何措施获得正面评级，大多数措施获得“无可用信息”评级。五项措施（EBQ-18、EDBQ、EDI [BD] 子量表、EDI-II [BD] 子量表、EDI-III [BD] 子量表）因用于比较的黄金标准措施缺乏令人信服的论据而获得不确定评级，其中一个 (TQ) 获得负面评级，因为与提议的金标准的相关性 < 0.07。

建构效度
结构效度是指特定调查问卷上的分数与其他测量相关（或不相关）的程度，其方式与有关正在测量的概念的理论推导的假设一致[ 87 ]。为了获得积极的评级，研究需要对其假设提供明确的预测，其中 75% 的结果符合预期方向（例如，报告预期方向上两个测量值之间的相关性）。几乎所有措施都获得了该标准的积极评价，表明绝大多数措施具有足够的结构效度。只有 TAQ-ED-R 获得了不确定评级，而 BTQ 获得了“无可用信息”评级。

再现性：一致（测试-再测试）
一致性是指某项指标的分数随着时间的推移保持稳定的程度。根据特威等人的说法。[ 87 ]当绝对测量误差小于最小重要变化（MIC）因子时，就证明了足够的一致性。然而，本次综述评估的任何研究均未定义或使用 MIC。因此，我们利用了 Burton 等人之前使用的一致性标准。[ 9 ]，和祖卡拉等人。[ 101 ]，将足够的一致性定义为r的重测可靠性 > 0.70。要获得该标准的正面评级，必须在两个时间点都提供平均值和标准差。七项指标对该标准获得了积极评价，表明 EBQ、EBQ-18、EDI-III (BD) 子量表、IOET、MACQ、MDDI (DS) 子量表和 PBTS 具有足够的重测一致性。

再现性：可靠性
再现性可靠性是指个体之间可以区分的程度[ 87 ]。要获得积极的评级，需要采取措施提供组内相关性或加权 Kappa > 0.70 来测试这一点。EBQ-18 和 EDI-III (BD) 子量表是唯一能够证明足够可靠性的指标。所有其他措施均获得“无可用信息”评级。

反应能力
响应性是指随着时间的推移或干预后检测临床重要变化的能力[ 87 ]。要获得积极评价，研究必须概述治疗方案和纵向预期变化，并且 75% 的结果必须符合预期方向。或者，测量结果必须证明响应比 > 1.96 或曲线下面积 > 0.70。只有 EBQ、EBQ-18、SATAQ-4 (IT) 子量表和 WISE-Q 表现出足够的响应能力。

地板和天花板效果
根据特威等人的说法。[ 87 ]，当超过 15% 的参与者在一项措施（或子量表）上获得最高或最低分数时，就会出现下限和上限效应。只有 EDI-III (BD) 子量表对此标准表现出积极的评级，因为报告的信息表明缺乏下限和上限效应。ED-CBQ-R 在其一个分量表上表现出下限效应，因此获得负面评级。所有其他措施均获得“无可用信息”评级。

可解释性
可解释性是指定量分数可以被赋予定性意义的程度[ 87 ]。要获得积极评级，一项措施必须提供一项研究中至少四个相关亚组（单独）的平均值和标准差分数。根据 Terwee 等人的建议，可以将按人口统计变量（例如年龄、性别）分层的子组作为子组包括在内。此外，如 Zuccala 等人。[ 101]]，对该标准进行了修改，因此不需要最小重要变化 (MIC) 即可获得积极评级，因为没有研究报告 MIC。研究结果表明，14 个量表（或分量表）具有足够的可解释性，包括 BATT、EBQ、EBQ-18、ED-CBQ-R、EDI (BD) 分量表、IFBS、MACQ-R、SATAQ-R (IT) 分量表、SATAQ -4R (IT) 子刻度、SEDS (ADC) 子刻度、SEDS (BDC) 子刻度、SEDS (LSE) 子刻度、TQ 和 WISE-Q。正如莫迪尼等人。[ 59 ]和祖卡拉等人。[ 101 ]之前已经指出，重要的是要注意，如果考虑研究之间亚组的积累（而不是孤立地在一项研究中），很可能有更多的措施符合这一标准。

讨论
优先评估 ED 认知对于监测导致 ED 发生和维持的关键因素至关重要。自我报告测量必须具有足够的心理测量特性，以提高其有效性、可靠性和临床研究和实践的实用性。本系统综述旨在使用 Terwee 等人的方法评估现有 ED 认知自我报告测量的心理测量特性。[ 87 ]测量属性的充分性标准，以进行质量评估。

该综述确定了 59 项研究，这些研究评估了 31 项评估 ED 认知的自我报告测量（或子量表）的心理测量特性。在这些措施中，检查最多的认知焦点类型是关于体重、形状或身体形象的负面想法，其次是关于食物和饮食的负面想法。自我参照和元认知信念是在所包含的测量中评估程度较小的认知类型。这表明，大多数专门为评估 ED 认知而开发的自我报告措施主要集中在“思想”层面，而用于检查长期存在或根深蒂固的信念集（包括有条件和无条件的假设和信念）的自我报告措施较少。

关于所包含措施的心理测量特性，没有任何措施（或子量表）在所有类别中都获得积极评价。在所有措施中获得最多正面评价的标准是结构效度。这首先表明，与其他不太经常考虑的心理测量特性相比，研究倾向于检查建构有效性，并且还表明评估 ED 认知的现有措施显示出构建有效性的有力证据。与其他标准类别相比，调查结果表明，对其他标准类别的评估和考虑较少。例子包括标准有效性、再现性、可靠性、响应性以及下限和上限效应，其中大多数措施没有找到有关评估这些财产的信息。有趣的是，就内容效度而言，大多数研究和测量确实清楚地描述了测量的概念、预期的目标人群，也有专家参与项目选择。然而，所有具有不确定评级的措施的特点是缺乏明确目标人群是否以及如何参与项目选择的信息，而那些具有负面评级的措施则未能描述目标人群参与项目选择的情况。显然，拥有反映认知结构的项目非常重要，这些项目已被这些措施试图描述和评估其认知的人群所承认是相关的。大多数研究和措施确实清楚地描述了测量的概念、预期目标人群，并且还邀请专家参与项目选择。然而，所有具有不确定评级的措施的特点是缺乏明确目标人群是否以及如何参与项目选择的信息，而那些具有负面评级的措施则未能描述目标人群参与项目选择的情况。显然，拥有反映认知结构的项目非常重要，这些项目已被这些措施试图描述和评估其认知的人群所承认是相关的。大多数研究和措施确实清楚地描述了测量的概念、预期目标人群，并且还邀请专家参与项目选择。然而，所有具有不确定评级的措施的特点是缺乏明确目标人群是否以及如何参与项目选择的信息，而那些具有负面评级的措施则未能描述目标人群参与项目选择的情况。显然，拥有反映认知结构的项目非常重要，这些项目已被这些措施试图描述和评估其认知的人群所承认是相关的。所有评级为不确定的措施的特点是不清楚目标人群是否以及如何参与项目选择，而那些评级为负面的措施则未能描述目标人群参与项目选择的情况。显然，拥有反映认知结构的项目非常重要，这些项目已被这些措施试图描述和评估其认知的人群所承认是相关的。所有评级为不确定的措施的特点是不清楚目标人群是否以及如何参与项目选择，而那些评级为负面的措施则未能描述目标人群参与项目选择的情况。显然，拥有反映认知结构的项目非常重要，这些项目已被这些措施试图描述和评估其认知的人群所承认是相关的。

关于所确定的四大类认知焦点，可以提出一些具体的观察结果和后续建议。在尝试评估与食物和饮食有关的负面想法时，与评估类似内容的其他措施相比，EBQ-18 目前拥有最多的有效性、可靠性和实用性证据。相关地，在评估与体重、体形和身体形象相关的负面想法的措施中，EDI-III (BD) 子量表和 SATAQ-4 (IT) 子量表拥有最多的心理测量支持。然而，值得注意的是，这些措施都集中在对身体的不满，这意味着对更苗条的身体的渴望，而不是例如更肌肉发达的身体。因此，即使在确定的类别内，在选择和使用认知 ED 测量方法时，考虑兴趣的构建仍然很重要。关于自我参照信念，ED-CBQ-R 目前拥有最多的证据证明其有效性、可靠性和实用性。EBQ-18 对其评估与 ED 相关的元认知信念的测量的心理测量特性拥有最实证的支持。

还出现了一种总体模式，表明原始衡量标准的新修订版本显示出更多的正面评级，EBQ-18、ED-CBQ-R、EDI-III (BD) 和 MACQ-R 就证明了这一点。该系统评价的结果还表明，EBQ、EBQ-18 和 EDI-III (BD) 有最多的证据支持其心理测量特性。然而，不能得出严格的结论说这些测量在客观上是优越的，因为并非所有测量属性都必然同等重要[ 87 ]。如前所述[ 101]，不同的测量可用于不同的目的，并且某些心理测量特性在不同的情况下可能具有不同的重要性。例如，出于临床试验的目的，足够的反应性可能是最重要的，而在旨在确定各种认知是否存在的流行率研究中，选择更广泛的测量可能更有益。此外，无法就特定测量的优越性得出结论，因为本综述考虑了不同类型的 ED 认知。ED认知的自我报告测量检查了不同的结构（例如，身体不满意与关于饮食的元认知信念）和认知类型（例如，自动思维与无条件信念）。因此，

这项系统评价有几个显着的优势，包括通过利用先前验证的工具来应用标准化和系统方法，该工具在之前评估自我报告措施的心理测量特性的系统评价中广泛使用[ 9,59,84,101 ]。该审查还证明了审查过程的几个阶段具有良好的评价者间可靠性的证据。此外，本次审查包括纳入研究中的所有版本的衡量标准，无论该衡量标准是自我报告衡量标准的原始版本、修订版本还是简短版本。这有助于进行全面总结，并可以比较每个调查问卷版本的证据状态。

同样重要的是要注意一些局限性，首先是本研究中使用的质量评估工具的严格性。所使用的标准可能意味着，根据严格的充分性评估标准，某些措施会获得中间或负面的评级，而使用不太严格的标准可能会导致更积极的评级。例如，我们在评估内部一致性时遵循严格的 Cronbach's alpha 截止值，其中一些研究提出的 alpha 值仅略高于或低于给出的范围，以便给出积极的评级。作者试图在几个例子中解决这个问题，同时仍然保持预期的严格性，通过对评级提供一些宽大的处理，如前所述，9 , 101]。例如，在重测可靠性方面，同意使用更常用的统计方法来衡量可靠性的研究。此外，在涉及身体形象测量时，作者在内容有效性方面有些宽松，因为“让目标人群参与项目选择”的要求意味着目标人群不一定需要是临床急诊人群，而只是那些提出各种身体形象问题。总而言之，继续维持这一标准被认为是必要且有益的，以便推荐使用心理测量学上合理的措施，重要的是为研究人员提供激励，以继续提高现有和未来评估工具的质量，并通过扩展，提高实证质量更普遍的证据。

此外，重要的是要考虑我们的纳入和排除标准的严格性质以及所提供的证据。本次审查的一个局限性是，只有利用成年人口和非英语人口的文章才会被考虑纳入。因此，根据这些标准，一些支持某些心理测量特性的措施或研究可能已被排除在外。最终，利用非英语人群的研究或非英语实施的措施不在本次审查的范围之内。作者还考虑了在本系统评价背景下评估的证据中减少某些异质性的重要性[ 51]。这也与排除利用儿童、纯粹青少年或混合人群的研究有关。作为不同发育阶段 ED 症状差异的函数 [ 23 , 50 ]，重要的是要考虑成人和儿童或青少年人群之间 ED 认知的潜在差异，并且一些评估工具在一个人群中可能有效且可靠，但在不同人群中可能有效且可靠。其他。

最后，我们针对专门开发的、仅用于测量 ED 认知的测量标准的严格性，意味着一些更常用的 ED 测量未包含在本次系统评价中。这包括 EDE-Q [ 26 ] 涉及饮食态度测试的子量表和版本（EAT-40 [ 34 ]、EAT-40 [ 35 ]）。在开发过程中对他们的意图进行的检查以及在项目级别的仔细审查反映了他们捕获了其他症状，包括情绪、行为症状和测量功能障碍的项目。由于这些措施用于临床和诊断目的的频率，这些排除可能会影响本综述的临床效用[ 42]。然而，我们还认为这两种措施的心理测量特性已在其他地方进行了评估和系统审查[ 5,45,67 ]。另一种未考虑纳入的常用认知测量是青年图式问卷（YSQ-S3）[ 100 ]。尽管它在捕获核心认知结构方面很有用，但它并不是专门为捕获 ED 认知而开发的，而这正是本次系统评价的重点。最后，虽然本研究包括 EDI-III (BD)，但之前的系统评价已考虑 EDI-III (BD) 来评估身体形象的评价和情感成分[ 48 ]。由于这种差异，我们建议谨慎解释研究结果。

本次系统评价的结果提出了未来研究需要改进的几个领域。首先，我们的研究结果并不一定表明不应使用缺乏足够证据的措施，而是主要强调在缺乏心理测量支持的情况下，明确建议未来的研究人员集中精力改进证据的有效性、可靠性和准确性。这些措施对所考虑人群的效用。也许更需要考虑 ED 认知测量的反应性和临床实用性，以及不太广泛考虑的测量属性，例如标准有效性和检查下限和上限效应。

在检查所包含测量的认知焦点、认知内容和类型时，很明显，大多数人倾向于仅考虑 AN、BN、BED 和对身体形象问题的评估。当然，还有空间考虑开发和可用性工具来评估研究相对较少的急诊科或临床关注度迅速增加的急诊科的认知能力。这包括回避性限制性食物摄入障碍（ARFID）和神经性厌食症等疾病，目前只有症状和行为清单以及可用于支持诊断的工具。最后，在检查纳入研究中最常使用的人群的同时，很明显，研究需要继续优先纳入更多的男性和性别多样化样本。37、39、81 ]。_ _ _

总而言之，本研究首次对 ED 认知的自我报告测量进行了系统回顾，并提供了有关其心理测量特性的现有相关证据的有价值的信息。这些信息为未来选择有效、可靠和临床有用的工具来测量各种 ED 认知提供了基础。尽管没有一项措施似乎在所有九个测量标准上都拥有足够的证据，但有一些措施提供了大量证据来支持其可靠性、有效性和实用性。最终，提供了全面的信息，以支持未来根据研究和/或治疗的具体目标选择 ED 认知测量。

发布日期:2024-03-04

期刊推荐

《国际医学科研与转化》International Medical Research and Translation(IMRT)

《医学科研与创新》Science International Innovative Medicine

《医学创新与探析》

《细胞生物学研究》Cell Biology Research

《药物发展研究》Journal of Medicines Development Sciences

《精准医学》Advances in Precision Medicine

《骨与关节外科》Bone and Arthrosurgery Science

《皮肤科健康》Dermatological Health