新闻资讯

戏剧对社会能力的影响:荟萃分析评估

介绍
人们越来越有兴趣使用艺术干预作为发展人际能力的方法。许多专业人士、非营利机构和政府都提倡艺术活动可以鼓励人际交往、增强群体凝聚力或培养宽容,从而解决社会问题以及个人的身心问题。代理机构(例如 Carnwath & Brown、引文2014年;马塔拉索,引文1997 年;麦卡锡等人,引文2004)。对艺术效益的评估已成为文化政策设计的核心(McCarthy 等人,引文2004)以及有关文化部门公共支出合法性的辩论(Belfiore & Bennett,引文2010)。随着社区艺术项目(Bungay & Clift、引文2010年;黑客等人,引文2008)以及衡量艺术社会影响的兴趣高涨(Belfiore & Bennett,引文2007),有大量报告为艺术项目和倡议的疗效提供证据(Crossick & Kaszynska,引文2016年;斯潘德勒等人,引文2007)。然而,现有的报告主要基于案例研究形式的定性证据,重点关注心理变化的过程,而不是证明变量之间的因果推论并衡量其影响(参见阿姆斯特朗等人的文献综述,引文2019年;科赫等人,引文2014年;尤蒂斯,引文2006)。为了确保艺术干预成为实现社会效益的有效手段,有必要对现有的实验和准实验定量研究进行收集、回顾和总结。

在本文中,我们打算填补这一空白,并对积极的戏剧参与对社会能力的影响提供元分析评估。我们关注戏剧干预,因为在用于心理治疗的不同艺术形式中,戏剧特别关注社会互动。与此同时,就心理社会干预而言,它是研究最不足的艺术流派之一。少数荟萃分析侧重于戏剧(Conrad & Asher,引文2000;基珀和里奇,引文2003年;李等人,引文2015年;莱万多夫斯卡和韦齐亚克-比亚洛沃尔斯卡,引文2020 年;红褐色和棕褐色,引文2008),并且没有对戏剧对社会互动的影响进行荟萃分析评估。鉴于近几十年来,特别是自 2000 年以来,艺术干预的研究领域已大大扩展(Feniger-Schaal & Orkibi,引文2020 年;雷格夫和科恩-亚茨夫,引文2018),需要进行荟萃分析,总结当前的研究结果,并检查戏剧对社会能力(如同理心、沟通或与他人互动的能力)的影响。这些能力通常与戏剧艺术联系在一起,但迄今为止尚未探讨戏剧干预对其发展的影响。

接下来,我们提供叙述性文献综述,介绍本文使用的方法(包括研究资格标准、检索方法、数据收集程序和分析方法),然后描述系统评价和荟萃分析的结果。在讨论部分,我们根据当前研究考虑结果并反思我们研究的局限性。

戏剧和社交互动
当戈夫曼(Goffman)(引文1954)引入戏剧作为日常生活中自我呈现的隐喻。与舞台上表演的演员类似,意识到被观察的个体会“表演一个角色”,以引导其他人对他们形成的印象。由于表演和现实生活互动之间的联系,戏剧干预被认为可以有效地发展社交技能和与他人保持令人满意的关系的能力。首先,戏剧表演与同理心有关(戈德斯坦,引文2009年;荨麻,引文2006)。遵循康斯坦丁·斯坦尼斯拉夫斯基(Konstantin Stanislavski)的方法(1936),表演者利用他们的情感记忆来理解主角的动机,并恢复在与所创造的角色的情况平行的情况下所经历的感受(Verducci,引文2000)。研究结果表明,这个过程涉及两种类型的共情能力:认知共情(换位思考),它使个人能够理解他人的心理状态;情感共情(情绪的替代分享),指的是对其他人的情绪和情绪做出的情感反应。状态(史密斯,引文2006)。

其次,因为戏剧干预是以群体为导向的,并且是在互动的社会背景下进行的(Emunah,引文1994),他们提供了社交机会(引文2014年,第。2014)。团体戏剧制作有利于社会关系的发展,并通过加强自发互动来鼓励人际交往。研究表明,由于管理自我与角色之间的距离与戏剧艺术特别相关,因此戏剧制作可以成为一种有效的“疏远手段”,使参与者能够在社会亲密与分离之间找到平衡。引文1982年;兰迪,引文1983)。

第三,戏剧干预被认为可以增强信心和自尊。有人认为,舞台表演促进了“旧自我的解构和新身份的创造”的过程(Snow 等人,引文2003年,第。74),让演员重新发展出更强大的自我。参与戏剧表演会唤起喜悦、自豪和成就感(Emunah & Johnson,引文1983年;斯诺等人,引文2003)并让参与者获得自我意识,从而改善自我形象并更加接受自己(Holmqvist 等人,引文2017)。

戏剧导师和治疗师使用不同的积极戏剧参与技巧。例如,基于 Boal 的被压迫者剧院的戏剧研讨会以及回放剧院培训被发现可以提高不同目标群体的移情能力、换位思考和关怀行为(Bhukhanwala 和 Allexsaht-Snider,引文2012年;博登霍恩和斯塔基,引文2005年;莫兰和阿隆,引文2011年;吴和格雷登,引文2016)。基于戏剧的干预措施已被用来提高精神疾病患者的自尊(Orkibi 等人,引文2014),有学习障碍的成年人(Hackett & Bourne,引文2014),患有乳腺癌的女性(Mattson-Lidsle 等人,引文2007),以及那些与虐待或拒绝的感觉作斗争的儿童(Moore 等人,引文2017)。模仿和建模技术,例如角色扮演和面具,被认为有助于理解犯罪和犯罪行为,并用于增强囚犯的亲社会行为(Harkins 等人,引文2011)和青少年欺凌者(伯顿,引文2010)。

上述大多数研究都使用观察方法,例如访谈、参与者回忆或基于视频的民族志。我们的研究侧重于实验研究和准随机对照试验,旨在收集和分析现有证据并研究因果关系(按照健康科学的要求)。

方法
纳入和排除标准
为了确定合适的实验研究,我们使用 PICOS 框架定义了以下资格标准(参与者、干预措施、比较、结果、研究设计;Higgins 和 Green、引文2008):

参加者。我们的研究从参与者类型的广泛范围开始。对年龄、性别、种族或身体状况没有限制。

干预措施。我们的研究评估基于积极戏剧参与的干预措施。这种干预类型包括利用戏剧治疗和表演技术的研讨会和课程,例如回放戏剧、教育戏剧、应用戏剧(麦克纳马拉、引文2006),治疗剧院(Snow 等人,引文2003),或参与式戏剧(Erel 等人,引文2017)。合格的干预措施基于创造性实践,例如戏剧游戏和练习、面具工作或虚构场景的即兴创作。与此同时,我们排除了采用戏剧艺术但更接近心理治疗而不是戏剧制作的方法的试验。例如,基于心理剧的干预被排除在外,因为心理剧治疗通常一次集中于一组中的一个人,并且更多地面向个体治疗而不是社会互动(Emunah,引文1994)。此外,心理剧的目标是解决现实生活中的困境,而不是使用隐喻和想象的材料进行艺术创作(Blatner & Blatner,引文1988年;引文2014年;埃穆纳,引文1994年;凯德姆-塔哈尔和菲利克斯-凯勒曼,引文1996年;威尔金斯,引文1999)。

比较。与活跃剧场参与进行比较(比较)的干预措施包括活跃(替代活动)和不活跃(无活动)对照组。

结果。我们专注于旨在提高社会能力的干预措施。在选定的研究中,我们反复审查了结果测量的可比性,并将它们分为以下结果组:共情能力、社交互动、社交沟通、宽容和自我概念。聚类方法借鉴于另一项荟萃分析(Koch 等人,引文2014)。我们分析了每个簇内的异质性,以调查研究结果是否具有可比性。

学习规划。符合条件的试验使用干预措施和对照可比组,并测量干预前后的结果。不使用对照组的研究被排除在外。我们没有将我们的研究限制于随机对照试验,因为随机化在剧院干预中并不总是可行(Goldstein,引文2015)并且在基于艺术的治疗领域通常很少进行严格的试验(Jones,引文2015年;红褐色和棕褐色,引文2008年;尤蒂斯,引文2006)。相反,我们允许实验研究和准实验研究。评估偏倚风险以确保纳入研究的高方法学质量。

此外,还根据数据可用性对研究进行了分析。当缺少任何必要的数据并且我们无法根据报告的研究结果计算它们时,我们会联系相应的作者。如果作者没有回应或无法提供缺失的数据,则该研究被排除。我们还排除了由于结果不一致或不明确而导致对研究质量产生怀疑的研究(参见,图1了解详情)。

搜索方法和试验选择
检索了七个数据库:PubMed、Cochrane CENTRAL、PsycINFO、EMBASE、Web of Science、ERIC 和 Science Direct。我们将搜索范围限制为英文出版物。鉴于每个书目数据库都有不同的搜索模式,我们的搜索参数必须相应修改,但一般来说,我们使用关键字“剧院或戏剧”以及附加搜索词“试验或随机或对照或实验*”。使用布尔运算符(“NOT”)和“operat* theat* OR外科手术*”等短语来避免太多不相关的搜索结果。我们没有应用日期或研究领域限制。此外,我们还手动检索了三本专门针对艺术与健康主题的期刊:《心理治疗中的艺术》、《艺术与健康》和《戏剧治疗》。对此,我们添加了通过谷歌学术搜索确定的研究。对已纳入研究的参考列表进行了筛选,以确定我们的选择中仍然缺少的可能相关的试验。Prisma 流程图总结了搜索过程(图1)。

搜索过程产生了 467 项可能符合条件的研究。第一作者对剩余 345 篇文章进行了重复删除和标题及摘要筛选。选择相关研究后,第一作者根据所有作者商定的资格标准逐条检索和分析全文。当选择需要做出判断时,作者讨论并共同决定研究排除。在此阶段,将研究排除在进一步分析之外的原因已记录在研究数据集中。排除的最典型原因之一是出版物类型不相关(例如,它是一篇评论或研究方案),使用的干预措施不充分(例如,将戏剧与其他艺术或非艺术相结合的干预措施,

数据收集与分析
数据提取
对于每项纳入的研究,我们提取了其标题、作者和出版年份以及 PICOS

参与者的特征(样本平均年龄、性别、参与者状况),

干预类型(例如,回放剧场、教育戏剧、创意戏剧)、干预的持续时间和频率,

对照组的活动,

感兴趣的结果(一些纳入的研究测量了不止一种感兴趣的结果;例如,Dow 等人(引文2007)报告了有关移情能力和社交沟通的测量。中的“结果”栏表格1显示了这种重叠)。

分组分配:随机对照试验、整群随机对照试验(参见分析问题单元)、准随机对照试验(分配方法不被视为严格随机的研究)。

评估偏倚风险
Cochrane 协作组织(Higgins & Green,引文2008)用于评估纳入研究的方法学质量。两位作者阅读了论文并独立评估了每项研究的偏倚风险。当出现分歧时,通过讨论达成解决方案。作者评估了六个不同领域的风险:序列生成、分配序列隐藏、盲法、不完整的结果数据和选择性结果报告。前两个领域的偏倚风险:序列生成(向参与者分配干预措施的规则是否基于随机过程)和分配序列隐藏(调查人员是否能够或不能预见干预措施分配)被认为是“当试验遵循严格的随机程序时为“低”,当试验遵循准随机试验时为“高”。

就致盲而言,一般不可能对艺术干预的参与者蒙蔽他们所接受的治疗类型(Koch 等人,引文2014),因此我们只能评估负责编码或数据分析的人员或研究助理是否接受了盲法。在提供此类信息的五项研究中,评估者对小组分配和/或研究假设不知情。

因退出、退出和方案失败而导致试验参与者流失的评估方式如下:当缺失数据的原因可能与研究结果有关时,风险报告为“高”;当数据缺失的原因可能与研究结果有关时,风险报告为“低”。当缺失数据在各组之间的数量上平衡时,以及当缺失结果中的合理结果在治疗效果的实际重要性方面对观察到的效果大小没有影响时,不太可能与研究结果相关。最后,在选择性结果报告领域,当没有明确证据表明结果未以预先指定的方式报告时,风险被视为“低”;当有此类证据时,风险被视为“高”。由于纳入研究的方案通常不可用,

所有具有“低”和“不清楚”偏倚风险的研究均被接受用于荟萃分析。不排除非严格随机(高序列生成风险)的研究,但我们进行了异质性分析,以检查随机和半随机研究在效应大小方面是否具有可比性。当我们能够解决和解决可能破坏证据有效性的问题时,例如,作者向我们提供了缺失的信息,其他领域具有“高”风险的研究就会被接受。由于初步研究中存在许多缺失信息,我们仅呈现与随机分组分配相关的结果(表格1)。

分析问题的单位
被确定为整群随机对照试验的研究(CRCT;参见表格1)使用以下分配单位:一间教室(Rousseau 等人,引文2007),一所学校(Mora 等人,引文2015)或大学年级/学生团体(Pfeiffer 等人,引文2017)。教育研究中的随机化特别困难(Goldstein,引文2015)和整群随机试验在学校和大学环境中很常见(Shackelton 等人,引文2016)。CRCT 的关键假设是同一集群内的参与者倾向于以相似的方式行事,因此不应被视为彼此独立的受试者。不考虑聚类的数据分析可能会导致干预效果方面的假阳性结论(Higgins & Green,引文2008)。由于所有 CRCT 的结果报告均未考虑聚类(即,就好像个体已被随机化),因此我们校正了样本大小以考虑聚类。有效样本量的计算方法是将样本量除以设计效果,计算公式为:1+( M -1)*ICC (Rao & Scott,引文1992),其中M是平均簇大小,ICC 是类内相关系数(Higgins & Green,引文2008 年,第 17 页。496)。正如 Higgins 和 Green 所建议的,ICC 来自外部来源(引文2008 年,第 17 页。496)。例如,卢梭等人的研究。(引文2007)和莫拉等人。(引文2015),自我概念结果的ICC来自Shackelton等人。(引文2016)。在 Pfeiffer 等人中。(引文2017),我们假设 ICC 等于“0”,因为集群由被分配到短期项目组的大学生组成。

效应大小编码
Cohen's d及其方差可以 (1) 提取(如果直接在出版物中报告),(2) 从报告的其他测量值(例如 t 检验和 p 值)转换,或 (3) 计算,如果报告的测量值不足以使用选项 (1) 或 (2)。关于后者,由于所有纳入的试验都报告了连续结果,为了计算 Cohen's d ,我们提取了样本量、前测和后测均值(或者如果前测均值不可用,则仅基线调整后测均值)和标准差(如果标准差为标准差,则仅提取基线调整后测均值)。不可用)对于每个(实验组和对照组)组,遵循 Morris 提出的测试前-测试后-对照组设计策略(引文2008),也被 Friese 等人应用。(引文2017)。具体来说,Cohen's d被定义为治疗组的平均前后变化减去对照组的平均前后变化,除以汇总的前测标准差,这被证明可以提供对群体效应大小的无偏估计并且有一个已知的抽样方差,该方差小于替代估计的抽样方差(Morris,引文2008)。正如莫里斯所示(引文2008)通过汇总前测标准差进行标准化可以对真实效果进行更精确的估计,因为干预通常会在后测中引起更大的变化。如果仅报告基线调整估计值,则 Cohen's d被定义为均值差异除以汇总后测试标准差,如 Higgins 和 Green 所建议的(引文2008)和博伦斯坦等人。(引文2009)。

在后续步骤中,将小样本偏差的 Hedges 校正因子应用于 Cohen d以计算 Hedges g及其方差。

对于提供不同尺度的连续数据来评估相同结果的研究,我们为每次比较的每个结果计算一个效应大小。由于这些效应大小在统计上不是独立的,因此我们在计算效应大小的标准误差时考虑了尺度之间的相关性,对它们进行了平均(Borenstein 等人,引文2009 年,第 17 页。230)。由于量表之间的相关性未知,我们假设每对量表的相关性为 0.5。我们认识到我们的方法和理论上支持的方法之间存在脱节(有关评论,请参阅 Marín-Martínez 和 Sánchez-Meca,引文1999年;弗里斯等人,引文2017)。然而,我们采用了可实现且也是 Borenstein 等人推荐的最佳方法。(引文2009)。

由于我们意识到它可能会影响结果和最终结论,因此我们通过测试两种场景来检查这种方法的稳健性。第一个假设是结果相关性较差(皮尔逊相关性等于 0.1)。在第二种情况下,假设结果是强相关的(假设皮尔逊相关性等于 0.9)。结果(呈现在表A1附录 1 中)对于检查结果之间的相关性水平是稳健的。无论测试的相关性强度如何(r = 0.1、r = 0.5 和 r = 0.9),剧院干预对检查结果的影响大小仍然具有可比性。

在作者报告了多个时间点结果的多次观察的研究中[例如 Mora 等人。(引文2015)报告了干预后三次测量的结果:1个月、5个月和13个月后],我们采用了最终的时间点荟萃分析(FTM)方法(Peters&Mengersen,引文2008)并在每项研究的第一个时间点收集证据(通常是在干预结束后立即获得的测量结果)。我们选择这种方法是为了保持一致性,因为在大多数研究中没有长期随访,并且治疗后测量仅在干预后不久进行一次。当我们处理一项多重干预研究(即由多个干预组组成)时,我们仅收集与我们的研究(剧院)相关的干预措施以及作者认为为“对照组”的组的数据。

所有结果都根据规模方向进行了修改。因此,“消极”结果的分数被逆转,使积极的效应大小表明治疗效果优于对照。结果以及测量尺度和子尺度、范围和计算细节(总和或平均值、极点变化等)的详细信息显示在表2。

荟萃分析程序
使用随机效应模型和 DerSimonian-Laird 估计方法(DerSimonian & Laird,引文1986)因为假设存在一种真正的“固定”人口效应是不合理的(Hedges & Vevea,引文1998)。荟萃分析是在 Stata 15 中进行的,使用允许应用逆方差权重的metan命令。

由于荟萃分析收集的研究应该足够相似,以便能够估计汇总效应,因此进行了异质性分析。使用 Q 统计量和 I 2统计量检查效应大小的异质性(Borenstein 等人,引文2009年;希金斯等人,引文2003)。如果 Q 统计量不显着并且 I 2表明异质性水平较小(I 2  < 50%;例如 Cuijpers 等人,引文2009)。

考虑到发表偏倚(报告相对较高效应量的研究比报告较低效应量或不显着效应量的研究更有可能发表;Borenstein 等人,引文2009年;弗里斯等人,引文2017),漏斗图(每项研究效果估计的散点图[通常在 x 轴] 与效果精度的某种测量[通常在 y 轴];[Langan 等人,引文2012 ]) 和 Egger 回归检验(提供有关关系显着性的数据)(Borenstein 等人,引文2009年)。由于较大的研究通常提供更精确的估计,因此预计漏斗图顶部的变异性较小,其中大型研究通常聚集在平均效应大小周围。相反,漏斗图底部预计会有更高的变异性,因为较小的研究(通常对效果的估计不太精确)位于此处(预计它们会分布在较宽的值范围内)。在存在发表偏倚的情况下,该图显得不对称,较小的研究位于左侧或右侧。值得注意的是,不对称漏斗图不一定自动表明存在发表偏倚。引文2012)。

结果
纳入研究的特点
本荟萃分析中包含的 21 项研究的特点见表格1。参与者按性别(49% 为女性)和年龄分布几乎均匀:10 项研究涉及儿童(5 项研究)和年轻人(5 项研究),10 项研究涉及成人(6 项研究)和老年参与者(4 项研究)。尽管一项研究涉及患有自闭症谱系障碍的参与者,但大多数年轻参与者都处于非临床状态(普通学校和大学生)。涉及成人和老年参与者的研究主要针对确诊患者和高危人群(老年人、倦怠症状)。诊断的参与者包括被诊断为特发性帕金森病且病情中等严重的患者 (54)(Hoehn-Yahr 2-4 期;Corbett 等人,引文2016年;米拉贝拉等人,引文2017 年),痴呆症(100 名参与者;平均病程年数 M = 2.8;Van Dijk 等人,引文2012),精神分裂症(16 名参与者;患病超过 2 年;Spencer 等人,引文1983 年),乳腺癌(36 名接受手术和/或放射治疗的患者;Ostby,引文2016)和血液透析患者(31 名参与者;平均血液透析持续时间 M = 3.5 年;Sertoz 等人,引文2009)。进行异质性分析是为了评估研究结果的普遍性。

戏剧干预的特点是参与者积极参与,参与形式多种多样,从成为演员(塑造角色、角色扮演)到参加戏剧和戏剧练习(游戏、肢体语言技巧、声音训练),以及作为观众成员(例如,在回放剧场干预中,参与者讲述他们的故事,然后观看由专业演员现场表演并回放)。通常,不同形式的参与(例如作为演员和观众)在一次干预中结合在一起。在大多数情况下,干预小组由经过培训的讲师指导,包括戏剧专业人士(演员、剧作家、戏剧教授等)和在干预前接受过戏剧培训的个人(教师、护理人员、同伴等)。

戏剧干预的一个例子:

“戏剧工作坊由剧团主导,每天 6 小时,连续两天,每月一次或两次,总共约 18 小时/月,持续 3 年。每个研讨会的最初部分都侧重于锻炼基本技能。所有受试者都接受了控制呼吸、姿势、步态、协调和手动任务的训练。(……)然后,患者被教导如何处理戏剧文本​​并对其进行分析。在工作坊的第二部分,患者根据即兴创作或草图单独或与演员一起进行小组排练。小品总是由公司演员执导,目的是在舞台上重现现实生活中可能发生的行为和情感。(……)经过一段时间的训练,一些病人写了一个剧本,并最终在导演的帮助下呈现出来”

在大多数研究中,戏剧表演持续 90 分钟。其中 6 项研究报告了一次性干预,而 13 项研究则采用每周一次或两次、持续 6 至 24 周的干预措施。两项研究使用了持续一年多的干预措施。

对照组条件包括无特定活动(六项研究)、等待名单(四项研究)或非剧院活动(10 项研究)。非戏剧活动的类型因参与者的类型而异,例如,涉及中学生或大学生的研究将戏剧活动与课外阅读和讲座进行比较,而涉及患者的研究通常采用非戏剧疗法(例如物理治疗、康复、或回忆疗法)。

研究使用自我报告和其他报告措施。共情能力,包括认知共情(识别和理解他人心理状态的能力;Corbett 等人,引文2016年;陶氏等人,引文2007年;格林等人,引文2018年,引文2015年;马塔鲁等人,引文2014年;维丁等人,引文2015)和情感同理心(感受他人情绪的能力,积极和/或消极;Bornmann & Crossman,引文2011年;卡莱罗等人,引文2017年;摩尔等人,引文2017)主要使用自我报告措施进行评估(一项研究使用其他报告量表)。社交互动,包括与他人互动的能力和意愿(Spencer 等人,引文1983年;范迪克等人,引文2012)和适应技能(Corbett 等人,引文2016年;古力等人,引文2013年;塞尔托兹等人,引文2009)主要使用由独立观察者和/或参与者父母完成的评级量表进行测量。衡量沟通技能(语言和非语言)的量表和子量表由独立评估者完成(Spencer 等人,引文1983),心理学家(米拉贝拉等人,引文2017),戏剧教授(Dow 等人,引文2007)和参与者的亲属(Corbett 等人,引文2016年;莫杜尼奥等人,引文2010)。宽容,包括对不同观点的开放态度的评估(Greene 等人,引文2018年,引文2015)以及对他人不存在偏见(Law 等人,引文2017年;马塔鲁等人,引文2014年;莫拉等人,引文2015),仅使用自我报告量表进行评估,类似于自我概念,其中包括自尊测量(个人对自我的积极评价;Mora 等人,引文2015年;诺伊斯等人,引文2004年;卢梭等人,引文2007年;塞尔托兹等人,引文2009)和自我效能(相信自己有能力取得成功;Ostby,引文2016年;菲佛等人,引文2017)。

在这 21 项研究中,16 项是完全随机的,其中包括三项使用整群随机化的研究。其余五项研究是准随机对照试验,即分配方法不被视为严格随机的试验(例如,基于连续、滚动进入的基础进行分组)。

干预措施的效果
剧院干预对共情能力的影响
九项研究总共调查了 1888 名参与者的积极剧院干预对共情能力的影响(N干预 = 972,N控制 = 916)。这些研究的汇总估计值(以剧院干预对共情能力的随机效应平均效应大小估计)为 g = 0.247,p < .001,95% CI(0.116,0.379;图2)。这表明,以积极参与为重点的剧场干预确实影响了共情能力,而且这种影响是中等的。观察到的效应大小的方差量较低(I 2  = 31.6%)。Cochran 的 Q 值为 11.69 (p = .165),这意味着在效应大小中观察到的异质性并不显着。

漏斗图(图3)似乎与分组在右侧的小型研究略有不对称,这意味着具有负面影响的小型研究可能由于发表偏差而被遗漏。然而,漏斗图的不对称性也可能是由与精度相关的其他因素引起的异质性造成的,这似乎与两项研究(占研究的 22%)落在伪 95% 置信区间定义的区域之外的事实相符(斜虚线;Langan 等人,引文2012)。这两项研究可能与一个不同的基本概念有关。视觉感知在某种程度上得到了 Egger 检验的支持,该检验表明在 p 值 = 0.01 时,效应大小与其精度之间没有显着相关性,但在 p 值 = 0.05 时,它导致了零假设的拒绝(缺乏发表)偏见)。

这些发现表明,应该谨慎地解释剧院干预对共情能力的影响。

戏剧干预对社会互动的影响
五项研究共调查了 264 名参与者的积极剧院干预对社交互动的影响(干预组 = 119,对照组 = 145)。这些研究的汇总估计值(按剧院干预对社会互动的随机效应平均效应大小估计)为 g = 0.345,p = .004,95% CI(0.112,0.579;图4)。这表明,以主动参与为重点的剧场干预确实对社会互动产生了影响,且效果适中。观察到的效应大小的方差很小(I 2  = 0%)。Cochran 的 Q 为 2.6 (p = .627),表明效应大小没有观察到显着的异质性。

漏斗图(图5)被发现是对称的,意味着效应大小和精度之间没有相关性。所有研究都落在伪 95% 置信区间之间,这意味着这些研究估计了相同的潜在影响。这种视觉印象得到了 Egger 检验的证实,该检验表明没有支持拒绝无小规模研究效应的原假设 (p = .892)。

戏剧干预对社会交往的影响
五项研究总共调查了 114 名参与者的积极剧院干预对沟通的影响(N干预 = 63,N控制 = 51)。这些研究的汇总估计值为 g = 0.698,p = .003,95% CI(0.233,1.164;图6)。这意味着注重积极参与的戏剧干预对社会交流产生了强烈影响。由于观察到的效应大小的方差量适中(I 2  = 42%)并且 Cochran's Q 不显着(Q = 6.9;p = .142),因此证实了效应大小缺乏异质性。

漏斗图(图7)被发现是对称的,所有研究均匀分布在水平轴上。这意味着报告积极和消极影响的研究都已发表。这也意味着没有发现效应大小和精度之间的关联。Egger 检验证实了这一点,该检验表明不支持拒绝无小型研究效应的原假设 (p = .892)。这些结果排除了发表偏倚的风险。

剧院干预对耐受性的影响
五项研究共调查了 1594 名参与者的积极剧场干预对耐受性的影响(干预组人数 = 812 人,对照组 = 782 人)。这些研究的汇总估计值为 g = 0.156,p = .002,95% CI(0.056,0.254;图8)。这意味着剧院干预对耐受性的影响虽然显着,但幅度较小。观察到的效应大小的方差量较低(I 2  = 9.4%)且不显着,这一点已被 Cochran's Q 统计量证实(Q = 4.41;p = .353)。

漏斗图(图9)看起来有点不对称,左侧有两项最小的研究,表明没有影响或有负面影响。所有五项研究均处于伪 95% 置信区间内,这意味着所检查的潜在影响具有同质性。Egger 检验并未证实视觉不对称性,该检验显示不支持拒绝原假设 (p = .223),因此未进一步考虑发表偏倚。

戏剧干预对自我概念的影响
六项研究总共调查了 335 名参与者(N干预 = 163,N控制= 172)的积极剧院干预对自我概念的影响 。这些研究的汇总估计值被发现并不显着 [g = 0.134;p = .223;95% CI (−0.081, 0.349)](图10)。这意味着戏剧干预对自我概念没有影响。观察到的效应大小的方差量非常低(I 2  = 0.0%),并且检查效应大小是否存在异质性的 Cochran's Q 并不显着(Q = 1.88;p = .866)。

漏斗图分析(图11)表明所有检查的研究都在伪 95% 的置信度内,为其效果的同质性提供了额外的支持。然而,点的模式得出的结论是它稍微不对称。虽然最小的研究报告了积极的影响,但最大的研究提供了无效影响的证据。这种视觉不对称似乎通过 Egger 检验 (p = .024) 得到了证实,但有一点保留。尽管它仅在 p = 值 = .05 时拒绝了缺乏发表偏倚的原假设,但在 p 值 = .01 时,拒绝原假设的统计证据不足。我们认为,这些发现表明,应该谨慎地解释戏剧干预对自我概念缺乏影响。

讨论
这项荟萃分析评估了基于积极戏剧参与的干预措施对社会能力的影响。纳入了 21 项初步研究,共计 4064 名参与者,提供了自 1983 年以来收集的证据。我们的研究结果表明,积极的戏剧参与有利于参与者的社交能力。特别是,剧院干预被发现可以提高共情能力、社交互动、社交沟通和宽容。汇总效应大小从小到大不等(0.156-0.698),观察到的最大效应是社交沟通,最低但仍然显着——容忍。与此同时,我们的研究结果并没有证实积极参与戏剧对自我概念的影响。下面,我们讨论每个结果中的结果。

积极参与戏剧对共情能力影响的分析显示出适度的积极效应,表明这些类型的干预措施有利于增强共情能力。我们的结果与之前的观察性研究结果一致,观察性研究表明具有表演经验的参与者具有更高的同理心水平(例如 Goldstein 和 Winner,引文2012年;莫兰和阿隆,引文2011)并证明女性和男性演员都比一般人群更有同理心(Nettle,引文2006)。我们的研究结果侧重于业余参与者而不是专业演员,通过表明长期致力于表演教育以及一系列戏剧干预措施都可以提高感受和理解他人心理状态的能力,从而对这项研究做出了贡献。由于我们发现所检查的效果存在一些异质性,并且报告无效或负面效果的小型研究数量有限,因此应谨慎对待这一发现,并在发表该领域的更多研究时重新评估。

一项旨在检验积极戏剧参与对社会互动影响的荟萃分析也表明,存在适度的积极汇总效应。这一结果与之前的研究一致,表明剧院干预可以增强群体进程,培养对他人的反应能力和注意力,并促进人际交往(例如 Emunah、引文1994年;托马苏洛和苏克斯,引文2015)。

在社交沟通方面,发现了很大的积极影响(g = 0.698)。连同许多非实验研究(例如 Karnieli-Miller 等人,引文2018年;诺恩等人,引文2015),这一发现支持了互动剧场对人际沟通技巧的有效性。巨大的影响可能是由于包括戏剧在内的创意艺术是最强大的表达和交流手段之一,并且已被认为是一种有效的加强交流的工具(Fraser&Sayah,引文2011)。因为隐喻的使用和意义建构是艺术干预中的重要因素,因此将这种形式的治疗与其他类型的治疗区分开来(科赫,引文2017),基于艺术的活动对于增强不同目标群体参与者之间的言语和非言语沟通特别有用(Samaritter,引文2018)。

我们的结果表明,活跃的戏剧对宽容具有积极的影响,其效果虽小但一致,并表明戏剧制作可能在培养对他人更加开放和接受的态度方面发挥有用的作用。Greene 等人也报告了类似的发现。(引文2014)他表明,通过艺术参与接触更广阔的世界可以提高理解他人和接受不同观点的能力。

我们的分析表明剧院干预对自我概念没有显着影响。这一结果与 Conrad 和 Asher 进行的荟萃分析的结果一致(引文2000)他还报告说,当不同研究的结果汇总在一起时,戏剧制作对自我概念的显着影响就消失了。然而,由于数据中似乎存在发表偏见,我们的研究结果应谨慎解释。我们的荟萃分析表明,需要更大样本量的更多高质量证据来有效评估戏剧对相关结果的影响。此外,未来的研究应考虑所研究人群的影响(例如临床与非临床、年轻人与老年人),这可以使用元回归进行检查。虽然我们收集了人群的几个特征(参见,表格1),由于纳入的试验数量有限,我们无法进行此类分析。然而,我们的异质性分析结果使我们确信,此类效应(如果存在)不会对汇总效应大小产生实质性影响。在五分之四的情况下,观察到的效应大小的方差量(由 I 2测量)较低,而在其余情况下则中等(尽管在统计上不显着)。这些结果意味着,尽管纳入研究的特征存在差异,但观察到的效果的方向和程度相当可比,这表明我们在不同参与者群体中的研究结果具有同质性和稳健性。

为了提高结果的有效性并确保证据的质量,采用了两种互补的方法来评估偏倚风险。首先,遵循Cochrane协作组织的指南,对偏倚风险进行定性分析。所有具有高偏倚风险的研究(主要是由于缺失数据和选择性结果报告)均被排除在分析之外。其次,检查了发表偏倚。在三个结果的情况下,我们没有发现发表偏倚的证据,而在两个结果的情况下,拒绝不存在发表偏倚的假设的统计证据不足。这些结果使我们能够确认戏剧干预对社会沟通、宽容和社会互动的影响。同时,

局限性和未来研究
尽管这项研究是按照 Cochrane 协作组织的指导方针进行的,并且为尽量减少偏倚风险做出了巨大努力,但在解释结果时仍应考虑一些限制。由于艺术干预领域缺乏严格的实验研究,我们的最终样本包括数量有限的研究。尽管基于不到 10 项研究的综述和荟萃分析很常见,并且被认为是有效的证据来源(Bastian 等人,引文2010年;马利特和克拉克,引文2002),我们认识到更大的样本可以更精确地计算效应大小并加强我们的发现。

关于随机试验的结果是否与非随机试验的结果一致,以及是否需要随机化以避免偏倚并提供因果效应的证据,存在很多争论。虽然一些研究人员表明,非随机、观察性和基于相关性的研究往往会高估治疗效果(Ioannidis 等人,引文2001),其他人提供的证据表明随机和非随机研究产生非常相似的结果(Benson&Hartz,引文2000;康卡托等人,引文2000)。这个问题与基于艺术的治疗领域特别相关,其中随机化通常是不可行的,并且通过准实验(Goldstein&Winner,引文2012)或纵向观察研究(Fancourt & Steptoe,引文2019年;莱万多夫斯卡和韦齐亚克-比亚洛沃尔斯卡,引文2020 年;韦齐亚克-比亚洛沃尔斯卡,引文2016)。该领域的研究人员认为,非随机研究的可靠性并不一定较低。例如,戈尔茨坦(引文2015)发现学生的基线特征并不能预测表演课的效果。在我们的研究中,由于纳入的试验数量太少,无法进行亚组分析或荟萃回归,因此通过异质性分析解决了准随机化问题。异质性分析表明,随机试验和部分随机试验对汇总效应大小的影响具有可比性。

一些可能的缺陷源于纳入研究的设计。其中之一是,在一些分析研究中,积极的戏剧干预是针对相对不太有吸引力的活动(例如标准学校课程或讲座)进行测试,或者与根本不干预进行比较。根据戈尔达克的说法(引文2012年,第。182),针对先验已知不太成功的治疗方法进行测试是循证研究中常见的偏见来源。我们无法验证此限制对我们结果的影响程度。另一个关键问题在于,使用聚类随机化的研究没有考虑聚类。我们调整了数据来解决这个问题,但我们必须依赖估计(例如,由于从外部来源提取类内相关系数)。此外,对选择性结果报告(结果是否以预先指定的方式报告)进行适当评估实际上是不可能的,因为艺术领域的研究方案通常不可用。

收集荟萃分析信息也具有挑战性,因为许多研究未能报告必要的参与者信息和描述性统计数据或不一致地呈现结果。样本在种族/族裔和社会经济地位方面的代表性很难评估,因为相关信息缺失或在各个研究中报告不一致,例如,只有六项研究报告了教育状况,虽然有些研究报告了受教育年限,但其他研究则记录了教育状况受过高等教育的参与者的百分比。此外,由于相当多的研究缺乏有关致盲技术和退出的信息,我们无法做出充分的评估。此外,对干预措施的描述往往含糊不清,

在未来的研究中克服这些弱点至关重要。剧院干预的效果应该通过更好设计的实验研究来评估。更多具有更大样本量的随机对照试验当然是可取的。对照组应分配到在某种程度上与戏剧类似的活动(例如,基于音乐或体育的干预)。另一个重要的一点是使用更具代表性的样本。只有八项研究报告了参与者的种族/民族背景,这使得难以得出普遍的结果。然而,在这些研究中 81% 的参与者是白人这一事实表明,在基于证据的艺术研究中少数族裔的代表性不足。

未来还应更加关注研究设计和结果的细致报告。为了正确评估偏倚,研究需要提供所用方法的完整信息(例如分配干预措施的方法、盲法技术),并且需要公布研究方案。包含所有描述性统计数据(均值、标准差和针对聚类调整的精确样本量)需要成为该领域实验研究的标准。

最后,我们鼓励作者对干预措施以及教师的资格和证书提供更详细和透明的描述。关于如何报告基于艺术的干预研究的指南(例如 Robb 等人,引文2011)可以帮助作者以允许复制和促进结果解释的方式描述他们的干预措施。详细的干预报告是提高基于艺术的实验研究的可重复性的一个重要因素(Koch 等人,引文2014)以及将干预措施转化为循证实践。

发布日期:2024-01-25