新闻资讯

包含 SAPROF 评估工具的单个项目对涉及正义的青少年的促进、混合和风险影响

在过去的十几年里,越来越多的评估工具得到了发展,这些工具包括或专门关注法医心理健康/惩教/青少年司法实践中被广泛但不准确地称为保护性因素的因素(de Ruiter & Nicholls,2011;Langton,2020;Langton 等人,2022;Langton & Worling,2015),其中著名的例子代表了所谓的结构化专业判断(SPJ)方法(Douglas,2019)。在这些基于强度的 SPJ 工具中,来自保护因素结构化评估的各种指数(SAPROF;de Vogel 等,2012); (即其总分的总分、合理分组的内部因素、动机因素和外部因素的项目集的总分以及总结判断)已被证明可以预测来自各种成年人口的样本中未来不存在暴力行为,包括具有以下特征的样本:性犯罪历史(参见Coupland & Olver, 2020;de Vries Robbé, de Vogel, Douglas, & Nijman, 2015;de Vries Robbé, de Vogel, Koster, & Bogaerts, 2015;de Vries Robbé et al., 2016;de Vries Robbé 等人,2021 年;Haines 等人,2018 年;Neil 等人,2020 年;Yoon 等人,2018 年)。

但是,人们对 SAPROF 在参与正义的青少年中的效用的兴趣有限,这可能在很大程度上是因为自 2015 年以来出现了供青少年使用的版本,即保护因素的结构化评估 - 青少年版本(SAPROF-YV;de Vries Robbé、Geers 等,2015)。尽管进一步的调查可能具有启发性,例如,在识别预测结果的构建(或至少是 SPJ 项目特定的构建操作化)方面,这一点仍然存在。发育时期(与特定于发育时期的时期不同)。更重要的是,从基本意义上讲,对任何 SPJ 项目特定的构建操作化的调查提供了一种增进对保护性因素或“优势”含义(或可以针对据称是单个项目进行证明)含义的理解的方法。在本研究中,尝试使用Farrington 等人 (2016) 的方法及其描述变量的经验法则(比值比 [或] ≥ 1.7 且与基准率的百分点差异≥ 10)。下文将使用包容性术语“强度”来指代施加一种或多种类型的效应(例如,主效应,或与另一变量结合,加性、乘性效应或调节效应)的变量,其降低概率(再次)犯罪(Langton 等人,2022)。

在少数几项调查 SAPROF 对涉及正义的青少年的预测准确性的研究中,结果好坏参半(参见Klein 等人,2015 年;Langton 等人,出版中;Zeng 等人,2015 年;两者其中涉及性犯罪青少年的样本)。不是关注预测准确性,而是通过计算接受者操作特征的曲线下面积 (AUC)(ROC;Mossman,1994;Swets 等,2000)或 Harrell's C(当随访时间在样本;Hanson,2022;Harrell,2015),当前研究的主要目标是使用Farrington 等人描述的方法调查 SAPROF 的各个项目。(2016 年;另见Farrington 等人,2008 年;Farrington & Ttofi,2011 年)。法林顿等人。(2016)相反,重点探讨了剑桥犯罪发展研究 (CSDD) 8 至 10 岁高危男孩的变量的不同分数范围与他们年满 18 岁时的刑事定罪之间的关联性质。年龄。具体来说,法林顿等人。将焦点变量的分数分为四分位数(上四分位数、中半部分和下四分位数)并使用OR,其中OR≥1.7 被视为“实质性”(第 66 页),并且与 18 岁时的基本定罪率(第 66 页)相比增加或减少 ≥10 个百分点,以确定每个变量是否是风险因素、促进因素或混合因素,在其数据集中发现了所有三种类型。

继法林顿等人之后。(2016),将变量标记为风险因素,风险OR(使用代表变量“最差”或最有问题范围的分数四分位数中被定罪/未定罪的人以及其余部分中被定罪/未定罪的人计算)该变量的范围(“其余”)将≥1.7。促销或(使用代表变量的相反四分位数或“最佳”范围的分数四分位数中被定罪/未定罪的人以及该变量其余范围(“其余”)中被定罪/未定罪的人计算)将< 1.7。此外,在 18 岁之前有过刑事定罪的分数“最差”四分位数的子集的百分比将比样本的基本比率高 ≥10 个百分点,但分数“最好”的子集的百分比18 岁之前有过刑事定罪的分数的四分之一将比基准率低 <10 个百分点。对于激励因素,激励OR(使用变量得分“最佳”四分位中的定罪/未定罪者和“其余”分数中的定罪/未定罪者计算)将≥1.7,但风险OR(使用变量分数“最差”四分位中的定罪/未定罪者和“其余”分数中的定罪/未定罪者计算)将<1.7。同样,在 18 岁之前有过刑事定罪的分数“最好”的子集的百分比将比样本的基本比率低 ≥10 个百分点,但分数“最差”的子集的百分比18 岁之前有过刑事定罪的分数的四分位数将比基准率高出 <10 个百分点。对于混合因素,风险OR和促进OR≥1.7,并且在 18 岁之前有过刑事定罪的分数“最好”和“最差”四分位数的子集的百分比将分别低于和高于样本基准率 ≥10 个百分点。

通过这种方法,可以确定变量的特定操作化的主要影响是否会带来风险效应(使不良结果更有可能发生,并表明结构的单极操作化)、促进效应(使不良事件发生)不太可能,并且也表明单极操作化),或混合效应(根据分数落在变量的两个极点中的哪一个,产生不利结果的可能性更大或更小,本质上是一个结构的双极操作化,即使不是这样打算的)。然而,人们相对忽视了Farrington 及其同事(2008 年、2016 年)、Farrington 和 Ttofi(2011 年)的方法,利用应用评估工具调查与累犯终止预测研究中没有新犯罪相关的所谓优势。这很奇怪,因为上述文献中对关键术语的含义缺乏共识,其中包括保护因子和强度(Langton 等人,2022)。当前研究的主要目标是对 SAPROF 项目进行此类调查。SAPROF 和其他 SPJ 评估工具中明确操作的变量的三分编码无疑适合Farrington 等人提出的那种研究。

此类工作的一个著名例子是Li 等人 (2019)对 SAPROF-YV 组成项目的性质的调查。对于缓刑未完成的结果(而不是新的犯罪),Li 等人。为 13 个项目中的每一个计算了两个OR 。为了产生促销OR,他们使用了“促销类别”(该项目得分为 2,表示存在优势)和“中间类别”(该项目得分为 1,表示该项目可能或部分存在)力量)。为了产生风险OR,他们使用了“危险类别”(分数为 0,表示缺乏强度)和“中间类别”(分数为 1)。这遵循Farrington 和 Ttofi (2011)计算一对每个 CSDD 变量的OR(促进和风险OR ),使用每个变量的“最佳”四分位数分数和中间一半的分数(促进OR),以及变量和中间分数的“最差”四分位数分数的一半(风险或)。但它与Farrington 等人 (2016) 的方法形成鲜明对比,该方法使用“最佳”四分位数与“其余”四分位数作为其促销OR,使用“最差”四分位数与“其余”四分位数作为其风险OR。李等人。主要根据OR的统计显着性来解释他们的发现s,建议谨慎对待 13 个 SAPROF-YV 项目中的 6 个项目的分类,因为细胞计数≤1。尽管开发人员将所有项目都视为保护因素(优势),但 Li 等人。将 3 个标记为“危险因素”,7 个标记为“混合保护因素”,2 个标记为“保护作用较弱”,只有 1 个标记为“促进因素”。

当前研究的第二个目标是确定当 SAPROF 的项目以机械方式组合(即求和;参见Sawyer,1966)时,SAPROF 的使用是否忽略了相关信息(即潜在风险)。,对数据收集类型和预测方法中信息组合方式的一般讨论)。如果任何编码为 0 的 SAPROF 项目(表面上表明不存在所谓的强度)实际上会带来风险影响,则会显示这一点。在对各项进行简单求和时,该风险影响将被忽略。更广泛地说,这将提出这样一个问题:使用 SPJ 方法的评估员正在对编码为 0 的项目进行何种处理,因为他们承担了评估过程中更不透明的部分:达到(此处为 SAPROF),首先是最终保护判断(低、中或高),然后综合最终风险判断(低、中或高)。

需要明确的是,SAPROF 的开发人员主张将该工具与 SPJ 风险评估工具、Historical、Clinical Risk–20(HCR-20;Douglas et al., 2013)或相关工具结合使用,而不是依赖单独使用 SAPROF。他们建议使用这两种 SPJ 工具来达成最终判断,而不是对项目评分进行简单求和(de Vogel 等,2012),p。27;尽管开发商和其他研究小组也报告了总计指数)。对 SPJ 项目的调查(例如当前的研究)可以显示出产生风险(或促进)或混合效应而不是预期的促进(或风险)效应,而不是代表批评,而是可以为包含这些变量的变量提供更丰富的概念化工具及其底层结构的具体操作。在研究人员能够解决有关 SPJ 评估员对编码为 0 的项目进行何种处理的问题之前,这是必要的下一步,而不是代表缺乏强度(对于 SAPPROF 等工具)或不存在风险(对于诸如 SAPROF 之类的工具)如 HCR-20),某些项目的 0 会产生相反的效果

在本研究中,使用Farrington 等人 (2016)的OR s ≥1.7 和新犯罪率 ≥10 的经验法则,进行了探索性分析,以确定单个 SAPROF 项目是否会产生促进、风险或混合效应与基本利率不同的百分点。此外,还假设在预测新犯罪时,SAPROF 项目求和的 AUC 根据其促进OR和任何风险OR进行加权在用于生成OR的样本子集中,发现的 s 将在统计上显着高于使用其 0、1 或 2 评级的 SAPROF 项目集的总和(因为后者必然排除对可能存在的风险影响的考虑)以及样本的交叉验证子集中。

方法
程序
研究伦理审查是由第一作者的机构隶属关系和相关部委的许可确保的。下面报告的详细信息包括如何确定样本量、所有数据排除、所有操作以及研究中的所有措施。样本的存档案例文件已被访问;其中包含由参与每个案件的专业人员撰写的所有现有评估报告以及学校和警察/法院文件。几乎所有案例都只与青少年一起完成了一份全面的心理健康和风险评估报告,并且评估时所有案例都在社区中。该报告的日期被用作风险期的开始日期。只有那些在后续阶段开始之前存档的、有再次犯罪风险的材料才会包含在准备编码的每个案件卷宗的版本中。这些文件中不包含有关累犯结果的信息。如果专业人士对材料中的风险和优势的看法存在差异或变化,则此类差异由第一作者和第三作者协商一致解决,如果超过的话,优先考虑最终评估报告后续期开始前提交一份报告。

参加者
从 20 世纪 80 年代末到 2014 年,安大略省南部一个主要城市地区有 617 名青少年被转介接受专门服务(针对对他人进行性虐待的青少年),由于女性青少年数量较少(n = 15),因此无法对该子集进行有意义的分析,所以这些年轻人被从样本中删除了。还删除了 105 名青少年,他们的负责部门无法找到其存档案例档案,或者在审计后发现所提供的存档案例档案包含的信息不足以对大多数研究变量进行编码。这使得 497 名年龄在 12 岁至 18.99 岁之间的男性青少年在 18 岁之前有过性犯罪记录,并且有存档的案件档案可用于编码。

对于本研究,使用 2003 年 4 月的发布/危险日期将样本分为两个子集;从 1980 年代末到 2003 年 4 月处于危险中的人 ( n = 174) 以及从该日期起处于危险中的人 ( n = 323)。2003 年 4 月,《青少年刑事司法法案》(2002 年)在加拿大生效。尽管不可能对因该立法而产生的样本中案件处理的变化进行编码,但将样本简单地分为两个子集提供了一种以广泛和基本的方式控制样本内因影响而产生的差异的方法立法的变化。
从 2003 年 4 月起,在 323 名年龄在 12 岁至 18.99 岁之间处于危险中的男性青少年中,仅使用了那些可以对 SAPROF 进行编码并且可以进行 3 年固定随访的人,从而导致n 229 的分析用于以下分析。继哈里斯等人之后。(2003),使用这个 3 年固定随访期意味着那些没有再犯罪但没有 3 年整年机会这样做的青少年被从这些分析中删除,而那些确实再犯罪但没有再犯罪机会的青少年则被排除在外。在这些分析中,他们在随访的三年点被重新分类为非累犯之后这样做;这提供了每个青少年在后续三年内重新犯罪状况的快照。

在这 229 人中,8% 的人有过一次或多次暴力(非性)犯罪前科,1% 的人有两次或以上性犯罪前科,13% 的人有过一次性犯罪前科,86% 的人没有性犯罪前科定罪。略低于 24% 的人之前有过五次或以上非暴力犯罪行为,43% 的人有过一到五次非暴力犯罪行为,略低于 34% 的人没有过。该子集在随访期开始时(即最终评估完成日期或发布日期,以较晚者为准)的平均年龄为 16.03 岁(SD= 1.51 年;范围 = 12.30–18.90 岁)。这 229 名参与者中有 95 人可以获得种族血统数据;根据加拿大统计局的分类,其中 36% 为欧洲裔,22% 为加勒比裔,13% 为非洲裔(中部、北部、南部、东部、西部),14% 为亚洲裔(南部、东部和西部)。东南部、中西部和中东),7% 为原住民、原住民、因纽特人或梅蒂斯人,8% 为拉丁人、中美洲和南美洲人。本研究没有进一步调查种族和其他多样性问题,但在另一项研究中用该样本进行了检查。

在 2003 年 4 月之前处于危险中的 174 名 12 至 19 岁男性青少年子集中,仅使用了那些可以对 SAPROF 进行编码并且可以进行 3 年固定随访的人,从而得出n 171. 下面描述的 ROC 分析涉及这些人。 171. 其中,12% 的人有过一次或多次暴力(非性)犯罪前科,4% 的人有两次或以上性犯罪前科,19% 的人有过一次性犯罪前科77% 的人没有信念。略低于 21% 的人之前有过五次或以上非暴力犯罪行为,略低于 50% 的人有过一到五次非暴力犯罪行为,29% 的人没有过。该子集在随访期开始时的平均年龄为 15.73 岁(SD= 1.32 年;范围 = 12.04–18.88 岁)。可获得 85 名参与者的种族血统数据;使用加拿大统计局的类别,其中 47% 为欧洲裔,25% 为加勒比裔,9% 为拉丁裔、中美洲和南美洲裔,8% 为非洲裔(中部、北部、南部、东部和西部) ),7% 为原住民、原住民、因纽特人或梅蒂斯人,4% 为亚洲人(南部、东部和东南部、中西部和中东)。

措施
萨普罗夫
SAPROF 项目按照手册(de Vogel 等人,2012)进行编码,不了解累犯结果,并用于逻辑回归分析(参见下面的数据分析策略)。这是一项更大规模的研究的一部分,该研究涉及涉及正义的青少年的工具的比较预测有效性(Langton 等人,出版中)。在该研究中,考虑到了发育问题,SAPROF 被列为为成人使用而开发的工具之一。所有项目均针对 229 名青少年或其中的 228 名青少年进行编码(对于某些项目,某些案件卷宗中包含的信息不足以对单个项目进行评分);唯一的例外是情报项目,该项目的信息可用于为 142 名青少年进行评分。
为了检查评估者间的可靠性,使用 23 个参与者案例的子集计算组内相关系数 (ICC),由三名评估者独立编码(参见上文的程序)。正如兰顿等人所报道的。(正在印刷中),SAPROF 总和的 ICC 为 0.77,属于Cicchetti (1994)描述的“优秀”范围。个别项目的 ICC 落在 Cicchetti 描述的“一般”和“良好”范围内,其中一项落在“优秀”范围内。

结果
使用四个官方信息来源来尽可能全面地衡量官方累犯:加拿大警察信息中心记录,加拿大皇家骑警提供的国家刑事定罪数据库;来自安大略省社区安全和惩教服务部提供的青少年和成年罪犯跟踪信息系统的数据;以及安大略省儿童和青少年服务部提供的案件档案。结果采用二分法编码。如果在后续期间记录为前三个来源中任何一个的定罪或第四个来源中官方确认的新事件,则新的犯罪行为将被编码。新的暴力(包括性)犯罪(以及不存在)被用作因变量,因为这是 SAPROF 旨在构建应用评估工作的结果。还报告了第二个结果的调查结果,任何新的犯罪(以及不存在)(数据在补充表 1 和 2),因为这种包容性结果具有比较意义,因为它包含在采用应用评估实践的累犯终止预测研究中的许多调查中。
新暴力犯罪的四个来源之间的一致性百分比在 81% 到 88% 之间,这表明多达五分之一的案件的结果在此类犯罪的来源之间不一致。任何新犯罪的四个来源之间的百分比一致性在 75% 到 85% 之间,这表明多达四分之一的案件的结果在此类犯罪的来源之间不一致。这些百分比协议证实了使用多个来源来检测所有正式记录的新犯罪行为的重要性。

数据分析策略
对于探索性分析,使用 229 人的子集(自 2003 年 4 月起处于危险中的人)进行逻辑回归分析,以计算风险OR(最差分数,0,与分数 1 或 2)和促进OR两种结果的每个 SAPROF 项目的 s(最佳分数 2,与分数 0 或 1)。进行 ROC 分析是为了检验有关预测准确性的假设,通过对 SAPROF 项目集求和生成六个强度指数。第一个是所有编码项目的总和,不包括项目 6(工作)和 8(财务管理),因为它们在手册中的操作被认为在发育上不适用于青少年样本,以及项目 12(药物),因为该项目已编码根据手册,几乎所有参与者都不适用;这代表了修改后的 SAPROF 总数。在一项单独的研究中,使用这些数据评估了各种 SAPROF 总数的预测准确性(Langton 等人,正在出版)),外部因素项目的总和并不能预测本研究中使用的任何新的犯罪结果,因此在比较 AUC 时,本研究也使用了第二个修改后的 SAPROF 总和,其中省略了该研究中评估的外部因素项目。第三个和第四个指数是项目子集的总和,现在根据它们的OR进行选择和加权(如下所述)。第五和第六指数使用与OR加权总计中使用的相同的项目子集,但是是最初编码的这些项目的总和(0、1 或 2)。
对于加权总和(第三个和第四个指数),仅包括使用 2003 年 4 月以来的风险样本子集计算的每个结果的风险OR和/或促进OR ≥1.7 的项目; 这产生了两个略有不同的九项量表,一个旨在预测每个结果。这两个量表的预测有效性是通过分别计算样本的两个子集的 AUC 来测试的,其中 2003 年 4 月之前处于风险的子集提供了使用 OR 对处于风险的子集进行的权重的普遍性的指示2003年4月起。

结果
自 2003 年 4 月起,在 229 名面临风险的青少年中,30% 的人犯下了任何类型的新罪行,其中 224 名青少年中有 19% 在固定的 3 年随访期内犯下了新的暴力(包括性)犯罪。青少年的数量从更具包容性的结果略微减少到包容性较小的结果,因为对于一些青少年来说,他们的定罪,计入更具包容性的任何新犯罪类别(例如,入室盗窃定罪),导致少于 3 年的危险时间,因此他们被排除在包容性较小的新暴力(包括性)犯罪类别的分析之外(因为根据入室盗窃的监禁刑期,他们被重新拘留了)。

自 2003 年 4 月起,在 171 名面临风险的青少年中,27% 的人在固定的 3 年随访期内犯下了新的暴力(包括性)犯罪,其中 169 名青少年中有 34% 犯下了任何类型的新犯罪。对于更具包容性的结果,青少年人数略有减少,因为两名犯有新的非暴力犯罪行为的青少年的档案存在差异,因此无法确定这些犯罪行为是否发生在固定的 3 年随访期内;因此,这两个年轻人被排除在这个结果的分析之外。但这些年轻人在后续的任何时候都没有犯下新的暴力(包括性)犯罪,因此被纳入对该结果的分析中。

促进、风险和混合效应
新的暴力犯罪
表 1中给出了每个项目得分的新暴力(包括性)犯罪参与者的百分比以及每个项目的促进和风险OR。只有同理心和自我控制这两个项目可以根据其OR配对被解释为具有促进作用。同理心的促进OR为 1.72,p = .401,其风险OR为 1.63,p= .200。该项目得分最低(表示不具备该优势)和得分最高(表示具有该优势)的累犯率仅与基准率 19% 相差±6。总的来说,这些数据可以描述为混合效应,但 Cochran-Armitage 线性趋势检验不具有统计显着性:χ 2 = 1.999, 1 df , p = .157。此外,自我控制项目可以描述为具有促进作用,促进OR为 3.27,p = 0.260,风险OR为 1.66,p= .140,得分为 0、1 或 2 的人的累犯率分别为 23%、17% 和 7%。这里可以根据 1.66 的风险OR来说明混合效应,尽管 Cochran-Armitage 线性趋势检验在统计上并不显着:χ 2 = 2.877, 1 df , p = .089。


单个项目“智力”可以被描述为发挥风险效应,促进OR为 0.74,p = .672,风险OR为 2.21,p = .071。但得分为 0、1 或 2 分的人的累犯率分别为 26%、12% 和 23%,这与没有这种优势和具有这种优势的人的风险有所上升一致,这使得他们更难重犯。对效果进行分类。
外部控制项目表现出矛盾的风险效应,促进OR为 0.48,p = .047,风险OR为 0.98,p = .959。具有这种强度的人(得分为 2)再次暴力犯罪的可能性是得分为 0 或 1 的人的 2.08 倍。得分为 0、1 或 2 的人的累犯率分别为 19%、15% 和分别为 29%,反映出具有这种优势的人面临的风险升高。“生活环境”这个项目同样可以被描述为发挥着矛盾的风险效应。该项目得分为 0 的青少年没有再犯罪,因此应用了 Haldane-Anscombe 校正,在列联表中的每个单元格中添加 0.5,以生成风险OR;虽然两者都不是OR具有统计显着性,具有这种强度(得分为 2)的人再犯罪的可能性是得分为 0 或 1 的人的 1.64 倍,而不存在这种力量(得分为 0)的人再犯罪的可能性是得分为 0 或 1 的人的 3.22 倍得分为 1 或 2 的人。得分为 0、1 或 2 的人的累犯率分别为 0%、18% 和 25%,反映了与力量相关的得分的风险意外升高和降低和风险,分别在这个项目上。基于促进OR和非统计显着性 Cochran-Armitage 线性趋势检验,矛盾的混合效应描述并不十分合理:χ 2 = 2.776, 1 df , p = .096。
五个项目(童年时期的安全依恋、休闲活动、生活目标、亲密关系和专业护理)没有产生明显的效果。其余四个项目可以描述为具有混合效应(应对、治疗动机、对权威的态度和社交网络)。例如,治疗动机的促进OR为 2.97,p = .031,风险OR为 2.01,p = .052,得分为 0、1 或 2 的人的累犯率为 27%、20%和 9%,分别具有统计显着性 Cochran-Armitage 线性趋势检验:χ 2 = 6.473, 1 df , p = .011)。

任何新的进攻
对于这一结果,调查结果大致相似,但并不完全相同。14 项中的 10 项效果明显。根据成对的OR以及相对于 30% 基准率的变化,两个项目发挥了促进作用,两个项目发挥了风险效应,四个项目可以描述为具有混合效应,并且相同的两个项目具有矛盾的风险效应(参见图 1和补充表 1 )。

SAPROF 项目的原始和加权总和的预测准确性
某些 SAPROF 项目产生风险或混合效应的发现促使对有关根据促进性和风险OR s ≥ 1.7选择和加权的 SAPROF 项目求和的 AUC 的假设进行检验。
新的暴力犯罪
对于该结果,所包含的项目的权重如下:对于智力项目,0 重新编码为-1(表示风险),1 重新编码为 0,2 重新编码为 0(表示无强度)。同理心评级被重新编码为 0 = 0(无风险)、1 = 0 和 2 = 1(强度)。第 4、5、9、10 和 13 项被重新编码为 0 = -1(风险)、1 = 0 和 2 = 1(强度)。第 16 项和第 17 项被重新编码为 0 = 0(无风险)、1 = 0 和 2 = -1(表明这种强度的存在存在矛盾效应)。这个 9 项目量表以下称为“OR 加权 SAPROF 暴力总数”。
从 2003 年 4 月起,该子集处于危险之中, OR加权 SAPROF 暴力总数的 AUC (0.71, p < 0.001,95% 置信区间 [CI]:[0.62,0.79])在统计上并未显着升高比相同九个项目的简单求和的 AUC(.64,p = .005,95% CI [.54,.73]):z = 1.55,p = .061(1 尾)或修改后的 SAPROF总计(不含外部因素项;0.65,p < .001,95% CI [0.57,.74]):z = 1.45,p = 0.074(1 尾),但在统计上显着高于 AUC对于修改后的 SAPROF 总计 (.60, p = .035, 95% CI [.51, .70]):z= 2.08,p = .019(1 尾)。(后两个 AUC 先前已在Langton 等人的新闻报道中报道过。)
由于该子集在 2003 年 4 月之前处于危险之中, OR加权 SAPROF 暴力总数的 AUC (0.66,p = 0.001,95% CI [0.57,0.75])在统计上显着高于简单求和的结果相同的九个项目(.59,p = .058,95% CI [.50,.69]):z = 1.66,p = .048(1尾),修改后的 SAPROF 总计(.57,p = . 135, 95% CI [.48, .66]):z = 1.95,p = .025(1 尾),以及修改后的 SAPROF 总计(不含外部因素项;0.60,p = .034,95% CI [.51, .69]):z = 1.99,p = .023(1 尾)。
任何新的进攻
OR加权 SAPROF 总和的 AUC在统计上显着高于与各种 SAPROF 指数进行的六次比较中的 5 次(参见补充表 2)。
事后分析
两个项目(生活环境和外部控制)的矛盾风险效应促使人们测试在这些项目上得分为 2(表示强度)的青少年是否比得分较低的青少年更有可能再次犯罪。先前是否存在一项或多项性犯罪指控或定罪被用作风险指数。那些没有因性犯罪而受到指控或定罪的人的生活环境得分 ( X = 1.20, Mdn = 1.00) 低于那些因一项或多项性犯罪而受到指控或定罪的人 ( X = 1.59, Mdn = 2.00)。Mann–Whitney U检验表明这种差异具有统计显着性:U (N无先验= 196,N先验= 32) = 4301.00,z = 4.18,p < .001。那些没有因性犯罪而受到指控或定罪的人 ( X = 0.89, Mdn = 1.00) 的外部控制得分低于那些因一项或多项性犯罪而受到指控或定罪的人 ( X = 1.53, Mdn = 2.00)。Mann–Whitney U检验表明,这种差异具有统计显着性:U(N无先验= 196,N先验= 32)= 4,647.50,z = 4.76,p < .001。
讨论
尽管是为成人使用而开发的,但 SAPROF 项目所利用的结构的操作化被证明有助于使用Farrington 等人 (2016) 的方法及其规则来调查涉及正义的青少年样本的优势性质用于描述变量的拇指(或s ≥ 1.7 且与基准率的百分点差异≥ 10)。在所调查的 14 项中,只有 3 项对一种或两种结果发挥了促进作用,而这正是所谓的保护因素所预期的。某些 SAPROF 项目存在的风险效应(作为混合效应或简单风险效应的一部分)与其作为保护因素或优势的解释不一致。但事实上,为 0 分的智力项目给出的标准可以用来反映风险(“智力低于平均水平” de Vogel 等,2012,p。41),对于其他项目得分为 0 的项目,可以推断出风险的存在,这些项目得分明确地仅表明不存在保护因素(对此,下面将提供进一步的评论)。尽管变量的影响已被证明根据结果而变化,但大多数项目对两种结果的影响是一致的(Langton 等人,2022)。说明由有关风险影响的某些项目得分为 0 所代表的信息的附加价值,两个OR加权的 9 项 SAPROF 总计在预测结果方面显示出在统计上比某些原始 SAPROF 总计总计更准确。

效应大小和比较组
值得注意的是,如果使用 ≥ 1.4 代替1.7 或更大的OR截止值,则在本研究中,某些项目的效果可能会被重新分类为具有促进作用(例如,休闲活动,对于某项活动的结果)新的暴力犯罪)、风险效应(例如,对于新的暴力犯罪,童年时期的安全依恋)或混合效应(例如,对于任何新的犯罪,智力)。法林顿等人。(2016)将他们的OR截止值 1.7描述为“实质性”(第 66 页),并引用Cohen (1996)指出,“虽然关于 OR 作为效应大小的惯例尚未明确建立,但流行病学领域倾向于将 OR 视为2.0 或以上为相当大”(第 136 页)。还专注于流行病学研究,陈等人。(2010)确定,当非暴露组中感兴趣结果的比率为 1% 时, OR为 1.68 相当于 Cohen's d效应大小 0.20(小效应大小),但较低的OR对应于 Cohen's d随着非暴露组的兴趣结果率增加,为 0.20;因此,当该比率为 10% 时,OR 1.46 相当于 Cohen's d 0.20。OR为 1.44、2.48 和 4.27 对应于使用Lenhard 和 Lenhard (2016)得出的 Cohen d效应大小 0.20(小)、0.50(中)和 0.80(大)。
同样,如果通过比较具有“最佳”得分(2,表明存在力量)的人的新进攻率与具有“最佳”得分的人的进攻率来计算促进OR ,则 SAPROF 项目的一些效果将被重新分类。 “中”分(1,表示强度可能存在或在某种程度上存在)和风险或s是通过将“最差”得分(0,表示缺乏实力)的人的新进攻率再次与“中等”得分进行比较来计算的。例如,对于任何新的犯罪行为,应对措施将从混合效应重新分类为风险效应;治疗动机和对权威的态度都将从混合效应重新分类为促进效应;对于新的暴力犯罪,自我控制、治疗动机和对权威的态度都将从混合效应重新分类为促进效应。社交网络将从混合效应重新分类为风险效应。请注意,外部控制和生活环境仍将被归类为对两种结果都产生矛盾的风险影响(下文将进一步考虑)。
优势的本质
无论是改变OR截止值,还是将“最佳”或“最差”分数的比率与“其余”或中间/中间分数的比率进行比较,SAPROF 项目都会发挥促进作用的直观预期与数据不一致。SAPROF 项目被证明具有混合效应(例如,治疗动机项目和对权威的态度项目对于两种结果)证实,这些旨在挖掘其领域优势的变量的操作确实在一端获得了优势。范围(分数为 2)。但它也表明,缺乏这种优势(得分为 0)要么会产生风险效应,要么得分为 0 的个体包括那些没有这种优势的个体,不会产生任何影响,并且那些在相同或概念相关领域具有风险的风险,赋予检测到的风险效应。考虑一下,如果焦点强度,例如,个人不存在“亲社会和支持性社交网络”(社交网络,第 13 项),则该项目的得分为 0。但正如德沃格尔等人。(2012)在本项目的编码材料中指出,“. 。。如果一个人的网络成员对犯罪或反社会行为持积极态度,这可能会导致风险增加”(第 69 页)。在本样本中,那些与反社会或参与犯罪的同龄人有联系的青少年也将获得 0 分,仅表示缺乏力量,尽管风险也存在(并且根据风险或明显)s 代表两种结果)。这与同伴影响对一系列行为产生强大影响的发现是一致的(Giletta et al., 2021),并且可以对再犯罪产生独立的风险和强度影响(Mowen & Boman, 2018),尽管这种关联可能很复杂(伊姆,2021)。

对于旨在作为优势的一维操作化的变量,例如构成 SAPPROF 的那些项目,无法确定是否是由于缺乏操作化的优势而带来了风险效应,或者 0 分是否实际上反映了风险效应如上所述,在相同或概念相关的领域中存在风险。同样的问题也出现在一些单维风险操作中(即,如果不存在特定风险,风险项目得分为 0,是否会产生强度效应,或者仅表示其不存在而没有影响)。将结构的双极操作化作为其他工具中的项目(例如,Barnoski,2004;Viljoen 等人,2014;Worling,2017)),这个重要问题可以得到解决,但该研究尚未进行。

这里缺乏明确性特别令人感兴趣,因为正如Langton 等人所言。(2022)已经讨论过,但该领域对于如何理解优势仍缺乏共识。仅考虑文献中讨论优势的各种方式中的三种。一是优势就是没有风险(Baird,2009;Harris & Rice,2015)。无法使用 SAPROF 数据调查该视图,因为该工具的所有项目均未作为所谓的风险项目进行操作(可以对其编码 0,表示不存在该风险)。另一种观点是,实力应该被简单地解释为风险连续体的延伸(Harris & Rice,2015)),这是一个与 Farrington 等人的“混合因素”兼容的概念,并且与 Farrington 及其同事以及Li 等人报告的研究结果一致。(2019)和当前的研究中。第三个是优势(或至少是所谓的优势结构的具体操作)是独特的或发挥独立于风险的效果(例如,参见Mowen & Boman,2018),这可以理解为 Farrington 等人的例子。的“促进因素”。Li 等人报道的 SPJ 项目的证据有限。并在当前的研究中。根据第三种观点,出现了这样的问题:力量是否或何时是一维结构没有风险极,至少没有对特定结果有明显效果的风险极(而不是存在“互补”风险极的结构的单维操作化,具有明显的效果,但风险极根本不是该特定操作的一部分)。正如兰顿等人。(2022)证明,有证据表明这些不同的概念和其他概念都与理解各种力量效应相关。但这对于使用以风险为中心和以实力为中心的 SPJ 工具的应用实践意味着什么呢?
如上所述,SAPROF 明确旨在与以风险为中心的 SPJ 工具(HCR-20)结合在应用实践中使用,并让评估人员使用 SAPROF 和“综合最终风险”达成“最终保护判断”。使用 SAPROF 进行判断”HCR-20,而不是强调使用项目或项目子集的总和。因此,未能明确考虑赋予风险效应的 0 分(有待复制,某些项目始终这样做,无论是作为混合效应的一部分还是仅像本样本中发现的风险效应)在应用实践中可能不会出现问题当风险项目被明确视为单独工具的一部分时。但是,评估人员是否仍在推断所谓的保护性因素项目的强度效应实际上仅带来风险效应,这样做会产生什么影响?

事实上,这里报告的结果可能部分解释了为什么 SAPROF 外部因素项目的总和未能预测该样本(Langton 等人,正在出版)和其他各种研究(Coupland & Olver,2020;de Vries Robbé 等人,2016 年;Yoon 等人,2018 年)。每个外部因素项目都有望发挥促进作用。但在本示例中,存在明显的例外。其中一项,社交网络,赋予混合效应(对于新的暴力犯罪)和风险效应(对于任何新的犯罪),这基于其促进和风险或s。另外两个项目,外部控制和生活环境,产生了矛盾的风险效应(分数为 2,表明强度是存在,与两种结果的较高可能性相关)。如果复制,在实践中应用这些结构的这些操作化的影响是有问题的。

考虑一下,外部控制、生活环境和专业护理项目可能会与风险混淆,因为那些接受更高水平的外部控制和专业护理并受到严格监督的生活环境的个人可能会根据感知/评估来保证这些更高水平的服务风险(这将使这些项目在分析中代表风险,例如此处报告的分析)。与此相一致的是,对这些数据的事后分析表明,在外部控制和生活环境项目上得分较高的青少年确实面临较高的风险(通过一些先前的性犯罪来确定)。额外的资源/服务反映了专业参与的增加,这些项目所利用的资源将由涉及案件的专业人员提供/实施,以管理或降低案件中感知/评估的风险(并且这些资源/服务很可能通过纵向设计证明可以随着时间的推移降低动态风险)。事实上,我们期望高水平的外部控制能够随着时间的推移降低再次犯罪风险较高的个人再犯的可能性(促进戒断)(与经验支持的风险-需求-响应模型的风险和需求原则大体一致) ;安德鲁斯等人,1990;邦塔和安德鲁斯,2017)。但是,正如刚才所指出的,我们还预计,重新犯罪风险较高的个人最初将受到更高水平的外部控制。因此,在个人面临风险(例如,从拘留中释放时)开始时进行一次评估,外部控制可能代表风险(正如它在本样本中所做的那样,发挥了矛盾的风险效应)。但它可能会根据它随着时间的推移带来的(指定的动态风险指数)变化而发挥强度效应。然而,如果没有进一步的实证调查,评估人员要知道如何将此类项目提供的信息纳入评估中以准确地为干预计划提供信息将是一项挑战。

本研究中 AUC 的直接统计比较结果确实表明,机械合并某些项目 0 分数中捕获的风险信息(用 OR 和基本率的变化证明)可以导致统计上比直接预测更准确的预测。假设所有项目仅产生强度效果的简单求和。(几十年来,基准率的变化一直被用作累犯预测研究中预测因子加权的基础;Harris 等人,1993 年;Nuffield,1982 年)。但目前的发现仅旨在说明使用Farrington 等人 (2016)调查焦点结构的特定操作化性质的潜在价值方法。必须指出的是,它们不足以作为对开发人员在实际案例中使用 SAPROF 的明确指示进行任何修改的基础(参见de Vogel 等人,2012 年,第 21-29 页)。

局限性
这项研究并非没有局限性。该研究仅涉及男性青少年,并且本质上是档案性的(尽管对自变量进行编码是在不了解累犯结果的情况下进行的,以部分减轻对使用存档案件档案的担忧)。所有青少年都至少犯过一次性犯罪,无论他们的犯罪史中是否也有非性犯罪;这可能会限制研究结果的普遍性,使其适用于更一般的参与司法的青年样本或不同的犯罪定义群体。对于 2003 年 4 月以来处于危险中的青少年,最早的病例在近 20 年前接受了评估服务。对于 2003 年 4 月之前面临风险的子集,该时间范围开始得更早。因此,这些发现的普遍性可能非常有限。一个相关的问题是,尽管临床报告作者预计已考虑了许多结构,但存档病例档案中的材料在编写时并未明确考虑到 SAPROF 项目。本研究中项目的 ICC 范围部分证明了对存档案例文件进行编码/评级的挑战,这可能降低了获得的一些效应大小。同样,SAPROF 并不是为青少年的应用而开发的,因此研究结果的含义具有概念和方法论意义,而不是应用实用性。因此,这些发现可能会在未来与 SAPROF 的合作中显示出缺乏普遍性,无论是对成人还是青少年。

与此相关的是,对 SAPROF 的关注,其所有项目都是所谓优势(保护因素)的一维运作化,意味着不可能在相同或概念上区分缺乏实力的影响和可能存在的风险。相关域。鉴于 SAPROF 中完全不存在所谓的风险项目(风险因素),也不可能区分相同或概念相关领域中不存在风险的影响和可能存在的实力。我们正在使用不同的工具进行研究,以解决其中的一些局限性。

清楚的是Farrington 等人 (2016)的应用方法代表了一种系统的探究路线,既促使人们明确考虑“强度”(或诸如促进因素或保护因素之类的标签)的含义,又试图以经验的方式澄清变量的具体影响是什么。操作化,对特定人群的样本产生特定结果。本研究使用的项目包括旨在与成年人一起使用的 SPJ 工具以及参与司法的青少年样本,该工具还可以对哪些结构可能对青少年重新犯罪产生影响进行一些初步推论,尽管这些结构可用于成年人(尽管正如其他人所观察到的,发展考虑在这里很重要;例如,参见兰顿等人,正在出版;罗尔斯顿和艾普森,2013;Viljoen 等人,2012)。SPJ 工具使用的开发和培训可能会受益于此类研究,该研究表明如何理解其各个项目在累犯终止预测研究以及应用评估和治疗实践中的风险和优势评估中发挥作用。

发布日期:2024-02-22