美国的种族主义犯罪:统计分析

我最近的文章(部分后123在美国和其与种族连接犯罪和警察射击),我决定继续这一主题,在同样分析其他开放式数据-幸运的是,仍然有足够的这些得益于美国联邦调查局的犯罪报告程序...



今天,我们将调查有关仇恨犯罪的数据。首先,让我们看一下所有的统计数据,然后再仔细研究种族不容忍,特别是在仇视白人和黑人的基础上,白人和黑人所犯罪行。



免责声明
, , . , , .



初始数据



作为初始数据,我从Crime Data Explorer网站下载了一个数据集,该网站由FBI维护,是美国犯罪报告程序的一部分(我已经在上一篇文章中对此站点进行过介绍)。您可以在此处下载直接链接(4.4 MB)。下载的存档包含CSV格式的实际数据以及文本描述。我没有以任何方式转换数据,因此,如果您想自己重复分析,则应获得相同的结果。



我还使用了按种族分类的美国人口数据,这些数据是从人口普查局的官方数据中获得的,并补充了1991年至2009年期间的模型数据。可在此处下载(Yandex.Disk)。为了分析特定指标的地理分布,我还需要从同一来源获得的按州划分的人口规模(在此处下载)。我在上一篇文章中使用了相同的数据。



什么是仇恨犯罪,如何举报?



从FBI网站:

FBI的UCR计划将仇恨犯罪定义为一种犯罪行为,其全部或部分原因是犯罪者对种族,宗教,残疾,性取向,种族,性别或性别认同的偏见。



转让:

FBI的犯罪报告程序将仇恨犯罪定义为(部分或全部)出于犯罪者偏向种族,宗教,身体约束,性取向,种族,性别或性别认同的犯罪动机。



原始犯罪数据集随附的证书还说明以下内容(斜体保留):

Because motivation is subjective, it is sometimes difficult to know with certainty whether a crime resulted from the offender’s bias. Moreover, the presence of bias alone does not necessarily mean that a crime can be considered a hate crime. Only when a law enforcement investigation reveals sufficient evidence to lead a reasonable and prudent person to conclude that the offender’s actions were motivated, in whole or in part, by his or her bias, should an agency report an incident as a hate crime.



换句话说,数据库中记录为仇恨犯罪的所有案件都是在调查确定肇事者的动机之后才堕落的。



自然,不可能对每种情况下的调查结论进行验证,因为该数据库汇总了全国数百个不同执法机构的报告,并且(仅可以假定)联邦调查局员工才能访问所有调查材料。数据库本身仅提供现成的统计信息。



数据库结构



该数据库包含有关1991年至2018年由不容忍行为引起的犯罪的数据。在撰写本文时,最后一个条目的日期为2018年12月31日,共有201403个条目。每个条目都是一个犯罪案件。因此,我们平均每年收到7193起犯罪。



原始CSV格式的数据库字段列表
  1. INCIDENT_ID: ID ()
  2. DATA_YEAR: ,
  3. ORI: ID ( ),
  4. PUB_AGENCY_NAME: / ( )
  5. PUB_AGENCY_UNIT: (, )
  6. AGENCY_TYPE_NAME: ( / )
  7. STATE_ABBR:
  8. STATE_NAME:
  9. DIVISION_NAME: ( )
  10. REGION_NAME: ( )
  11. POPULATION_GROUP_CODE:
  12. POPULATION_GROUP_DESC: ( « 0,5 1 .»)
  13. INCIDENT_DATE:
  14. ADULT_VICTIM_COUNT:
  15. JUVENILE_VICTIM_COUNT:
  16. TOTAL_OFFENDER_COUNT:
  17. ADULT_OFFENDER_COUNT:
  18. JUVENILE_OFFENDER_COUNT:
  19. OFFENDER_RACE: /- /-
  20. OFFENDER_ETHNICITY: /- ( / / / )
  21. VICTIM_COUNT: ( )
  22. OFFENSE_NAME:
  23. TOTAL_INDIVIDUAL_VICTIMS: ( )
  24. LOCATION_NAME: (, , , ..)
  25. BIAS_DESC: ( )
  26. VICTIM_TYPES: /- ( / / ..)
  27. MULTIPLE_OFFENSE: (.. , )
  28. MULTIPLE_BIAS: ( , )




我只用在我的研究几个字段(那些粗体)因为我的主要目标是发现犯罪类型,类型的不容忍,和犯罪分子的种族之间的联系但是,当然,您可以自己研究,例如,根据罪犯的类型等,分析罪犯和受害者的年龄或犯罪的典型地点等。正如他们所说,想象力的范围不限于:)



犯罪类型



该数据库包括13种主要犯罪类型:



  • 针对该人的犯罪:谋杀,强奸,殴打,严重殴打,人身威胁和人口贩运(性奴役和奴役)
  • 财产犯罪:抢劫,非法入境,盗窃,盗窃,纵火和财产损失/故意破坏


以及(在我们将使用的扩展数据库中)其他类型的犯罪,例如毒品交易,欺诈以及甚至更多的“外来”不宽容背景,例如卖淫,乱伦或鸡奸。



所有48类犯罪(原标题)
Aggravated Assault

All Other Larceny

Animal Cruelty

Arson

Assisting or Promoting Prostitution

Betting/Wagering

Bribery

Burglary/Breaking & Entering

Counterfeiting/Forgery

Credit Card/Automated Teller Machine Fraud

Destruction/Damage/Vandalism of Property

Drug Equipment Violations

Drug/Narcotic Violations

Embezzlement

Extortion/Blackmail

False Pretenses/Swindle/Confidence Game

Fondling

Hacking/Computer Invasion

Human Trafficking, Commercial Sex Acts

Identity Theft

Impersonation

Incest

Intimidation

Kidnapping/Abduction

Motor Vehicle Theft

Murder and Nonnegligent Manslaughter

Negligent Manslaughter

Not Specified

Pocket-picking

Pornography/Obscene Material

Prostitution

Purchasing Prostitution

Purse-snatching

Rape

Robbery

Sexual Assault With An Object

Shoplifting

Simple Assault

Sodomy

Statutory Rape

Stolen Property Offenses

Theft From Building

Theft From Coin-Operated Machine or Device

Theft From Motor Vehicle

Theft of Motor Vehicle Parts or Accessories

Weapon Law Violations

Welfare Fraud

Wire Fraud





不容忍的类型/犯罪动机



根据上面的定义,以下类型的不宽容输入到数据库中:

  1. 反对种族(反对白人,反对黑人,反对亚洲人,反对犹太人等)
  2. 反对种族(针对西班牙裔)
  3. 反对认罪或宗教世界观(反对基督徒,反对无神论者,反对穆斯林,反对耶和华见证人等)
  4. 反对性取向或性别(反对男女同性恋,反对男性,反对女性,反对变性人等)
  5. 身体上的限制(对残疾人的仇恨)


此外,每项犯罪最多可具有5种不同类型的不容忍动机。因此,在处理这些多重特征时,我们将不得不扩大类别。



受害者类别



该程序记录了针对个人和组织,国家乃至整个社会的犯罪,同时突出了受影响的个人数量。我们只会考虑有受伤人员的案件。



因此,用带有熊猫或其他几个库的Python武装(请参阅我之前的文章中的“工具”部分),也不要忘记跳过咖啡,茶,啤酒或红茶菌(无论喜欢什么)……将面具拉到我们的脸上,戴上手术手套,调整操作灯并...



我们剖析数据



图片



与上一篇文章一样,我在Python 3.8的Jupyter Lab / Notebook中进行了所有分析。在这里,我将不提供代码本身并对其进行评论-您可以从此链接下载(在存档中有一个清单和Jupyter Notebook格式的文件)。让我们更多地关注我们获得的结果。所有图表均可点击



数据概述和顶部列表



从CSV加载数据(仅用于研究所需的列)后,我们得到以下数据框:



STATE_NAME OFFENDER_RACE OFFENSE_NAME BIAS_DESC VICTIM_TYPES
0 1991年 阿肯色州 白色 恐吓 反黑人或非裔美国人 个人
1个 1991年 阿肯色州 黑人或非裔美国人 简单的攻击 防白 个人
2 1991年 阿肯色州 黑人或非裔美国人 严重袭击 反黑人或非裔美国人 个人
3 1991年 阿肯色州 黑人或非裔美国人 严重袭击;破坏/损坏/迷路... 防白 个人
4 1991年 阿肯色州 黑人或非裔美国人 严重袭击 防白 个人
... ... ... ... ... ... ...
201398 2018年 西弗吉尼亚 N 入室行窃/闯入 反黑人或非裔美国人 个人
201399 2018年 西弗吉尼亚 白色 简单的攻击 反黑人或非裔美国人 个人
201400 2018年 西弗吉尼亚 N 恐吓 反亚洲 个人
201401 2018年 西弗吉尼亚 白色 恐吓 防白 执法人员
201402 2018年 西弗吉尼亚 N 入室行窃/闯入&破坏;破坏/破坏 反其他宗教 宗教组织


201403行×6列





超过20万行,内存刚好超过8 MB。首先,让我们看看犯下的十大罪行,不容忍的类型(动机),犯罪者的种族和受害者的类别: 那么,我们在这里看到的是:



可点击



可点击







  • 最常见的犯罪类型是财产损失/故意破坏,其次是人身威胁(恐吓)。每种类型的犯罪几乎占所有案件的三分之一。然后是袭击,抢劫和其他犯罪很少见。
  • 在不宽容的类型中,对黑人的不宽容很高(占所有案件的三分之一),然后以降序排列,但幅度大致相同:对犹太人的不宽容,对白人的不宽容,对同性恋的不宽容。在统计上,其他类型的不宽容度比领导者低。
  • 在所有犯罪中,有70%是由白人犯下的,大约23%是由黑人犯下的,其余的则是“在误差范围之内”。
  • 针对人的犯罪占所有案件的80%。


仅查看这些图表,就可以想象几乎所有犯罪都是白人,通过报复威胁黑人或破坏他们的财产……但是,让我们看看每种犯罪类别的犯罪和不容忍类型最典型:





OFFENSE_COUNT TOP_OFFENSE TOP_OFFENSE_SHARE TOP_BIAS TOP_BIAS_SHARE TOP_VICTIM TOP_VICTIM_SHARE
OFFENDER_RACE
白色 79514 恐吓 36.796036 反黑人或非裔美国人 46.877279 个人 92.730840
黑人或非裔美国人 25956 简单的攻击 36.292187 防白 46.594236 个人 94.760364
4047 简单的攻击 36.545589 反黑人或非裔美国人 29.033852 个人 91.153941
亚洲人 1453 简单的攻击 31.865107 反黑人或非裔美国人 30.075705 个人 93.048864
美洲印第安人或阿拉斯加原住民 1095 简单的攻击 40.182648 防白 31.415525 个人 93.059361
夏威夷原住民或其他太平洋岛民 35 简单的攻击 45.714286 反其他宗教 22.857143 个人 77.142857




在此表中:



  • OFFENSE_COUNT-该种族代表犯下的犯罪总数
  • TOP_OFFENSE-该种族代表最常见的犯罪类型
  • TOP_BIAS-该种族代表最常见的不宽容(犯罪动机)
  • TOP_VICTIM-该种族代表最常见的受害者类别


对于每个典型类别,还显示了该种族成员所犯的犯罪总数的相应百分比。



在这里,您可以看到,黑人和白人的主要动机是对异族代表的种族宽容(两种种族的犯罪率均为47%)。同时,白人罪犯主要从事威胁和恐吓(占犯罪的37%),而黑人则从事不加重攻击(占犯罪的36%)。 (这两个种族的百分比重合率真是令人惊讶!)顺便说一下,仅对于白人罪犯而言,主要犯罪类型与人身伤害(威胁)无关。其他种族的成员更有可能发动进攻。



还应该指出的是,亚洲人和混合种族的代表(混血儿)基本上也显示出对黑人的厌恶,印第安人和爱斯基摩人对白人的厌恶,而夏威夷人对“外邦人”的厌恶。好吧,到目前为止(对于我个人而言)这一统计数据是完全可以预期的。



让我们看看每个犯罪分子种族每年的犯罪数量:



可点击



不出所料,图表中白人和黑人的犯罪行为主导了其余种族,由于规模的差异,种族甚至没有变化。白人的高峰期是1995-2002年,黑人的高峰期是1990年代初。自2002年以来,由不容忍行为驱使的白人犯罪数量一直在稳步下降,与2001年的峰值相比下降了2倍;然而,在2016年之后,它又开始急剧上升。从1995年到2004年,黑人之间的不容忍现象逐渐消退,但随后又开始平稳增长,到2018年达到1995年的水平。



有趣的是,在巴拉克·奥巴马(Barack Obama)(我们所知道的是非裔美国人)统治下,即2009年至2017年,白人的犯罪数量急剧下降,但与此同时,黑人的犯罪数量却保持稳定高度。在布什总统任职的第一年,在白人统治下的犯罪高峰之后(2001-2009年),这两个种族的代表犯下的罪行数量“搁置了”,几乎没有变化。但是在克林顿(Clinton,1993年-2001年)统治下,白人的犯罪迅速增长,几乎逐年上升,而黑人的犯罪则逐渐减少。



好吧,我们研究了主要趋势。现在让我们过滤数据,仅留待进一步分析的要点。



第一次过滤:按犯罪类型和受害者分类



根据我上一篇文章中提出的研究,让我们对数据进行类似的过滤以进行分析:



  1. 在受害者类别中,我们将只留下个人(不包括针对组织,当局和整个社会的犯罪);
  2. 在各种类型的犯罪中,我们只会把谋杀,殴打(严重和普通),抢劫和强奸视为最“邪恶”。


让我们看看发生了什么:





STATE_NAME OFFENDER_RACE OFFENSE_NAME BIAS_DESC 计数
0 1991年 亚利桑那 黑人或非裔美国人 突击 反同性恋(男性) 1个
1个 1991年 亚利桑那 黑人或非裔美国人 突击 防白 4
2 1991年 亚利桑那 白色 突击 反黑人或非裔美国人
3 1991年 阿肯色州 黑人或非裔美国人 突击 反黑人或非裔美国人 1个
4 1991年 阿肯色州 黑人或非裔美国人 突击 防白 4
... ... ... ... ... ... ...
16428 2018年 威斯康星州 白色 突击 反西班牙裔或拉丁裔 1个
16429 2018年 威斯康星州 白色 突击 反西班牙裔或拉丁裔;反白人 1个
16430 2018年 威斯康星州 白色 突击 抗身体残疾 1个
16431 2018年 威斯康星州 白色 突击 反锡克教徒 1个
16432 2018年 威斯康星州 白色 突击 防白 1个


16433行×6列





过滤和汇总数据使数据量减少了12倍,而不会影响分析的重要因素。最后一个新的COUNT包含给定年份,州,罪犯的种族,犯罪类型和动机的犯罪数量。



作为中间步骤,让我们看一下犯罪分子种族 和不容忍类型的犯罪分布



可点击







可点击



因此,白人罪犯和黑人罪犯合起来构成所有案件的93%(白人犯罪率是白人的两倍,但我们知道白人本身的犯罪率是白人的5倍)。因此,就不容忍的类型而言,这一比例几乎是相同的也就不足为奇了:33%的犯罪是由对黑人的不容忍所致,18%的犯罪是由对白人的不容忍所致。有趣的是,在这里顺便指出,对白人不宽容动机的犯罪在数量上大约等于对同性恋不宽容动机的犯罪-这是第三大动机。



第二次过滤:按罪犯和动机种族划分



下一步的逻辑步骤是只留下黑人和白人罪犯,并因此只留下犯罪的“黑人”动机。通过这种方式,我们将主题范围缩小到白人和黑人之间的种族主义。经过额外的过滤后,我们的数据数组如下所示:





STATE_NAME OFFENDER_RACE OFFENSE_NAME BIAS_DESC 计数
0 1991年 亚利桑那 黑色 突击 防白 4
1个 1991年 亚利桑那 白色 突击 防黑
2 1991年 阿肯色州 黑色 突击 防黑 1个
3 1991年 阿肯色州 黑色 突击 防白 4
4 1991年 阿肯色州 黑色 谋杀 防白 1个
... ... ... ... ... ... ...
3870 2018年 西弗吉尼亚 白色 突击 防白 2
3871 2018年 威斯康星州 黑色 突击 防黑 1个
3872 2018年 威斯康星州 黑色 突击 防白 4
3873 2018年 威斯康星州 白色 突击 防黑 6
3874 2018年 威斯康星州 白色 突击 防白 2


3875行×6列





现在是时候在分析中包括特定指标了(每个种族的每个人口)。为此,请从file加载总体数据us_pop_1991-2018.csv



让我们看看美国的总人口是如何按种族分布的(1991年至2018年的年度平均指标): 白人比黑人多5.8倍。所有其他种族构成人口的11%。 接下来,我们将有关数字的数据添加到我们的数据集中,并计算出每个种族每100万代表的特定犯罪数量。 请记住,在进行首次过滤之后,我们有4种犯罪类型(谋杀,殴打,抢劫和强奸),让我们以绝对和特定的角度来看这两种犯罪的种族分布:



可点击















可点击



分别针对谋杀和强奸案(因为它们在一般图表上不可见): 我们在这里看到了什么?我们看到了:



可点击







  • 在分析的犯罪类型中,攻击率最高(比抢劫多25倍,比谋杀和强奸多250倍)。
  • 白人的攻击次数是后者的两倍,但就特异性而言,黑人的攻击次数几乎是后者的3倍。
  • 黑人所犯的抢劫案的绝对数量是普通数字的1.5倍,特定数字是10倍。
  • 总体而言,白人犯下的谋杀案比黑人略多,而强奸案的发生次数几乎相同。具体来说,黑人被强奸的频率是白人的6倍,杀死频率是白人的3.6倍。在谋杀和强奸之间,白人“更喜欢”谋杀,而黑人则更喜欢强奸。


年度种族主义犯罪



让我们看看在整个期间,黑人和白人犯下的种族主义犯罪数量如何变化: 很容易从这些图表中得出明显的结论:



可点击



可点击







  • 平均而言,白人每年犯下种族主义罪行的次数略多,但在特定条款上的发生频率要低4-5倍(换句话说,非裔美国人犯下种族主义罪行的可能性是白人的4-5倍)。
  • 然而,自1990年代以来,黑人中种族主义犯罪的比例逐渐下降,在四分之一世纪中下降了一半。
  • , , , . : , . , ( ) 1993 , , , , - .


让我们看一看广义的(年度平均值)指标: 我们再次相信所观察到的情况:平均而言,白人犯下的种族主义犯罪数量增加15-16%,但同时,由于白人和黑人的数量差异,我们知道,布莱克6次犯下此类罪行。



可点击







难道只有白对黑,黑对白?



让我们将不宽容参数添加到我们的广义指标中,即犯罪动机。您还记得,由于过滤的结果,我们仅留下了两个动机:对白人的不宽容和对黑人的不宽容。他们如何在白人和黑人罪犯之间分配?当然是100%极性的吗?但不是! 当然,两极分化是显而易见的,但是事实证明,黑人是基于对自己的种族敌​​视而犯下的罪行,而白人也是如此。 (我相信也有犯罪行为由同性恋者的仇恨同性恋者承诺,由妇女等的仇恨女性,因为“人”的声音自豪地难;当然,你可以检查它自己所有!)



可点击







但是,这里令人感到奇怪的是:由于仇恨自己而引起的黑人所犯罪行的比例占黑人所犯罪行的11%,而白人所占比例为9%。也就是说,黑人有更大的机会背叛自己的人民。



犯罪地域



最后,让我们看一下分布种族主义犯罪跨美国各州。与往常一样,要计算特定指标,我们将需要按状态加载数字,并从文件中进行竞争us_pop_states_race_2010-2019.csv



白人和黑人的州平均数: 确定,没有新内容:加利福尼亚,得克萨斯州,佛罗里达州和纽约人口过剩,正如您从上一篇文章中可以看到的那样,更多的犯罪正在发生。 但是,各地的黑人人口比例是否都一样-臭名昭著的13%?让我们看一下: 因此,整个哥伦比亚特区(五角大楼华盛顿这座美丽的城市所在)的一半以上黑色的,大约三分之一是棉花的



可点击











可点击



南部各州-密西西比州,路易斯安那州,乔治亚州,阿拉巴马州,南卡罗来纳州和一个北部州(马里兰州,哥伦比亚特区,光荣的城市……);其余的不到四分之一。话虽如此,仅供参考。



犯罪呢?我们以绝对和特定的角度查看平均年度指标:



可点击



可点击



可以看出,人口最多的州加利福尼亚州是绝对犯罪数量的领先者。但是后来佛罗里达州和德克萨斯州被密歇根州,伊利诺伊州和马里兰州(经济较发达的北部州)推到一边。在特定的时间表上,人口最少的州-蒙大拿州,佛蒙特州,爱达荷州,阿拉斯加州的北达科他州和南达科他州(都在该国北部)处于领先地位。同时,很明显,尽管各州在特定指标上黑人占主导地位,但各州白人和黑人之间的犯罪比例并不相同(例如,哥伦比亚特区和夏威夷州在“白人”方面脱颖而出)。



我们将其显示在地图上(为更清晰起见,我们将用累计量替换平均年度指标)。



绝对第一:



可点击



在这里代表了美国的东北地区(尤其是密歇根州),加上太平洋沿岸的加州和华盛顿。具体说来: 北部是人口最稠密的州,这是显而易见的:哥伦比亚特区,达科他州和华盛顿州,以及东西两侧的两个州。同时,南部各州并未在人口中表现出重大犯罪。 通常,如果您问的问题是“我将在哪里看到更多种族主义罪行?”,请参阅第一张卡片。如果您的问题是“每个人最有可能犯种族主义罪行?” -参见第二张地图。我不会得出有关分布的任何其他结论。



可点击











而不是结论



布尔加科夫怎么样? “事实是世界上最顽固的事情。”如果从各个方面都告诉我们,那不一定是正确的-事实可能是半真话或谎言。但是,掌握N个数据集形式的事实,您自己就可以确认或驳斥某些论点。您可以建立假设并通过统计方法确认/驳斥它们,或者您可以简单地考虑没有任何假设的数据并在其中找到一些规律性,这反过来将有助于得出结论或提出可以进一步剖析的假设。一切由您自己决定或决定。



当然,这种小分析还远远没有完成。它是表面执行的,因为我只考虑了基本指标,甚至没有使用四分之一的可用数学统计工具。当然,可以争论初始数据的质量。是否可以信任所有记录的数据?是否记录了所有罪行?谁以及如何确定不容忍的动机?但就我而言,我宁愿按现状分析官方公开数据,也不愿对诸如“在N先生的血液中发现有毒物质X”或“ W国数十年来一直在系统地侵犯人权的声明”这样的陈述感到满意。



聚苯乙烯在对以前的研究的评论中,由于文化的差异,多次要求我将“纯白色”和“拉丁裔”分开。我不介意,但是不幸的是,由于初始数据中有关该种族的信息稀缺,因此无论哪种情况都无法做到。因此,例如,在本文分析的数据中,白人犯下的79514起犯罪中,只有6999种带有种族标记,只有489种标记为“西班牙裔或拉丁裔”(占0.6%)。当然,这些数据不能用于分析。



All Articles