Re13:读论文 Gender and Racial Stereotype Detection in Legal Opinion Word Embeddings

简介: Re13:读论文 Gender and Racial Stereotype Detection in Legal Opinion Word Embeddings

1. Background


Implicit Association Test (IAT) 衡量人类参与者对目标单词(花或昆虫)与属性术语(快乐或不快乐)进行分类的反应时间。

Word Embedding Association Test (WEAT):衡量目标单词分组(如分男女)与属性术语(如情感正面或负面)的相似性,如测量男性相关的词嵌入是否与正面情感的词嵌入更靠近。方法是衡量两组目标单词(如典型男性人名或女性人名)与属性术语(如快乐的(love peace)或不快乐的(ugly hatred))的词嵌入之间的相似性(association,余弦相似度)

bias分类:historical, representation, measurement, aggregation, evaluation, and deployment biases


2. 难点及对应的解决方案


  1. 法律文本比较正式化,会多次使用正规人称代词,人名、姓氏、人称代词都可能会嵌入bias,只检测人名的话就会导致其他bias丢失。→使用与种族有关的姓氏。
  2. 法律工作者中本身就缺少女性,可能会导致出现gender-occupational stereotypes。
  3. 法律领域不能直接用open-domain的情感词表→WEAT测试的属性词表用了通用的词表,加上domain specific and expanded word lists(选取了一些标志性词语作为seed terms,然后用词嵌入来生成expanded word lists(正向词:与 已有正向词和已有负向词向量差 这一向量余弦相似度高。负向词与之相反),然后人工评审删掉具有明显种族或性别特征的词语)
  4. IAT检验主要考虑属性的正负性,但是对法律问题来说,结果的影响程度更大→使用一些衡量法律意见书对结果的grant或deny的指示词来衡量结果的正负性。


抽取短语(Idiomatic Phrase Extraction)→ 训练skip-gram word2vec model词嵌入(在所有语料、按时间或legal topic切割出的子语料上分别训练)→ 在性别和种族上进行WEAT检测

性别:人名和其他典型指示代词

种族:姓氏


优化:

  1. Idiomatic Phrase Extraction:为了防止n-gram dictionaries过大,只考虑了共同出现频率高的短语,用Normalized Point-wise Mutual Information (NPMI)指标来选择加入词典的短语。
  2. 姓氏可能跟公司名等重合的问题:
  • Title cased the surnames to target proper nouns.
  • Idiomatic phrase extraction排除了一些非人名。
  • Centroid-based filtering to remove multi-sense words.(计算所有姓氏的表征,计算各姓氏与所有姓氏表征的centroid的余弦相似度,删除20%相似度最低的姓氏)(人名的处理方式类似)


image.png

image.png

image.png



  1. 考虑到美国历史上有更严重的歧视问题,因此排除了时间因素(temporal effect),但是仍然有不公平问题。

做法:按时间分割语料,在不同时间段上训练词嵌入,进行WEAT test

image.png

image.png

  1. 性别刻板印象,使用不同的目标词语:

image.png

  1. 考虑到不同legal topic:将语料按照不同topic进行分割。(为了防止低频影响,删掉了出现频率小于30的属性词语)


3. 代码复现


论文没有给出公开代码,但是看起来复现不难(只要搞到数据集),等我服务器好了而且有时间了就写一份!


4. 其他与公平性相关的实践


LeSICiN1和ECHR2是将命名实体进行了mask,来减少demographic bias。

相关文章
|
关系型数据库 测试技术 Serverless
【PolarDB Serverless】资源伸缩&压测 TPC-C 测评
【PolarDB Serverless】资源伸缩&压测 TPC-C 测评
156340 31
【PolarDB Serverless】资源伸缩&压测 TPC-C 测评
|
SQL 数据格式
视图有哪些特点?哪些使用场景?
视图有哪些特点?哪些使用场景?
|
设计模式 前端开发 开发者
css 三栏布局的实现
css 三栏布局的实现
251 0
|
存储 机器学习/深度学习 算法
聚合签名、门限签名、Multisigs 和多签名
该文章深入探讨了数字签名在区块链技术中的应用,并比较了聚合签名、门限签名和多签名三种方案的异同,同时介绍了MuSig2和FROST这两种旨在提高区块链平台多签名或门限签名效率的提案。
537 3
聚合签名、门限签名、Multisigs 和多签名
|
缓存 监控 Linux
top命令详解
`top`是Linux下的系统监视工具,显示实时的CPU、内存使用及进程详情。交互式界面允许按CPU或内存排序进程,查看进程ID、用户、内存占用等信息。可通过`P`、`M`、`k`、`r`进行操作,如改变进程优先级或退出。使用`man top`获取完整帮助。
502 3
PolarDB-SCC使用问题之线性Lamport时间戳如何保证强一致性
PolarDB-SCC使用问题之线性Lamport时间戳如何保证强一致性
|
前端开发 编译器 Linux
浅谈C++20 协程那点事儿
本文是 C++20 的协程入门文章,作者围绕协程的概念到协程的实现思路全方位进行讲解,努力让本文成为全网最好理解的「C++20 协程」原理解析文章。
|
SQL 监控 搜索推荐
Elasticsearch 与 OpenSearch:开源搜索技术的演进与选择
Elasticsearch 与 OpenSearch:开源搜索技术的演进与选择
|
存储 算法 数据可视化
python多种算法对比图解实现 验证二叉树搜索树【力扣98】
python多种算法对比图解实现 验证二叉树搜索树【力扣98】
|
Android开发
Android保存图片到相册(适配android 10以下及以上)
Android保存图片到相册(适配android 10以下及以上)
347 1