IBM开放源码Python工具包，用于检测和消除偏倚（30个度量，9个算法）

star2017 1年前 ⋅ 7526 阅读

概述

IBM已经开发了一套工具包来处理数据集和算法中的偏倚。

该工具包包含30个公平性度量和9个最新的算法。

Python代码和详细文档以及详细的安装说明可在GITHUB上获得。

偏倚是机器学习模型中的一个重要问题。我们常常在急于构建模型的时候浏览一下数据，然后当模型在现实世界中不能很好地转换时，就会抓狂。这是一个普遍存在的问题，专家们多年来一直试图缓解这一问题。

考虑到这一挑战的严重性，IBM已经发布了一个工具包，该工具包包含数据集和模型的一组“公平性度量”，这些度量的解释，以及可以处理所发现的任何偏差的算法。最好的部分是什么？它是开源的（在Python中）！检查下面的链接，让你自己开始：

该工具包被正式命名为“AI公平360开源工具包”，包含30多个公平度量和9个算法，旨在处理偏差。这些算法是最先进的，并在下面提到：

上面提到的官方站点在不同的行业功能中有多个教程，让您了解如何使用该工具包。这些包括信用评分，医疗支出，性别偏见的面部识别。你还在等什么？开始吧！

我们需要记住，数据不仅仅是电子表格上的数字，而是与人类联系在一起的。偏倚是一个全能的问题。我无法充分强调处理这个问题的重要性，尤其是当我们运行直接影响生活的算法时。

你能想象一个信用风险模型，或者一个贷款违约模型，把那些最需要钱的人拒之门外吗？他们完全符合这个条件，但是由于数据的一些偏差，以及随后的模型，我们没有考虑这个方面。不可接受，对吧？让我们记住下一次我们工作的项目，并尝试使用这个工具包，如果其他已知的方法不工作。

更多内容请访问：IT源点

注意：本文归作者所有，未经作者允许，不得转载

#数据集 #算法 #Python

我有话说: