论文信息 - Discrimination prevention in data mining for intrusion and crime detection

Discrimination prevention in data mining for intrusion and crime detection

Automated data collection has fostered the use of data mining for intrusion and crime detection. Indeed, banks, large corporations, insurance companies, casinos, etc. are increasingly mining data about their customers or employees in view of detecting potential intrusion, fraud or even crime. Mining algorithms are trained from datasets which may be biased in what regards gender, race, religion or other attributes. Furthermore, mining is often outsourced or carried out in cooperation by several entities. For those reasons, discrimination concerns arise. Potential intrusion, fraud or crime should be inferred from objective misbehavior, rather than from sensitive attributes like gender, race or religion. This paper discusses how to clean training datasets and outsourced datasets in such a way that legitimate classification rules can still be extracted but discriminating rules based on sensitive attributes cannot.

[1] Franco Turini,et al. Measuring Discrimination in Socially-Sensitive Decision Records , 2009, SDM.

[2] Franco Turini,et al. Data mining for discrimination discovery , 2010, TKDD.

[3] Osmar R. Zaïane,et al. A unified framework for protecting sensitive association rules in business collaboration , 2006, Int. J. Bus. Intell. Data Min..

[4] Married,et al. Classification with no discrimination by preferential sampling , 2010 .

[5] Toon Calders,et al. Classification Without Discrimination , 2009 .

[6] Toon Calders,et al. Three naive Bayes approaches for discrimination-free classification , 2010, Data Mining and Knowledge Discovery.

[7] Franco Turini,et al. Discrimination-aware data mining , 2008, KDD.

[8] Franco Turini,et al. DCUBE: discrimination discovery in databases , 2010, SIGMOD Conference.

[9] Chris Clifton,et al. Using unknowns to prevent discovery of association rules , 2001, SGMD.

[10] Elisa Bertino,et al. Association rule hiding , 2004, IEEE Transactions on Knowledge and Data Engineering.

[11] Ramakrishnan Srikant,et al. Fast Algorithms for Mining Association Rules in Large Databases , 1994, VLDB.

[12] Maria E. Orlowska,et al. Hiding Sensitive Associative Classification Rule by Data Reduction , 2007, ADMA.

[13] Franco Turini,et al. Integrating induction and deduction for finding evidence of discrimination , 2009, Artificial Intelligence and Law.