Hoe verandert big data het dagelijkse leven in heel Amerika?

Hoe verandert big data het dagelijkse leven in heel Amerika?
Hoe verandert big data het dagelijkse leven in heel Amerika?

Video: Hoe kan een slimme computer de arts helpen bij zijn beslissingen? | BIG DATA 2024, Juli-

Video: Hoe kan een slimme computer de arts helpen bij zijn beslissingen? | BIG DATA 2024, Juli-
Anonim

Het idee van 'big data' is alomtegenwoordig geworden, maar wat is het en hoe verandert het onze manier van leven? We gingen zitten met datawetenschapper, Harvard PhD en National Book Award-genomineerde Cathy O'Neil om erachter te komen.

CT: Laten we beginnen met de basis: wat is 'big data' precies?

CO: Big data is een nieuwe benadering om dingen te voorspellen. Meer specifiek is 'big data' het gebruik van incidenteel verzamelde gegevens - zoals hoe u door uw browser zoekt of wat u op Facebook doet - om dingen over u af te leiden, zoals wat u gaat kopen of wat uw politieke voorkeuren zijn. Het is een indirecte manier om mensen uit te zoeken. Een camera die ons onderzoekt, vraagt ​​bijvoorbeeld niet 'Wat doe je?' - het ziet gewoon wat we doen.

CT: En wat is een algoritme?

CO: Algoritmen zijn berekeningen die de gegevens die over u zijn verzameld [interpreteren] om een ​​voorspelling te maken. Zie het als een wiskundige vergelijking die probeert een vraag te beantwoorden die is geformuleerd als voorspelling, zoals: 'Staat deze persoon op het punt iets te kopen?' of 'Staat deze persoon op het punt om op iemand te stemmen?'

CT: Waarom hoor ik er nu zoveel over?

CO: Vóór 'big data' zouden statistici dure dingen doen, zoals mensen peilen om de toekomst te achterhalen. Stel mensen bijvoorbeeld directe vragen als: 'Op wie ga je stemmen?' Nu vertrouwen we steeds meer op 'data-uitputting', dat is wat ik noem de gegevens die constant over u worden verzameld, om dingen over u af te leiden.

Vóór 'big data' hadden bedrijven alleen maar wilde gissingen te doen. Nu hebben we betere dan wilde gissingen. Wat verrassend is, is dat de meeste big data-algoritmen enorm onnauwkeurig zijn en dat er geen reden is om te denken dat ze gelijk hebben. Maar ze zijn beter dan wilde gissingen. En daarom is big data net zo populair geworden.

CT: Als ze onnauwkeurig zijn, wat weerspiegelen ze dan?

CO: De gebrekkige datasets die we ze voeden. Algoritmen weten niets anders dan wat we ze vertellen. Dus als we ongelijke gegevens hebben en die aan het algoritme of vooringenomen gegevens doorgeven, zal het denken dat dat de realiteit is.

Image

Ailsa Johnson / © Cultuurreis

CT: Wat is daar een echt voorbeeld van?

CO: Een voorbeeld zou kunnen zijn dat zwarte mensen in de Verenigde Staten vijf keer vaker worden gearresteerd voor het roken van wiet dan blanken. Dit komt niet omdat zwarten vaker wiet roken - beide groepen roken wiet in hetzelfde tempo. Zwarte mensen worden er veel vaker voor gearresteerd. Als je dat aan een algoritme overhandigt, wat we doen, zal het correct afleiden dat zwarte mensen in de toekomst veel vaker zullen worden gearresteerd voor het roken van wiet. En dan geeft het zwarte mensen hogere risicoscores voor criminaliteit, wat effect heeft op strafrechtelijke veroordelingen.

Een ander voorbeeld is een gedachte-experiment. Ik zal Fox News gebruiken, omdat Fox News onlangs uitbarstingen heeft gehad in verband met een interne cultuur van seksisme. Het experiment is 'Wat zou er gebeuren als Fox News zou proberen hun eigen gegevens te gebruiken om een ​​machine learning-algoritme te bouwen om in de toekomst mensen aan te nemen?'

Stel dat we op zoek zijn naar mensen die bijvoorbeeld succesvol waren bij Fox News. Het hangt ervan af hoe je succes zou definiëren, maar meestal kijk je naar mensen die verhogingen, promoties krijgen of lang blijven. Bij al deze maatregelen zouden de gegevens weerspiegelen dat vrouwen niet slagen bij Fox News. Als het wordt gebruikt als huuralgoritmen, zou dat probleem worden gepropageerd. Het zou naar een pool van sollicitanten kijken en zou zeggen: 'Ik wil geen vrouwen aannemen, omdat ze hier niet succesvol zijn. Het zijn geen goede mensen. ' En het hoeft niet alleen Fox News te zijn - elke bedrijfscultuur heeft vooringenomenheid. Wanneer u algoritmegegevens invoert, verspreidt de algoritme-bias dat vervolgens. Het blijft de vooroordelen versterken die al in de samenleving bestaan.

CT: Zijn de vooroordelen opzettelijk?

CO: Ik denk niet dat datawetenschappers seksistische of racistische algoritmen proberen te maken. Maar algoritmen voor machine learning zijn uitzonderlijk goed in het oppikken van relatief genuanceerde patronen en deze vervolgens uit te dragen. Het is niet iets dat gegevenswetenschappers opzettelijk doen, maar het is toch een vooroordeel.

CT: Welke rol spelen onnauwkeurige algoritmen in ons dagelijks leven?

CO: Ze worden gebruikt bij allerlei beslissingen voor het leven van mensen - alles van toelating tot een baan.

Er zijn algoritmen die bepalen hoe de politie buurten zal controleren, evenals algoritmen die bepalen hoe rechters beklaagden zullen veroordelen. Er zijn algoritmen die bepalen hoeveel u betaalt voor verzekeringen of wat voor soort APR [rente] u op uw creditcard krijgt. Er zijn algoritmen die bepalen hoe je het doet op je werk, die worden gebruikt om de loonsverhogingen te bepalen. Er zijn algoritmen bij elke stap, van geboorte tot dood.

CT: Dus waar laat dat ons achter?

CO: We zijn in het big data-tijdperk gesprongen en hebben algoritmen gegooid bij elk afzonderlijk probleem dat we hebben, ervan uitgaande dat die algoritmen eerlijker moeten zijn dan mensen - maar eigenlijk zijn ze net zo oneerlijk als mensen. We moeten het beter doen.

Klik hier om het tweede deel van ons interview met Dr. O'Neil te lezen. Haar boek, The Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy is nu verkrijgbaar.

Populair voor 24 uur