Ang pag-aayos ng mga algorithm ay naglalagay sa amin sa mga kahon. Paano natin malalaman na tama sila? nabuo, CC BYAng pag-aayos ng mga algorithm ay naglalagay sa amin sa mga kahon. Paano natin malalaman na tama sila? nabuo, CC BY

Ang lipunan ay tila nakatakda sa isang kurso sa isang punto kung saan ang aming mga buhay ay napapailalim sa pagsusuri ng mga algorithm ng computer. Ang data na aming binuo ay pored over at pinag-aralan, kung sa pamamagitan ng mga pamahalaan para sa pambansang seguridad o mga kumpanya para sa tubo, at ito ay hindi malamang na baguhin - ang kapangyarihan at apila ng pagtatasa ng data, sa sandaling natagpuan, ay hindi madaling bibigyan.

Ngunit sa katunayan nagtataka ako kung higit akong nababahala na ang aming data ay nakolekta o sa pamamagitan ng katotohanan na wala kaming nalalaman tungkol sa mga algorithm na nagpapahayag ng paghuhusga sa amin.

Ang antas ng detalye tungkol sa aming mga buhay at mga gawi na maaaring hindi napili mula sa data na iniiwanan namin ay tinalakay noon, at nakakakuha ng isang sariwang pagsasahimpapawid bilang bahagi ng debate sa buong draft ng UK Mausisa Powers Bill. Alam namin ang hindi bababa sa isang bagay tungkol sa kung anong data ang nakolekta at kung gaano katagal ito nakaimbak, ang ilan ay pinamamahalaan ng UK at European law.

Sa teksto ng draft bill, halimbawa, alam namin na ang gobyerno ng UK ay "tanging" demand (hindi sapilitan) access sa metadata ng komunikasyon, mga header at paksa ng mga email, at mga tala ng tawag sa telepono. Ngunit alam din namin kung gaano ang pagbubunyag ng metadata lamang ay maaaring: tingnan ang Proyekto ng Pagsasabog ng MIT Media Lab para sa isang makapangyarihang halimbawa kung gaano karaming detalye ang matukoy mula dito. Tiyak na ito hindi sa lahat ng maihahambing sa isang naka-itemize bill ng telepono, gaya ng inaangkin.


innerself subscribe graphic


Kaya para sa mas mahusay o mas malala kami, ang publiko, may ilang mga tanda kung ano ang naitala. Ngunit wala kaming ganap na ideya kung anong analytical tools at pamamaraan ang inilalapat sa data na ito - at ang kabuluhan nito ay hindi dapat biguin.

Ano ang Crunches Ang Mga Numero?

Maaari tayong gumawa ng pinag-aralan na mga hula. Maaaring gamitin ng mga ahensya ng pambansang seguridad ang aming metadata upang bumuo ng mga social network sa pagitan ng mga tao at lugar, bukod sa iba pang mga bagay, na nag-uugnay sa amin. Pagkatapos ay pag-aralan ang mga network ng relasyon na ito upang matukoy kung kami ay isang taong interesado, tinutukoy ng kung ihahambing mo sa ibang mga taong interesado, at kung paano ka kumonekta sa mga umiiral na taong interesado o mga may kaugnayan sa mga ito.

Ang mga mananaliksik na gumagamit ng mga teknolohiyang ito ay nauunawaan ang kanilang mga limitasyon, at ang mga algorithm na may kapangyarihan sa kanila ay maaaring maglaman ng mga error o pinagbabatayan na mga pagpapalagay na may malalim na epekto sa kanilang output. Sa kasong ito, maaaring ibig sabihin kung ikaw ay may label na isang terorista o hindi, o kung kwalipikado ka para sa isang loan o mortgage.

Hindi rin eksaktong malinaw kung saan sa malabo na mga lugar ng hangganan ang pagkakaroon ng relasyon ay tinukoy. Ang pagbisita ba lamang sa parehong website bilang isang terorista ay nagpapahiwatig ng mga ibinahaging halaga, o pagsakay sa parehong ruta ng bus araw-araw na iminumungkahi mong regular na makipag-usap sa mga terorista? Posible na bisitahin ang mga site na madalas na binibisita ng mga kilalang terorista para sa maraming mga lehitimong dahilan. Kung makuha mo ang iyong mga balita mula sa parehong mga website bilang mga terorista ikaw ay mas malamang na maging isang terorista? Diskriminasyon at bias ay maaaring ipakilala sa punto ng pagkolekta ng data, at pagkatapos ay muli kapag ang mga pagpapasya ay ginawa tungkol sa kung paano pag-aralan ang data na iyon. Ang mga algorithm ay maaaring magpakita ng diskriminasyon.

Malagkit na Hangganan

Ang posibilidad na ipakilala ng mga algorithm ang hindi kanais-nais na bias ay isang tunay na isa. Halimbawa, ang mga ginagamit ng mga serbisyo sa seguridad ay sinanay sa mga dataset ng mga kilalang terorista at kilalang mga di-terorista. Nangangahulugan ba ito na, tulad ng mga kilalang terorista ay mga lalaki na may edad na 20-30, mas malamang na mai-uri-uri bilang isang terorista para lamang sa pagiging lalaki at may edad na halos 20-30, anuman ang iyong iba pang mga katangian ?. Kung gayon, mayroon ba itong makabuluhang epekto sa kung paano ginagamit ang data?

Ang problema ay nagmumula sa katotohanan na ako at ang iba pang mga mananaliksik na akademiko na gumagamit ng kumplikadong pag-aaral ng network, pag-aaral ng makina, pagtutugma ng pattern, o mga artipisyal na pamamaraan ng katalinuhan ay ginagamit ang aming mga pamamaraan sa pag-aaral ng mga pampublikong peer upang matukoy ang lakas ng mga diskarte at ang bisa ng mga konklusyon; ang mga serbisyo sa seguridad ng gobyerno at mga organisasyon ng pribadong sektor ay hindi. Wala kaming ideya tungkol sa kalidad ng kanilang mga pamamaraan at kung paano sila lumawak. Mayroon bang solusyon dito?

Ang mga mula sa isa pang larangan ng seguridad, cryptography, natutunan ng matagal na ang nakalipas na ang pinakamahusay na paraan upang mapabuti ang kalidad, at samakatuwid seguridad, ng mga algorithm nito ay upang gawin itong pampubliko. Ang mga cryptographic na pagpapatupad at ciphers ay nai-publish, at ang mga mananaliksik ay hinihikayat na subukan upang makahanap ng mga error o flaws, sa paggawa nito pagpapabuti ng seguridad para sa lahat na gumagamit ng mga ito. Bukod pa rito, ang anumang pagpapatupad ng mga closed-source (di-pampublikong) cryptogaphic algorithm sa pangkalahatan itinuturing na may hinala. Kung sasabihin nila ang mga hatol sa buhay na pagbabago sa amin - kung kami ay may label na mga terorista o hindi pinansiyal na hindi karapat-dapat - ang parehong modelo ay dapat na ilapat sa mga algorithm ng seguridad.

Ang isang argumento laban sa naturang paglipat ay ang mga bukas at malinaw na mga algorithm ay maaaring humantong terorista upang baguhin ang kanilang pag-uugali sa real-mundo upang maiwasan ang napansin. Ito ay nangangahulugang pagbabago ng mga bagay tulad ng kanilang mga pakikipag-ugnayan, asosasyon, mga gawi sa pag-browse, at potensyal na paggalaw. Ngunit ito, kung ang mga algorithm ay gumagana nang maayos, ay nangangahulugan na ang mga ito ay mahalagang itigil na kumilos tulad ng mga terorista. Kung ang aming seguridad sa hinaharap, kalayaan, at kaligtasan ay nakasalalay sa mga algorithm na ito, kailangan tayong maging tiyak kung paano - at iyon - nagtatrabaho sila.

Tungkol sa Ang May-akdaAng pag-uusap

Philip Garnett, Lektor, Unibersidad ng York.

Ang artikulong ito ay orihinal na na-publish sa Ang pag-uusap. Basahin ang ang orihinal na artikulo.

Mga Kaugnay Book:

at

masira

Salamat sa pagbisita InnerSelf.com, Kung saan mayroon 20,000 + mga artikulong nagbabago sa buhay na nagtataguyod ng "Mga Bagong Saloobin at Bagong Posibilidad." Ang lahat ng mga artikulo ay isinalin sa 30+ wika. sumuskribi sa InnerSelf Magazine, na inilathala linggu-linggo, at Araw-araw na Inspirasyon ni Marie T Russell. InnerSelf Magazine ay nai-publish mula noong 1985.