Kaip sąmoningas požiūris į AI sumažina šališkus duomenų rinkinius

Šališki duomenų rinkiniai ir etiškas AI

PG valdomiems sprendimams reikia duomenų rinkinių, kad jie būtų veiksmingi. Šių duomenų rinkinių kūrimas yra kupinas netiesioginės šališkumo problemos sisteminiu lygiu. Visi žmonės kenčia nuo šališkumo (tiek sąmoningų, tiek nesąmoningų). Šališkumas gali būti įvairių formų: geografinių, kalbinių, socialinių ir ekonominių, seksistinių ir rasistinių. Ir tie sistemingi šališkumas yra įtraukiami į duomenis, todėl gali atsirasti AI produktų, kurie išsaugo ir padidina šališkumą. Organizacijoms reikia apgalvoto požiūrio, kad būtų išvengta šališkumo, įsiskverbusio į duomenų rinkinius.

Pavyzdžiai, iliustruojantys šališkumo problemą

Vienas žymus šio duomenų rinkinio šališkumo pavyzdys, tuo metu sulaukęs daug neigiamos spaudos, buvo CV skaitymo sprendimas, teikiantis pirmenybę vyrams, o ne moterims. Taip yra todėl, kad įdarbinimo įrankio duomenų rinkiniai buvo sukurti naudojant ankstesnio dešimtmečio gyvenimo aprašymus, kai dauguma kandidatų buvo vyrai. Duomenys buvo šališki, o rezultatai atspindėjo tą šališkumą. 

Kitas plačiai nuskambėjęs pavyzdys: kasmetinėje „Google I/O“ kūrėjų konferencijoje „Google“ pasidalijo AI pagrįsto dermatologijos pagalbos įrankio, padedančio žmonėms suprasti, kas vyksta su jų oda, plaukais ir nagais, apžvalga. Dermatologijos padėjėjas pabrėžia, kaip dirbtinis intelektas vystosi, kad padėtų sveikatos priežiūrai, tačiau taip pat pabrėžė, kad DI gali įsiskverbti į šališkumą, kai kritikuojama, kad įrankis netinkamas spalvotiems žmonėms.

Kai „Google“ paskelbė apie įrankį, bendrovė pažymėjo:

Siekdami užtikrinti, kad kuriame visiems, mūsų modelis atsižvelgia į tokius veiksnius kaip amžius, lytis, rasė ir odos tipai – nuo ​​blyškios odos, kuri neįdega, iki rudos odos, kuri retai nudega.

Google, AI naudojimas siekiant padėti rasti atsakymus į įprastas odos ligas

Tačiau „Vice“ straipsnyje teigiama, kad „Google“ nepavyko naudoti įtraukiančio duomenų rinkinio:

Norėdami atlikti užduotį, mokslininkai naudojo 64,837 12,399 3.5 90 pacientų, esančių dviejose valstijose, treniruočių duomenų rinkinį. Tačiau iš tūkstančių pavaizduotų odos būklių tik XNUMX procento buvo pacientų, sergančių V ir VI Fitzpatrick odos tipais – atitinkamai ruda oda ir tamsiai ruda arba juoda oda. Remiantis tyrimu, XNUMX procentų duomenų bazės sudarė žmonės su šviesia oda, tamsesne balta oda arba šviesiai ruda oda. Dėl šališko mėginių ėmimo dermatologai teigia, kad programa gali per daug arba nepakankamai diagnozuoti žmones, kurie nėra balti.

Vice, naujoji „Google“ dermatologijos programa nebuvo skirta tamsesnės odos žmonėms

„Google“ atsakė sakydama, kad patobulins įrankį prieš oficialiai išleisdama:

Mūsų dirbtiniu intelektu varomas dermatologijos pagalbos įrankis yra daugiau nei trejų metų tyrimų kulminacija. Kadangi mūsų darbas buvo pristatytas gamtos medicinoje, mes toliau kūrėme ir tobulinome savo technologiją, įtraukdami papildomus duomenų rinkinius, apimančius tūkstančių žmonių paaukotus duomenis ir milijonus daugiau kuruojamų odos vaizdų.

Google, AI naudojimas siekiant padėti rasti atsakymus į įprastas odos ligas

Kad ir kaip galėtume tikėtis, kad dirbtinis intelektas ir mašininio mokymosi programos galėtų ištaisyti šiuos paklaidas, realybė išlieka: jos yra tokios, kaip sumanus nes jų duomenų rinkiniai yra švarūs. Atnaujinant seną programavimo posakį šiukšlių įvedimas/išvežimas, AI sprendimai yra tokie pat stiprūs, kiek jų duomenų rinkinių kokybė nuo pat pradžių. Be programuotojų pataisymo šie duomenų rinkiniai neturi pakankamai patirties, kad galėtų taisyti patys, nes jie tiesiog neturi jokios kitos atskaitos sistemos.

Atsakingas duomenų rinkinių kūrimas yra visų esmė etiškas dirbtinis intelektas. Ir žmonės yra sprendimo pagrindas. 

Sąmoningas AI yra etiškas AI

Šališkumas nevyksta vakuume. Neetiški arba šališki duomenų rinkiniai atsiranda dėl netinkamo požiūrio kūrimo etape. Būdas kovoti su šališkumo klaidomis yra atsakingas, į žmogų orientuotas požiūris, kurį daugelis pramonės atstovų vadina Mindful AI. „Mindful AI“ turi tris svarbius komponentus:

1. Sąmoningas AI yra orientuotas į žmogų

Nuo AI projekto pradžios, planavimo etapuose, kiekvieno sprendimo centre turi būti žmonių poreikiai. Ir tai reiškia visus žmones - ne tik pogrupį. Štai kodėl kūrėjai turi pasikliauti įvairia visame pasaulyje dirbančių žmonių komanda, kad apmokytų dirbtinio intelekto programas, kad jos būtų įtraukios ir be šališkumo.

Duomenų rinkinių tiekimas iš visuotinės, įvairios komandos užtikrina, kad šališkumas būtų nustatytas ir išfiltruotas anksti. Įvairių tautybių, amžiaus grupių, lyčių, išsilavinimo, socialinės ir ekonominės padėties bei vietovių atstovai gali lengviau pastebėti duomenų rinkinius, kurie teikia pirmenybę vienam vertybių rinkiniui, o tai pašalina nenumatytą šališkumą.

Pažvelkite į balso programas. Taikydami sąmoningą AI metodą ir išnaudodami pasaulinio talentų fondo galią, kūrėjai gali atsižvelgti į kalbinius elementus, tokius kaip skirtingi dialektai ir akcentai duomenų rinkiniuose.

Labai svarbu nuo pat pradžių sukurti į žmogų orientuotą dizaino sistemą. Tai labai padeda užtikrinti, kad sugeneruoti, kuruojami ir pažymėti duomenys atitiktų galutinių vartotojų lūkesčius. Tačiau taip pat svarbu, kad žmonės būtų informuoti apie visą produkto kūrimo gyvavimo ciklą. 

Žmonės, dalyvaujantys cikle, taip pat gali padėti mašinoms sukurti geresnę DI patirtį kiekvienai konkrečiai auditorijai. Pactera EDGE mūsų AI duomenų projektų komandos, esančios visame pasaulyje, supranta, kaip skirtingos kultūros ir kontekstai gali turėti įtakos patikimų AI mokymo duomenų rinkimui ir tvarkymui. Jie turi reikalingus įrankius problemoms pažymėti, jas stebėti ir išspręsti prieš pradedant dirbtinio intelekto sprendimu.

„Human-in-the-loop“ dirbtinis intelektas yra projektas „apsauginis tinklas“, apjungiantis žmonių stiprybes ir įvairias jų kilmes bei greitą mašinų skaičiavimo galią. Šis žmonių ir dirbtinio intelekto bendradarbiavimas turi būti užmegztas nuo pat programų pradžios, kad šališki duomenys nesudarytų projekto pagrindo. 

2. Sąmoningas AI yra atsakingas

Būti atsakingam reiškia užtikrinti, kad dirbtinio intelekto sistemose nebūtų šališkumo ir jos būtų pagrįstos etika. Tai reiškia, kad reikia atsižvelgti į tai, kaip, kodėl ir kur sukuriami duomenys, kaip juos sintetina AI sistemos ir kaip jie naudojami priimant sprendimus, kurie gali turėti etinių pasekmių. Vienas iš būdų verslui tai padaryti yra dirbti su nepakankamai atstovaujamomis bendruomenėmis, kad jos būtų įtraukesnės ir mažiau šališkos. Duomenų anotacijų srityje nauji tyrimai atskleidžia, kaip kelių komentatorių kelių užduočių modelis, kuriame kiekvieno anotatoriaus etiketės traktuojamos kaip atskira papildoma užduotis, gali padėti sušvelninti galimas problemas, būdingas tipiškiems pagrindinės tiesos metodams, kai anotatorių nesutarimai gali kilti dėl nepakankamo pateikimo ir gali būti ignoruojamas sujungiant vienos pagrindinės tiesos anotacijas. 

3. Patikimas

Patikimumas atsiranda dėl to, kad verslas yra skaidrus ir aiškiai paaiškinamas, kaip dirbtinio intelekto modelis mokomas, kaip jis veikia ir kodėl jie rekomenduoja rezultatus. Verslui reikia dirbtinio intelekto lokalizavimo patirties, kad klientai galėtų padaryti savo AI programas įtraukesnes ir labiau pritaikytas asmeniniams poreikiams, atsižvelgiant į svarbius vietinės kalbos ir naudotojų patirties niuansus, kurie gali padidinti arba sugriauti AI sprendimo patikimumą iš vienos šalies į kitą. . Pavyzdžiui, verslas turėtų kurti savo programas suasmenintam ir lokalizuotam kontekstui, įskaitant kalbas, dialektus ir akcentus balso programose. Tokiu būdu programa suteikia tokio paties lygio balso patirtį visoms kalboms – nuo ​​anglų iki nepakankamai atstovaujamų kalbų.

Sąžiningumas ir įvairovė

Galų gale sąmoningas AI užtikrina, kad sprendimai būtų sukurti remiantis sąžiningais ir įvairiais duomenų rinkiniais, kuriuose stebimos ir įvertinamos konkrečių rezultatų pasekmės ir poveikis, kol sprendimas patenka į rinką. Būdami atidūs ir įtraukdami žmones į kiekvieną sprendimo kūrimo dalį, padedame užtikrinti, kad AI modeliai išliktų švarūs, minimaliai šališki ir kiek įmanoma etiškesni.

Ką manote?

Ši svetainė naudoja "Akismet", kad sumažintų šlamštą. Sužinokite, kaip apdorojamas jūsų komentaras.