Keskusteleminen parvioppimisesta – mitä se on ja mitä se tekee – tuo aina esiin kuvia luonnosta. Ja hyvästä syystä. Sieltä konsepti saa inspiraationsa. Ajattele kottaraisten parvia, jotka sumisevat ympäriinsä taivaalla, tai kaloja, jotka uivat samoin vedessä. Sana "parvi" on saanut inspiraationsa siitä tosiasiasta, että useat olennot, usein oman turvansa vuoksi, osoittavat eräänlaista hajautettua käyttäytymistä, joka ei liity heidän laumajohtajansa liikkeisiin. Ja se on perusta ajatukselle parviälystä.
Nykyään määrittelemme parvioppimisen hajautetuksi koneoppimisratkaisuksi, joka on suunniteltu antamaan yrityksille mahdollisuus hyödyntää hajautetun tiedon tehoa ja samalla suojata tietojen yksityisyyttä ja turvallisuutta.
Swarm-oppiminen hyödyntää laskentatehoa hajautetuissa tietolähteissä tai niiden lähellä. Se varmistaa turvallisuuden käyttämällä testattua lohkoketjuteknologiaa ja suojaa yksityisyyttä jakamalla oivalluksia, jotka on saatu lähdetiedoissa suoritettavista syväoppimismalleista itse raakadatan sijaan. Tiedot pysyvät paikallisina. Vain opit jaetaan. Tämä johtaa parempiin malleihin, joissa on vähemmän harhaa, koska niillä on pääsy suurempaan datajoukkoon – ja ratkaisee tietosuojaan, tietojen omistukseen ja tehokkuuteen liittyvät ongelmat.
Äskettäin julkistetun HPE Swarm Learningin, alan ensimmäisen yksityisyyttä suojelevan hajautetun koneoppimisratkaisun,1 swarm-oppimisen edut ovat nyt mallinkehittäjien saatavilla. HPE Swarm Learningissä hyödynnetään sallittua lohkoketjua jäsenten turvalliseen sisällyttämiseen ja johtajan valitsemiseen dynaamisesti. Tämä tuo parviverkkoon joustavuutta ja turvallisuutta.
Koneoppimisen keskitetyn lähestymistavan haasteiden voittaminen
Kuten nykyään yleensä tehdään, koneoppimisessa on monia osia. Siellä on tiedonkeruu, yleensä reunalla. Sitten on tietojen yhdistäminen, joka tehdään ydinpalvelinkeskuksessa, jossa tekoälymallin koulutus tehdään. Malli siirretään sitten takaisin reunaan päättelyä varten ennusteiden luomiseksi. Tämä luo jatkuvan syklin, jossa tarvitaan valtavasti resursseja tiedon siirtämiseen edestakaisin reunan ja palvelinkeskuksen välillä. Tämä lähestymistapa merkitsee merkittäviä haasteita.
#1 Tiedot eivät ole täydellisiä tietosuojaongelmien ja jakamisen estävän säädösten vuoksi. Tietojen omistaminen eri organisaatioissa erilaisilla tietokäytännöillä johtaa rajoitettuun tietojen jakamiseen. Lisäksi demografiset erot lisäävät harhaa koulutusmalleihin.
#2 Paikallisissa tiedoissa on harhaa väestörakenteen erojen vuoksi. Tämä tarkoittaa, että paikallisissa solmuissa koulutetuissa malleissa on sisäänrakennettu bias.
#3 Keskitetty mallin koulutussuunnittelu edellyttää datan siirtämistä keskitettyyn paikkaan – ja oppimiset jaetaan sitten solmuille toteutusta varten. Tämä johtaa joukkotietojen liikkumiseen ja tietojen päällekkäisyyteen. Enemmän ongelmia syntyy verkoissa, joissa yhteys on huono tai katkonainen tiedonsiirto on rajoitettua eikä synkronoitu.
Sinulla on alhainen tehokkuus, kun otat malleja käyttöön tuotannossa. Päädyt rasittamaan verkko-, tallennus- ja laskentaresursseja. Lisäksi säädökset ja tietosuojasäännökset estävät tietojen liikkumisen ja edistävät tietosuojan puutetta. Tuloksena olevat mallit voivat olla epäoptimaalisia – oivallusten saamiseksi viivästynyt aika, pienempi yleinen tarkkuus ja puolueelliset mallit.
Kaksi alan esimerkkiä – terveydenhuolto ja pankkitoiminta – tarkastelu osoittaa tarkemmin, kuinka parvioppiminen ratkaisee nämä haasteet.
Terveydenhuollon sairauksien havaitseminen
Nykyaikaiset terveydenhuoltoorganisaatiot vaativat tekoälyratkaisuillaan parempaa diagnoosien ja päätösten tarkkuutta. Ja tarkkuuden saavuttamiseksi tekoäly vaatii pääsyn suurempiin tietokokonaisuuksiin paikallisten tietopoikkeamien vähentämiseksi. Ilman tietojen yhdistämistä yhteen paikkaan alioptimaalisten mallien tulokset johtavat epätarkkoihin päätöksiin.
Tietojen yhdistäminen terveydenhuollossa voi olla erityisen haastavaa, koska tietosuojasäännökset, kuten HIPAA ja GDPR, estävät tietojen jakamisen. Tietojen omistus estää jakamisen sairaaloiden välillä ja eri maantieteellisillä alueilla. Vaikka dataa voidaankin yhdistää, tehottomuutta esiintyy johtuen erittäin suuren diagnostisen kuvadatan siirtämisestä kallisarvoista kaistanleveyttä käyttämällä ja siitä, että dataa voidaan joutua monistamaan käyttämällä arvokkaita tallennusresursseja.
HPE Swarm Learningin avulla terveydenhuollon organisaatiot voivat harjoittaa tekoälymallikoulutusta suurilla hajautetuilla datasarjoilla tietolähteessä – ilman tietojen liikkumista. Tietolähteiden välinen yhteistyö voi tapahtua tinkimättä yksityisyydestä. Raakadataa ei jaeta. Tietojen omistusongelmat poistuvat, koska jokainen tiedon omistaja osallistuu tasavertaisena kumppanina. Parannetut mallit tarjoavat tarkemman taudin luokituksen pienemmällä harhalla ja yleisesti parannetulla tarkkuudella.
Tässä erityisessä käyttötapauksessa, joka keskittyi useiden potilaiden keuhkosairauksien tutkimiseen, potilastiedot jaettiin kolmelle maantieteelliselle alueelle. Yhden sairaalan mallit kussakin paikassa eivät pystyneet havaitsemaan harvoin havaittuja sairauksia. Harvoin havaitut keuhkosairaudet tarkoittavat, että tiedoissa oli paikallista harhaa. Parvioppimismalli pystyi havaitsemaan nämä sairaudet, joissa sairaaloilla oli rajoitetusti tietoa, ja poistamaan luokan paikalliset tietoharha. Riittävästi saatavilla olevalla tiedolla parven oppimismalli on joko parempi tai sama kuin minkä tahansa yksittäisen mallin kanssa.
Tarkemmin sanottuna keuhkojen röntgenkuvissa esimerkittiin neljä sairautta. Mallit koulutettiin paikallisesti kussakin kolmesta sairaalasta. Jokaisella sijainnilla, jossa oli vähemmän kuvia tietystä sairaudesta, oli pienempi tarkkuus ~10 %. Vaikka kuvia oli saatavilla riittävästi, tarkkuus oli ~60%. Swarm-oppiminen parantaa mallin tarkkuutta ja myöhempää potilaan diagnoosia ja saavutti ~70% tarkkuuden. Tämä on huomattavasti parempi tapauksissa, joissa kuvia oli vähemmän ja joissa oli riittävästi tietoa.
Luottokorttipetosten havaitseminen pankkitoiminnassa
Äskettäisen demokäyttötapauksen tarkoituksena oli kehittää koneoppimismalli luottokorttitapahtumien petosten havaitsemiseksi. Mallin rakentamiseen käytettiin julkisesti saatavilla olevaa tietoaineistoa simuloidussa ympäristössä kolmen luottokorttiverkon kanssa. Vilpilliset liiketoimet jaettiin eri verkostojen kesken.
Yksittäiset luottoverkostot eivät voineet nähdä kaikkia vilpillisiä tapahtumia, eikä tapahtumatietoja voitu jakaa luottoverkostojen kesken. Tämän seurauksena yksittäiset luottoverkostot eivät pystyneet tunnistamaan kaikkia vilpillisiä liiketoimia.
Yhteistyöoppimisen avulla parvioppiminen pystyi havaitsemaan kaikki vilpilliset tapahtumat. Merkittävä suorituskyky oli parempi kuin yksittäisissä malleissa rajoitetuilla tiedoilla ja harhoilla.
Nämä terveydenhuollon ja pankkitoiminnan käyttötapaukset osoittavat vain kaksi monista tavoista useilla aloilla, joilla parvioppiminen tarjoaa tehokkaan lähestymistavan tekoälyyn – sellaisen, joka yhdistää paikallisia ja maailmanlaajuisia oivalluksia säilyttäen samalla tietojen yksityisyyden ja omistajuuden.
HPE tuo uusia läpimurtoja AI-ratkaisuja, jotka nopeuttavat data-ensisijaista modernisointia reunasta pilveen, mikä mahdollistaa tekoälyn laajentamisen teolliskokoisiin maailmanlaajuisiin sovelluksiin. Teemme tekoälyä, joka on dataohjattu, tuotantosuuntautunut ja pilvipohjainen – saatavilla milloin tahansa, missä tahansa ja missä tahansa mittakaavassa. Ratkaisumme tukevat nykypäivän yrityksiä sekä rahoituspalveluita, terveys- ja biotieteitä ja valmistus. HPE Swarm Learning tuo yrityksellesi hajautetun, yksityisyyttä suojelevan kehyksen koneoppimismallikoulutuksen suorittamiseen tietolähteessä
113. huhtikuuta 2022 tehty analyysi kilpailevista tarjouksista, joissa väitetään tietosuojan säilyttämistä, havaitsi, että ne käyttävät liittoutunutta arkkitehtuuria, joka perustuu keskuspalvelimeen.