Zvýšení přesnosti modelu umělé inteligence a snížení zkreslení modelu pomocí swarm learning Sponzorovaný obsah od HPE

9. května 2022

Diskuse o učení rojů – co to je a co dělá – vždy přináší obrazy z přírody. A z dobrého důvodu. Zde koncept čerpá inspiraci. Vzpomeňte si na hejna špačků bzučících po obloze nebo na ryby plavající ve vodě. Slovo „roj“ bylo inspirováno skutečností, že různí tvorové, často pro svou vlastní ochranu, projevují jakési decentralizované chování, které nesouvisí s pohyby vůdce jejich hejna. A to je základ pro myšlenku rojové inteligence.

Dnes definujeme swarm learning jako decentralizované řešení strojového učení navržené tak, aby umožnilo podnikům využít sílu distribuovaných dat a zároveň chránit soukromí a bezpečnost dat.

Swarm learning využívá výpočetní výkon v distribuovaných zdrojích dat nebo v jejich blízkosti. Zajišťuje bezpečnost pomocí testované technologie blockchain a chrání soukromí sdílením poznatků získaných z modelů hlubokého učení běžících na zdrojových datech namísto samotných nezpracovaných dat. Data zůstávají lokální. Sdílí se pouze poznatky. Výsledkem jsou vylepšené modely s menším zkreslením, protože mají přístup k většímu souboru dat – a řeší problémy s ochranou osobních údajů, vlastnictvím dat a efektivitou.

S nově oznámeným HPE Swarm Learning, prvním řešením distribuovaného strojového učení chránícím soukromí,¹je nyní vývojářům modelů k dispozici výhody swarm learningu. V HPE Swarm Learning se využívá povolený blockchain k bezpečnému zařazení členů a dynamické volbě vůdce. To přináší odolnost a bezpečnost do sítě rojů.

Překonávání výzev centralizovaného přístupu ke strojovému učení

Jak už to dnes bývá, strojové učení má mnoho komponent. Existuje sběr dat, obvykle na okraji. Pak je tu agregace dat, která se provádí v hlavním datovém centru, kde se provádí trénování modelu AI. Model se poté přesune zpět na okraj pro odvození a vygenerování předpovědí. To vytváří nepřetržitý cyklus s obrovským množstvím zdrojů potřebných k přesunu dat tam a zpět mezi okrajem a datovým centrem. Tento přístup signalizuje některé významné výzvy.

#1 Data nejsou úplná kvůli problémům s ochranou osobních údajů a předpisům, které brání sdílení. Vlastnictví dat různými organizacemi s různými datovými zásadami vede k omezenému sdílení dat. Kromě toho demografické rozdíly vytvářejí zkreslení v modelech školení.

#2 V místních datech se vyskytuje zkreslení kvůli demografickému rozdílu. To znamená, že modely trénované v místních uzlech budou mít zabudované zkreslení.

#3 Návrh centralizovaného modelového tréninku vyžaduje, aby byla data přesunuta do centrálního umístění – s poznatky pak distribuovány do uzlů k implementaci. To má za následek hromadný pohyb dat a duplikaci dat. Další problémy vznikají v sítích, kde je špatná konektivita nebo je přerušovaný pohyb dat omezený a nesynchronizovaný.

Při nasazování modelů do produkce se potýkáte s nízkou efektivitou. Nakonec zatěžujete síť, úložiště a výpočetní zdroje. Kromě toho předpisy a nařízení o ochraně osobních údajů zabraňují pohybu dat a způsobují nedostatek ochrany osobních údajů. Výsledné modely mohou být suboptimální – se zpožděním pro získání přehledů, nižší celkovou přesností a neobjektivními modely.

Zvýšení přesnosti modelu AI a snížení zkreslení modelu pomocí swarm learningSponzorovaný obsah od HPE

Podrobný pohled na dva příklady z odvětví – zdravotnictví a bankovnictví – konkrétněji ukazuje, jak swarm learning tyto problémy řeší.

Detekce nemocí ve zdravotnictví

Moderní zdravotnické organizace požadují od svých řešení AI vyšší přesnost diagnostiky a rozhodování. A k dosažení přesnosti vyžaduje umělá inteligence přístup k větším datovým sadám, aby se omezily místní zkreslení dat. Bez agregace dat na jedno místo vedou výsledky neoptimálních modelů k nepřesným rozhodnutím.

Agregace dat ve zdravotnictví může být obzvláště náročná, protože sdílení dat brání nařízení o ochraně osobních údajů, jako je HIPAA a GDPR. Vlastnictví dat brání sdílení mezi nemocnicemi a napříč geografickými oblastmi. I když lze data agregovat, dochází k neefektivitě kvůli nákladům na přesun velmi velkých diagnostických obrazových dat s využitím vzácné šířky pásma a skutečnosti, že data bude možná nutné duplikovat s využitím vzácných úložných zdrojů.

S HPE Swarm Learning mohou zdravotnické organizace provádět nácvik modelů umělé inteligence s velkými sadami distribuovaných dat u zdroje dat – bez jakéhokoli pohybu dat. Spolupráce mezi zdroji dat může probíhat bez ohrožení soukromí. Nezpracovaná data nejsou sdílena. Obavy z vlastnictví dat jsou eliminovány, protože každý vlastník dat se účastní jako rovnocenný partner. Vylepšené modely poskytují přesnější klasifikaci onemocnění se sníženým zkreslením a celkově zlepšenou dobou do přesnosti.

V tomto konkrétním případu použití zaměřeném na vyšetření plicních onemocnění u více pacientů byla data pacientů rozdělena do tří geografických oblastí. Modely v jedné nemocnici v každé lokalitě nedokázaly detekovat zřídka pozorovaná onemocnění. Zřídka pozorovaná plicní onemocnění znamenají, že data měla lokální zkreslení. Model učení roje byl schopen detekovat tyto nemoci, kde měly nemocnice omezené údaje, a odstranit místní zkreslení dat pro danou kategorii. I s dostatečně dostupnými daty je model učení roje buď lepší, nebo srovnatelný s jakýmkoli individuálním modelem.

Přesněji řečeno, rentgenové snímky plic byly předem označeny pro čtyři onemocnění. Modely byly vyškoleny lokálně v každé ze tří nemocnic. Každé místo s menším počtem snímků pro konkrétní onemocnění mělo nižší přesnost ~10 %. I když byl k dispozici dostatek obrázků, přesnost byla ~ 60 %. Swarm learning zlepšuje přesnost modelu a následnou diagnostiku pacienta a dosahuje přesnosti ~70 %. To je výrazně lepší v případech, kdy bylo méně snímků a blízko nebo na stejné úrovni, kde byl k dispozici dostatek dat.

Detekce podvodů s kreditními kartami v bankovnictví

Záměrem nedávného příkladu použití bylo vyvinout model strojového učení pro odhalování podvodů při transakcích s kreditními kartami. K vytvoření modelu v simulovaném prostředí se třemi sítěmi kreditních karet byl použit veřejně dostupný datový soubor. Podvodné transakce byly rozděleny do různých sítí.

Jednotlivé kreditní sítě tak nemohly vidět všechny podvodné transakce a transakční údaje nebylo možné sdílet mezi kreditními sítěmi. V důsledku toho jednotlivé úvěrové sítě nemohly identifikovat všechny podvodné transakce.

Pomocí kolaborativního učení dokázal swarm learning odhalit všechny podvodné transakce. Významný byl zisk oproti jednotlivým modelům s omezenými daty a zkresleními.

Tyto případy použití ve zdravotnictví a bankovnictví demonstrují pouze dva z mnoha způsobů, jak v mnoha odvětvích rojové učení poskytuje účinný přístup k umělé inteligenci – takový, který kombinuje místní a globální poznatky a zároveň zachovává soukromí dat a vlastnictví dat.

HPE přináší nová průlomová řešení AI pro urychlení modernizace dat jako první od okraje ke cloudu, což umožňuje škálování AI na globální aplikace průmyslové velikosti. Vyrábíme AI, která je řízená daty, orientována na produkci a podporuje cloud – dostupná kdykoli, kdekoli a v jakémkoli měřítku. Naše řešení podporují současné podniky i finanční služby, zdraví a vědy o životě a výroba. HPE Swarm Learning přináší vaší firmě decentralizovaný rámec chránící soukromí pro provádění trénování modelu strojového učení u zdroje dat

¹Analýza z 13. dubna 2022 konkurenčních nabídek, které si nárokují ochranu soukromí, zjistila, že používají federovanou architekturu závislou na centrálním serveru.

Zvýšení přesnosti modelu umělé inteligence a snížení zkreslení modelu pomocí swarm learning Sponzorovaný obsah od HPE

Překonávání výzev centralizovaného přístupu ke strojovému učení

Detekce nemocí ve zdravotnictví

Detekce podvodů s kreditními kartami v bankovnictví

Související

Co činí chytré hodinky hodným investice v roce 2025

Are Baby Carriers Safe? Expert Tips for Parents

How to Fold Baby Trend Stroller: A Beginner’s Guide