Digitální design našich každodenních počítačů je dobrý pro čtení e-mailů a hraní her, ale dnešní počítače, které řeší problémy, pracují s obrovským množstvím dat. Schopnost ukládat a zpracovávat tyto informace může vést k omezení výkonu v důsledku způsobu konstrukce počítačů.
Příští počítačovou revolucí může být nový druh hardwaru, nazvaný zpracování v paměti (PIM), nové výpočetní paradigma, které spojuje paměť a procesorovou jednotku a provádí své výpočty s využitím fyzických vlastností stroje – ne 1s nebo 0s potřebné k digitálnímu zpracování.
Na Washingtonské univerzitě v St. Louis výzkumníci z laboratoře Xuana "Silvia" Zhanga, docenta v Preston M. Green Department of Electrical & Systémové inženýrství na McKelvey School of Engineering navrhlo nový obvod PIM, který přináší flexibilitu neuronových sítí pro práci s PIM. Obvod má potenciál zvýšit výkon PIM počítání řádově nad jeho současné teoretické možnosti.
Jejich výzkum byl publikován online 27. října v časopise IEEE Transactions on Computers. Práce vznikla ve spolupráci s Li Jiangem na Shanghai Jiao Tong University v Číně.
Tradičně navržené počítače jsou postaveny pomocí Von Neumanovy architektury. Část tohoto návrhu odděluje paměť – kde jsou uložena data – a procesor – kde se provádí skutečné výpočty.
reklama"Výzvy v oblasti výpočetní techniky jsou dnes náročné na data," řekl Zhang. "Potřebujeme krotit tuny dat, což vytváří problémové hrdlo výkonu na rozhraní procesoru a paměti."
Počítače PIM se snaží tento problém obejít sloučením paměti a zpracování do jedné jednotky.
Výpočetní technika, zejména výpočetní technika pro dnešní algoritmy strojového učení, je v podstatě složitá – extrémně složitá – série sčítání a násobení. V tradiční digitální centrální procesorové jednotce (CPU) se to provádí pomocí tranzistorů, což jsou v podstatě napěťově řízená hradla, která buď umožňují, aby proud protékal, nebo netekl. Tyto dva stavy představují 1 a 0. Pomocí tohoto digitálního kódu -- binárního kódu -- může CPU provádět jakoukoli aritmetiku potřebnou k tomu, aby počítač fungoval.
Ten druh PIM, na kterém Zhangova laboratoř pracuje, se nazývá odporová paměť s náhodným přístupem PIM nebo RRAM-PIM. Zatímco v CPU jsou bity uloženy v kondenzátoru v paměťové buňce, počítače RRAM-PIM spoléhají na rezistory, odtud název. Tyto odpory jsou pamětí a procesorem.
Bonus? "V odporové paměti nemusíte překládat do digitální nebo binární podoby. Můžete zůstat v analogové doméně." To je klíč k tomu, aby byly počítače RRAM-PIM mnohem efektivnější.
reklama"Pokud potřebujete přidat, propojíte dva proudy," řekl Zhang. "Pokud potřebujete násobit, můžete upravit hodnotu odporu."
V určitém okamžiku je však nutné informace převést do digitálního formátu, aby se propojily s technologiemi, které známe. To je místo, kde RRAM-PIM narazil na své úzké hrdlo - převod analogových informací do digitálního formátu. Poté Zhang a Weidong Cao, postdoktorandský výzkumný spolupracovník v Zhangově laboratoři, představili neurální aproximátory.
"Nervový aproximátor je postaven na neuronové síti, která může aproximovat libovolné funkce," řekl Zhang. Vzhledem k jakékoli funkci může neuronový aproximátor vykonávat stejnou funkci, ale zlepšit její účinnost.
V tomto případě tým navrhl obvody neurálního aproximátoru, které by mohly pomoci odstranit úzké hrdlo.
V architektuře RRAM-PIM, jakmile rezistory v příčném poli provedou své výpočty, jsou odpovědi převedeny do digitálního formátu. V praxi to znamená sčítání výsledků z každého sloupce rezistorů v obvodu. Každý sloupec vytváří dílčí výsledek.
Každý z těchto dílčích výsledků musí být následně převeden na digitální informace, což se nazývá analogově-digitální konverze nebo ADC. Přeměna je energeticky náročná.
Nervový aproximátor zefektivňuje proces.
Místo přidávání jednotlivých sloupců po jednom může obvod neuronového aproximátoru provádět více výpočtů – po sloupcích, napříč sloupci nebo jakýmkoli způsobem, který je nejúčinnější. To vede k menšímu počtu ADC a zvýšené výpočetní efektivitě.
Nejdůležitější částí této práce, řekl Cao, bylo určení, do jaké míry by mohly snížit počet digitálních konverzí probíhajících podél vnějšího okraje obvodu. Zjistili, že obvody neurálního aproximátoru zvýšily účinnost, jak jen to bylo možné.
"Bez ohledu na to, kolik analogových dílčích součtů vygenerují sloupce křížového pole RRAM - 18 nebo 64 nebo 128 - potřebujeme pouze jeden analogově digitální převod," řekl Cao. "Použili jsme hardwarovou implementaci k dosažení teoretické spodní hranice."
Inženýři již pracují na rozsáhlých prototypech počítačů PIM, ale čelí několika výzvám, řekl Zhang. Použití Zhangových a Caových neurálních aproximátorů by mohlo odstranit jednu z těchto výzev – úzké hrdlo, což dokazuje, že toto nové výpočetní paradigma má potenciál být mnohem výkonnější, než naznačuje současný rámec. Nejen jednou nebo dvakrát výkonnější, ale 10krát nebo 100krát silnější.
"Naše technologie nám umožňuje dostat se o krok blíže k tomuto druhu počítačů," řekl Zhang.