Význam
Vědci i manažeři se zabývali otázkou, zda a pokud ano, za jakých podmínek skupiny interagujících řešitelů problémů překonávají autonomní jedince. Zde popisujeme experiment, ve kterém byli jednotlivci a skupiny hodnoceni na sérii úloh různé složitosti. Zjistili jsme, že skupiny jsou stejně rychlé jako nejrychlejší jednotlivci a efektivnější než nejvýkonnější jednotlivci, když je úkol složitý, ale ne, když je úkol jednoduchý. Poté přesně kvantifikujeme synergické zisky a ztráty procesu spojené s interagujícími skupinami a zjistíme, že rovnováha mezi těmito dvěma závisí na složitosti. Naše studie má potenciál uvést do souladu protichůdná zjištění o skupinové synergii v předchozí práci.
Abstraktní
Složitost – definovaná počtem komponent a povahou vzájemných závislostí mezi nimi – je jasně relevantním rysem všech úkolů, které skupiny provádějí. Role, kterou hraje složitost úkolů při určování výkonu skupiny, však zůstává nedostatečně pochopena, částečně proto, že neexistuje žádný jasný jazyk, který by složitost vyjádřil způsobem, který by umožňoval přímé srovnání mezi úkoly. Zde se tomuto analytickému problému vyhneme tím, že určíme třídu úkolů, u nichž lze složitost systematicky měnit, přičemž všechny ostatní prvky úkolu zůstanou nezměněny. Poté jsme testovali účinky složitosti úkolu v předem registrovaném dvoufázovém experimentu, ve kterém bylo 1200 jednotlivců hodnoceno na sérii úkolů různé složitosti (fáze 1) a poté náhodně přiděleni k řešení podobných úkolů buď v interagujících skupinách, nebo jako nezávislí jednotlivci ( fáze 2). Zjistili jsme, že interagující skupiny jsou stejně rychlé jako nejrychlejší jednotlivci a efektivnější než nejvýkonnější jednotlivci pro složité úkoly, ale ne pro ty jednodušší. S využitím našich vysoce granulárních digitálních dat definujeme a přesně měříme ztráty skupinových procesů a synergické zisky a ukazujeme, že rovnováha mezi dvěma přepínači se projevuje na středních hodnotách složitosti úkolů. Nakonec jsme zjistili, že interagující skupiny generují více řešení rychleji a zkoumají prostor řešení šířeji než nezávislí řešitelé problémů, přičemž nalézají kvalitnější řešení než všichni, kromě osob s nejvyšším skóre.
Úkoly prováděné skupinami interagujících řešitelů problémů – ať už v reálném světě nebo v experimentálním prostředí – se liší v řadě dimenzí, které věrohodně ovlivňují výkon skupiny (1⇓⇓⇓⇓–6). V tomto článku se zaměřujeme na důležitou, ale empiricky podhodnocenou dimenzi úkolů, komplexnost, která je obecně chápána tak, že závisí na nejméně dvou faktorech: (i) počtu odlišných složek, které tvoří úkol, a (ii) počtu, síle a konfigurace vzájemných závislostí mezi těmito složkami (7⇓⇓⇓–11).
Intuitivně má složitost úkolů zřejmý význam pro výkon skupiny. Jinak by se dalo očekávat, že řešitelé problémů budou mít horší výkon u úloh, které mají více komponent nebo u kterých jsou interakce mezi komponentami hustší. Kromě toho by se také dalo očekávat, že složitost úkolů ovlivní skupinovou „synergii“, definovanou jako výkon přesahující to, co by se očekávalo u podobně velkého souboru jednotlivců pracujících nezávisle – neboli „nominální skupiny“ (12). V tomto případě je však méně zřejmé, jaký by byl směr účinku. Na jedné straně mohou interagující skupiny podávat lepší výkony ve srovnání s nominálními skupinami na komplexních úkolech, protože jsou schopny rozdělit úsilí (13), sdílet informace o vysoce kvalitních řešeních (14) nebo opravovat chyby (15). Na druhou stranu u složitějších úkolů mohou interagující skupiny zaznamenat ještě větší procesní ztráty – včetně sociálního povalování (16), skupinového myšlení (17) a mezilidských konfliktů (4) – možná proto, že složité úkoly kladou větší nároky na jednotlivé přispěvatele a nabízejí více příležitostí uvíznout v globálně suboptimálním lokálním optimu, což by mohlo vést ke zvýšenému stresu a nedostatečné výkonnosti ve srovnání s nominálními skupinami.
Hlavním problémem při řešení otázek o účincích složitosti úkolů je to, že ačkoli se koncept na vysoké úrovni zdá intuitivní, dosud nebyl dostatečně přesně zprovozněn, aby výzkumníkům umožnil kvantifikovat složitost různých typů úkolů, a proto vyrábět jablka. na jablka srovnání mezi nimi. Stávající operace jsou často samy o sobě složité. Například jeden model uvádí 27 faktorů přispívajících ke složitosti seskupených do 10 dimenzí složitosti (9), zatímco jiné modely jsou dostatečně doménově specifické, takže číselné rozdíly mezi různými typy úkolů je obtížné interpretovat (7). Kromě zmatku některé definice zdůrazňují objektivní složitost a odkazují pouze na vlastnosti úkolu, které lze měřit nezávisle na těch, kdo úkol provádějí, zatímco jiné zdůrazňují subjektivní složitost, složitost úkolu, jak ji zažívají ti, kdo to dělají (9, 11).
Těmto analytickým obtížím se zde vyhneme tím, že určíme třídu úkolů, u nichž lze složitost systematicky měnit, přičemž všechny ostatní prvky úkolu zachováme pevně dané. Tímto způsobem můžeme snadno měřit výkon jako funkci zvyšující se složitosti, aniž bychom se museli obávat nejasností vyplývajících z jiných aspektů úkolu, jako je typ úkolu (3) nebo jiné vlastnosti skupinových procesů (4, 18). Kromě toho požadujeme, aby naše úkoly mohly být realisticky prováděny buď nezávisle, nebo společně, což umožňuje přímé srovnání mezi nominálními a interagujícími skupinami.
Třídou úkolů, které splňují tato kritéria, jsou problémy s omezením a optimalizací (CSOP), které jsou široce studovány v oblasti umělé inteligence a operačního výzkumu. Spojení s operačním výzkumem je užitečné, protože na rozdíl od jiných „hračkových“ problémů mapují CSOP relativně intuitivním způsobem řadu praktických problémů s alokací zdrojů a byly použity k modelování mnoha problémů, které jsou v praxi zajímavé. Příklady CSOP zahrnují personální softwarové projekty, kde existuje několik potenciálních úkolů od vývojářů k aktivitám k vyhodnocení (19); vytváření učebních skupin na základě určitých kritérií souvisejících s cíli spolupráce (20); železniční jízdní řády (21); a přidělování vakcín, ventilátorů a zdravotnického materiálu během pandemie COVID-19 (22). Kromě toho, zatímco CSOP zachycují důležité rysy skupinových cvičení pro řešení problémů v reálném světě, nevyžadují od účastníků speciální dovednosti. Výsledkem je, že účastníci mohou být rekrutováni z online služeb, což snižuje náklady a obtížnost koordinace simultánní účasti skupin. Konečně, stejně jako u jiných komplexních problémů (14, 23⇓–25), lze výplatní funkci pro CSOP popsat jako drsné výkonnostní prostředí, kde každý bod na krajině představuje kombinaci potenciálně vzájemně závislých voleb (řešení problému) , zatímco výška bodu představuje výkon této kombinace (26, 27). Proto lze CSOP charakterizovat několika lokálně optimálními, ale globálně suboptimálními řešeními (26, 27), a proto jsou přístupné potenciálně mnoha strategiím a stylům řešení bez jediné univerzálně lepší strategie (28).
Konkrétní CSOP, který jsme studovali, je problém přidělování místností, ve kterém účastníci – buď jako jednotlivci, nebo ve skupinách – přidělují N studentů do M místností, kde každý student má pro každou místnost určenou službu (příloha SI, část 1.1). Cílem úkolu je maximalizovat celkovou užitečnost studentů a zároveň respektovat omezení Q (např. „Studenti A a J nesmějí sdílet místnost nebo být v sousedních místnostech“). Když se úkol provádí ve skupinách, mohou účastníci komunikovat prostřednictvím textového chatu a současně přesouvat různé studenty, a tak provádět paralelní zpracování, pokud se tak rozhodnou. Pro naše účely je kritické, že složitost úkolu lze systematicky měnit úpravou pouze tří klíčových parametrů: počtu studentů , počtu místností a počet omezení . Významnou výhodou tohoto úkolu (a CSOP obecně) oproti úkolům, které se častěji studují v nastavení skupinového výkonu, je skutečně to, že jeho složitost lze kvantifikovat z hlediska doby běhu, kterou algoritmický řešitel potřebuje k nalezení optimálního řešení, což umožňuje nám umožňuje snadno seřadit instance úloh podle složitosti (další podrobnosti viz Materiály a metody). Obr. 1 ilustruje, jak se může složitost měnit mezi dvěma případy problému přiřazení místnosti. V případě nízké složitosti musí být šest studentů přiděleno do čtyř pokojů s pouze dvěma omezeními („B a E musí být sousedé“ a „C a F nemohou bydlet ve stejné místnosti“). V případě vysoké složitosti musí být 18 studentů přiděleno do 8 místností s 18 omezeními.
Ilustrace úkolu přiřazení místnosti. Úkol vyžadoval přidělení N studentů do M místností tak, aby se maximalizovala celková užitečnost studentů, z nichž každý má pro každou místnost určenou užitečnost, a zároveň respektuje Q omezení. Složitost úkolu je charakterizována počtem studentů, kteří mají být přiděleni , počtem dostupných pokojů na koleji a počtem omezení . (Nahoru) Případ s nízkou složitostí, ve kterém má být šest studentů přiděleno do čtyř pokojů se dvěma omezeními. (Dole) Velmi složitý případ, ve kterém má být 18 studentů přiděleno do 8 místností s 18 omezeními. Podrobnosti viz příloha SI, oddíl S1.1 a příloha SI, obr. S1–S2, pro snímky obrazovky rozhraní úlohy.
Návrh experimentu
V tomto článku testujeme hypotézu, že složitost úkolů zmírňuje relativní výkon skupinového vs. individuálního řešení problémů. Za tímto účelem se zabýváme následující otázkou: jak závisí rovnováha mezi procesními ztrátami a synergickými zisky v interagujících skupinách na složitosti úkolu?
Náš experiment probíhal ve dvou fázích. Ve fázi 1 1 200 účastníků individuálně dokončilo pět úkolů přiřazení místnosti: tři úkoly s velmi nízkou a dva středně složité úkoly (příloha SI, tabulka S1) a také standardní test Čtení mysli v očích (příloha SI, část S1.2 a obr. S3), který se běžně používá jako měřítko sociální vnímavosti a byl použit v několika nedávných studiích týkajících se sociální vnímavosti ke skupinovému výkonu (18, 29⇓⇓–32).
Po dokončení fáze 1 jsme obodovali všechny účastníky na úrovni dovedností a sociální vnímavosti, abychom je mohli zařadit do experimentálních bloků ve fázi 2 (příloha SI, část 1.4 a obr. S4). Zohledněním těchto vlastností v našem postupu blokové randomizace ve fázi 2 bychom mohli zajistit, aby různé úrovně dovedností a sociální vnímavosti (a jejich kombinace) byly vyváženy napříč skupinou a individuálními pracovními uspořádáními. Hlavním účelem schématu blokové randomizace bylo převzorkování statisticky méně frekventovaných kombinací (např. všichni členové skupiny mající vysoké dovednosti nebo vysokou sociální vnímavost), čímž se zvýšila statistická síla našich experimentů. Poznamenáváme, že se zde zaměřujeme na srovnání interagujících a nominálních skupin, nikoli na kompoziční rozdíly mezi interagujícími skupinami; naše analýza účinků úrovně dovedností a sociální vnímavosti na výkon bude tedy zveřejněna jinde (podle naší předběžné registrace).
Stejných 1 200 účastníků bylo pozváno k účasti ve fázi 2 a prvních 828 účastníků, kteří se dostavili a prošli kontrolami pozornosti (podle naší předběžné registrace; velikosti vzorků viz příloha SI, tabulka S2), bylo přiděleno druhému sekvence pěti úkolů přiřazení místnosti (posloupnost úkolů byla náhodná), rovněž různé složitosti (velmi nízká, nízká, střední, vysoká a velmi vysoká; příloha SI, tabulka S3 a obr. S5). Všechny úkoly vypršely po 10 minutách ve fázi 2, bez ohledu na složitost. Na základě dovedností a sociální vnímavosti každého účastníka měřené ve fázi 1 jsme nejprve každého jednotlivce zařadili do bloků (např. vysoká dovednost, vysoká sociální vnímavost; smíšená dovednost, vysoká sociální vnímavost atd.). Dále byli v rámci každého bloku účastníci randomizováni podle jedné ze dvou podmínek: podmínka interakce ve skupině ( účastníků, kteří vytvořili 197 skupin velikosti 3; údaje pro 1 skupinu jsou neúplné, což vedlo k počtu platných interagujících skupin je 196), ve kterých členové skupiny řešili problém kolektivně a mohli spolu komunikovat prostřednictvím textového chatu; a nezávislá individuální podmínka ( účastníků; údaje od 3 jednotlivců jsou neúplné, což vede k počtu platných nezávislých osob 234), kdy každý účastník pracoval na přiděleném úkolu sám. Všechny zde uvedené výsledky jsou z fáze 2 experimentu.
Hodnocení výkonu.
Ve fázi 2 jsme použili tři metriky k zachycení výkonu v instanci úkolu přiřazení místnosti: (1) normalizované skóre, definované jako skutečné skóre získané v instanci úkolu děleno maximálním možným skóre pro daný úkol; (2) trvání (nebo čas do dokončení), definované jako čas, který uplynul od začátku úkolu do předložení řešení (nebo do vypršení časového limitu úkolu po 10 minutách); a konečně (3) účinnost, definovaná jako normalizované skóre dělené dobou trvání.
Všechny tři metriky jsou přirozené ukazatele výkonu, které lze za určitých okolností optimalizovat. Při absenci časových omezení je například normalizované skóre zřejmým měřítkem kvality řešení. Naproti tomu doba trvání je vhodná, když je čas na řešení problému důležitější než kvalita (např. rychle přijít s přiměřeně dobrým plánem alokace zdrojů v reakci na katastrofu), a efektivita je vhodná, když je důležitá jak kvalita, tak rychlost (např. ve vývoji produktů).
Po předchozí práci (12, 33⇓⇓⇓–37) hodnotíme výkonnost skupiny ve srovnání s tzv. nominálními skupinami, které jsou definovány jako podobně velký soubor autonomních jedinců. Nominální skupiny poskytují užitečné měřítko pro interagující skupiny, protože představují rozdílnou dostupnost zdrojů mezi skupinami a jednotlivci (12); to znamená, že se přizpůsobují množství intelektuálních zdrojů, které by skupiny mohly přinést (tj. pracovní doba) a matematické pravděpodobnosti, že alespoň jeden člen mohl dosáhnout stejného výkonu. Interaktivní skupinový výkon nad rámec nominální skupiny lze tedy připsat skupinové interakci, nikoli větším zdrojům.
Obecně platí, že srovnání mezi interagujícími skupinami a ekvivalentně velkými nominálními skupinami nalezlo smíšené důkazy o synergických účincích (12): zatímco interagující skupiny často překonávají průměrného člena nominální skupiny (slabá synergie), zřídkakdy překonávají nejlepšího člena ( silná synergie). S ohledem na tento rozdíl porovnáváme naše interagující skupiny se čtyřmi výkonnostními benchmarky, z nichž každá odpovídá odlišné nominální skupině vytvořené náhodným vylosováním tří jedinců ze stejného bloku bez náhrady. První benchmark odpovídá výkonnostnímu skóre pro náhodně vybraného člena nominální skupiny (ekvivalent průměrného jednotlivce), zatímco zbývající tři odpovídají jednotlivci s nejlepším výkonem fáze 1 v každé ze tří výše definovaných metrik (tj. nejvyšší skóre, nejnižší trvání a nejvyšší účinnost). Nominální skupiny tedy simulují situaci, kdy manažer přidělí práci buď náhodnému jedinci, jedinci s nejvyšším skóre, nejrychlejšímu jedinci nebo nejúčinnějšímu jedinci, jak je posuzováno podle výkonu v minulosti (tj. skóre fáze 1, trvání a účinnost).
Výsledky
Výkon jako funkce složitosti úkolu.
Obr. 2 ukazuje, jak se výkon měnil v závislosti na složitosti úlohy. Za všech podmínek vedla vyšší složitost úkolu k nižšímu normalizovanému skóre (obr. 2A), delšímu trvání (obr. 2B), a tedy nižší účinnosti (obr. 2C). Tyto výkonnostní trendy platí i při samostatném měření pro interagující a nominální skupiny (příloha SI, část S2 a obr. S7). V průměru strávili jednotlivci a skupiny zhruba třikrát déle nejsložitějším úkolem než nejméně složitým úkolem, ale získali normalizované skóre, které bylo zhruba o 10 procentních bodů nižší. Vzhledem k tomu, že normalizované skóre bylo téměř vždy vyšší než 80, představuje tento poslední rozdíl zhruba 50 % efektivního rozsahu – velký účinek. Jasná monotónní závislost všech tří výkonnostních měřítek na složitosti je důležitá ze dvou důvodů. Za prvé, ověřuje náš návrh a ukazuje, že nárůst složitosti zachycený změnami parametrů úlohy N, M a Q se přímým způsobem převádí na složitost, kterou zažívají naši účastníci. Za druhé, nabízí značnou páku k testování naší předpovědi, že relativní výkon interagujících skupin oproti nominálním skupinám závisí na složitosti úkolu.
Změna složitosti úkolu přiřazení místnosti. Zvýšení složitosti úkolu (A) snižuje normalizované skóre, (B) zvyšuje čas potřebný k dokončení úkolu a (C) snižuje efektivitu. Data jsou kombinována napříč individuálními i skupinovými podmínkami ve všech šesti blocích. Chybové úsečky označují 95% intervaly spolehlivosti (některé nejsou dostatečně velké pro zobrazení). Skupiny a jednotlivci dosáhli alespoň 80 % maximálního skóre ve více než 85 % úkolů; efektivní rozsah pro normalizované skóre (tj. osa y A) je tedy mezi 80 a 100 %. Minimální čas potřebný k předložení řešení je 1 minuta a maximální 10 minut; efektivní rozsah pro dobu trvání (tj. osa y B) je mezi 1 a 10 minutami. Rozdíl v prožívané obtížnosti mezi velmi nízkou a velmi vysokou složitostí je velmi velký: průměrné normalizované skóre kleslo asi o 50 % efektivního rozsahu skóre (zhruba z 95 na 85 % na efektivní stupnici 80 až 100) a průměrný čas se zvýšil o 200 % (z 2 na 6 minut).
Důkaz pro skupinovou synergii.
Obr. 3 porovnává celkový standardizovaný výkon skupiny (transformovaný na skóre z v rámci každé úrovně složitosti úkolu) se čtyřmi nominálními definicemi skupiny: náhodný jedinec, jedinec s nejvyšším skóre, nejrychlejší jedinec a nejvýkonnější jedinec.
Porovnání výkonu z hlediska skóre (A), rychlosti (B) a účinnosti (C) napříč interagujícími skupinami a nominálními skupinami. Data jsou kombinována ve všech šesti blocích a standardizována (tj. transformována na skóre z) v rámci každé úrovně složitosti úlohy (rozdíly jsou relativní v rámci úrovně složitosti a neměly by se porovnávat mezi úrovněmi složitosti). Chybové úsečky označují 95% intervaly spolehlivosti. Zopakovali jsme analýzy uvedené na tomto obrázku pro každý blok s kvalitativně podobnými výsledky (příloha SI, část S3 a obrázky S8–S10).
Výkon jako kvalita řešení.
U všech úrovní složitosti úkolu ukazuje Obr. 3A, že skupiny mají vyšší skóre než náhodně vybraní, nejrychlejší a nejefektivnější členové nominálních skupin stejné velikosti ( P = 0,013, 95 % CI [0,026, 0,225]; P < 0,001, 95 % CI [0,184, 0,410]; P < 0,001, 95 % CI [0,155, 0,378];-) člen (P = 0,047, 95% CI [−0,159, −0,001]; regresní tabulky viz příloha SI, tabulky S4–S7). Tento výsledek je v souladu s dlouhodobými zjištěními (33⇓⇓⇓–37), že interagující skupiny často překonávají nominální skupiny, pokud jde o kvalitu řešení, pokud je standard stanoven kritériem průměrného člena (slabá synergie), ale nikoli, když je stanoven kritérium nejlepšího člena (silná synergie).
Výkon jako rychlost.
Obr. 3B ukazuje, že interagující skupiny dokončují složitější úkoly – ale ne jednodušší – rychleji než jak náhodní, tak členové s nejvyšším skóre v ekvivalentně velkých nominálních skupinách. Kromě toho jsou interagující skupiny stejně rychlé jako nejrychlejší a nejúčinnější členové při nejvyšší složitosti úloh (regresní tabulky viz příloha SI, tabulky S8–S10). Ty naznačují, že u úkolů s mnoha komponentami (studenti a místnosti) a hustými vzájemnými závislostmi (mnoho omezení) mohou výhody rozdělení práce do skupiny převážit procesní ztráty spojené s interagujícími skupinami, což je v souladu se zjištěními v předchozí práci ( 36).
Výkon jako efektivita.
Nakonec, obr. 3C ukazuje, že u nejsložitějších úkolů nárůst rychlosti převyšuje deficity ve skóre. Výsledkem je pozoruhodná interakce mezi složitostí úkolů a uspořádáním práce: zatímco interagující skupiny jsou podstatně méně efektivní než vybraní členové nominálních skupin na jednoduchých úkolech, jejich relativní efektivita se zvyšuje se složitostí úkolu, dokud nepřekonají ty s nejvyšším skóre, nejrychlejší a nejefektivnější. členy s nejvyšší složitostí (viz dodatek SI, tabulky S11–S13, regresní tabulky). Tento výsledek připomíná skupinové rozhodování mezi sociálním hmyzem, kde nedávná studie zjistila, že kolonie mravenců překonávají jednotlivé mravence, když je úkol diskriminace obtížný, ale nikoli, když je snadný (38).
Rozbalení skupinové synergie.
Zjištění, že interagující skupiny jsou efektivnější než nejlépe vybraní členové ekvivalentně velkých nominálních skupin – podle kterékoli z našich čtyř definic – když je úkol složitý, ale ne, když je úkol jednoduchý, naznačuje, že rovnováha mezi procesními ztrátami a synergickými zisky závisí na složitosti úkolu. Abychom lépe porozuměli této závislosti, a poznamenejme, že variace v efektivitě patrná na (obr. 2C) je více závislá na variaci trvání úkolu (která se pohybuje v průměru mezi 2 a 6 minutami, obr. 2B) než na variaci dosaženého skóre (který se pohybuje v průměru mezi 95 % a 85 %, obr. 2A), dále uvádíme průzkumnou analýzu času stráveného v každé fázi řešení úlohy. Tato analýza je možná díky vysoce granulované povaze našich dat. Protože každá akce provedená každým účastníkem je opatřena časovým razítkem, můžeme celkovou dobu řešení rozdělit do velmi přesně měřených segmentů, které odpovídají odlišným fázím procesu řešení problému. Pro přehlednost definujeme čtyři klíčové segmenty, schematicky znázorněné na obr. 4A:
Milníky dokončení úkolů. (A) Čtyři milníky v procesu řešení problému: (i) je vytvořeno první přechodné řešení, (ii) je vytvořeno nejlepší přechodné řešení, (iii) je vytvořeno konečné řešení a (iv) je vytvořeno konečné řešení předloženo. (B, D, F a H) Čas strávený (v minutách) skupinami a jednotlivci (ať už náhodný, s nejvyšším skóre, nejrychlejší nebo nejúčinnější) v každém časovém segmentu. (C, E, G a I) Standardizovaný čas strávený (transformovaný na skóre z; tj. ukazující relativní rozdíl v rámci úrovně složitosti) v každém časovém segmentu. Chybové úsečky označují 95% intervaly spolehlivosti.
Čas do prvního řešení, .
Čas od začátku úkolu do vygenerování prvního řešení lze považovat za čas strávený formulováním strategie přistoupit k úkolu.
Čas na nejlepší řešení, .
Nejlepší řešení nemusí být nutně to, které bylo odesláno, protože instance úkolu končí, až když se skupina/jednotlivec rozhodne odeslat řešení a skupiny/jednotlivci mohou vytvářet řešení po svém nejlepším řešení, aniž by se k němu vraceli.
Čas od nejlepšího ke konečnému řešení, .
Čas strávený mezi vygenerováním nejlepšího a konečným řešením, který lze považovat za „nadměrný průzkum“, snižuje efektivitu, protože vede k nižší (nebo stejné) kvalitě řešení, ale delšímu celkovému trvání úkolu.
Čas od konečného řešení do odevzdání, .
Čas strávený mezi vygenerováním konečného řešení a rozhodnutím o jeho předložení, který lze považovat za „ doba závazku“, může být dalším zdrojem neefektivity, protože vede ke stejné kvalitě řešení, ale prodlužuje celkovou dobu trvání úkolu.
Obr. 4 ukazuje dvě sady srovnání mezi interagujícími a nominálními skupinami pro každý z těchto čtyř segmentů. Obr. 4 B, D, F a H ukazují hrubé doby trvání pro , , a
Zaprvé pozorujeme, že (v průměru) interagující skupiny tráví méně času v (čas do prvního řešení, obr. 4 B a C) než členové nominálních skupin bez ohledu na složitost úkolu ( pro všechny a dodatek SI, tabulka S14). Domníváme se, že toto pozorování může souviset s argumenty z nedávných studií, že členství ve skupině snižuje pocit odpovědnosti a lituje, že členové mohou čelit za stejných okolností individuálně. Je-li správná, snížená emocionální bariéra k akci může být základním mechanismem, který pohání členy skupiny, aby jednali dříve (39).
Zadruhé pozorujeme znatelný vliv složitosti úkolu na (čas do nejlepšího řešení, obr. 4 D a E): interagující skupiny dosáhnou svého nejlepšího řešení pomaleji než ty nejrychlejší a nejúčinnější členové nominálních skupin pro nejméně složitý úkol, ale rychlejší pro nejsložitější úkol (P < 0,001, 95% CI [0,119, 0,385] a [0,109, 0,371], v tomto pořadí, při nejnižší složitosti a P < ; 0,001, 95 % CI [-0,351, -0,085] a [-0,370, -0,108], v tomto pořadí, při nejvyšší složitosti; regresní tabulky viz přílohy SI tabulky S17–S18). Důležité je, že jsme zaznamenali, že většinu doby trvání úkolu strávíme v tomto segmentu, což naznačuje, že rychlost k nejlepšímu řešení je hlavním přispěvatelem k synergii skupiny. Jedním z potenciálních vysvětlení, proč jsou interagující skupiny rychlejší při hledání nejlepšího řešení při vysoké složitosti, je to, že interagující skupiny realizují určité výhody dělby práce (viz příloha SI, oddíl S4 a obr. S11, kde jsou sugestivní důkazy). Dalším možným vysvětlením, pro které vidíme některé neoficiální důkazy v protokolech chatu (příloha SI, obr. S11), je, že interagující skupiny jsou ochotnější uspokojit tím, že akceptují aktuálně dostupné řešení jako uspokojivé (40). Další může být, že mají prospěch z tahu, kdy jedna osoba je primárně aktivní, zatímco ostatní zvažují svůj další krok (y). Bohužel, současný design experimentu nám neumožňuje rozlišovat mezi těmito alternativními vysvětleními, a proto zůstávají spekulativní.
Za třetí, pozorujeme, že bez ohledu na složitost tráví interagující skupiny více času v segmentu (nadměrné zkoumání, obr. 4 F a G) vzhledem k členům nominálních skupin; stejně jako u je rozdíl konzistentní napříč úrovněmi složitosti (viz dodatek SI a tabulky S19–S20 pro regresní tabulky). Za čtvrté, interagující skupiny také tráví více času zavázáním se k řešení () než vybraní členové nominálních skupin, opět bez ohledu na složitost (obr. 4, příloha H a I a SI, tabulka S14) . Spekulujeme, že skutečnost, že interagující skupiny mohou komunikovat prostřednictvím chatu (a postrádají přiděleného vůdce), může zvýšit tlak na skupiny, aby zajistily, že jejich rozhodnutí budou přijímána kolektivně (tj. dosažení konsensu), což by mohlo přispět k pozorovanému efektu.
Za páté, pozorujeme, že průměrná celková doba trvání úkolu se pohybuje od min při velmi nízké složitosti do min při velmi vysoké složitosti (z maxima 10 minut), což znamená, že účastníci obvykle odešlou řešení a ukončí instanci úlohy dříve, než vyprší čas. Toto pozorování je relevantní pro naši analýzu v tom, že naše srovnání výkonu interagujících skupin s výkony vybraných členů nominálních skupin není ovlivněno časovým omezením.
Shrneme-li, obr. 4 odhaluje dva typy procesních ztrát (tj. čas navíc strávený nadměrným průzkumem a dosahováním konsensu) a dva typy synergií (tj. rychlejší čas na první řešení a rychlejší čas na nejlepší řešení u složitých úkolů ). Je zajímavé, že zatímco synergie – konkrétně v době k nejlepšímu řešení – závisí na složitosti úkolu, ztráty procesu nikoli. Jinými slovy, naše zjištění naznačují, že přítomnost v interagující skupině má fixní náklady, které jsou relativně konzistentní na různých úrovních složitosti úkolů, ale přínos, který se liší na různých úrovních složitosti (tj. méně času stráveného hledáním nejlepšího řešení).
Abychom toto zjištění dále objasnili, dále agregujeme náklady a přínosy, abychom kvantifikovali hodnotu provedení úkolu v interagující skupině napříč úrovněmi složitosti. Konkrétně měříme každý náklad a přínos jako absolutní rozdíl, pokud jde o čas strávený, mezi interagujícími skupinami a náhodným (tj. průměrným) členem nominálních skupin v každém časovém segmentu:
Obr. 5 ukazuje, že celkové náklady spojené s neefektivností interagujících skupin (tj. nadměrný průzkum, dosahování konsenzu) převyšují synergické přínosy (tj. zrychlení při hledání nejlepšího řešení) při řešení úloh s nízkou složitostí, ale ne s vysokou složitostí. To vysvětluje naše zjištění, že skupiny jsou efektivnější než členové s nejvyšším skóre, nejrychlejší a nejefektivnější členové ekvivalentně velkých nominálních skupin, když je úkol složitý, ale že tento vztah je obrácený, když je úkol jednoduchý. Podobné výsledky nacházíme pro srovnání členů s nejvyšším skóre (příloha SI, část S5 a obr. S12).
Cena a přínos interagujících skupin. Obrázek ilustruje absolutní rozdíl ve smyslu průměrného času stráveného mezi interagujícími skupinami a průměrnou individuální nominální skupinou v každém časovém segmentu.
Zkoumání rozdílů v přístupech k řešení problémů.
Shrneme-li naše hlavní výsledky, interagující skupiny jsou efektivnější než dokonce i nejúčinnější členové nominálních skupin pro problémy s vysokou složitostí; proto jsme dospěli k závěru, že vykazují silnou synergii pro účinnost (obr. 3C). Pokud jde o rychlost, interagující skupiny jsou rychlejší než průměrný (náhodně vybraný) člen a stejně rychle jako nejrychlejší člen ekvivalentně velkých nominálních skupin (obr. 3B), čímž vykazují pouze slabou synergii. Pokud jde o kvalitu řešení, interagující skupiny vykazují ještě slabší synergii, protože dosahují vyššího skóre než průměrný člen, ale ne tak dobře jako člen s nejvyšším skóre z nominálních skupin (obr. 3A).
Abychom tyto výsledky dále prozkoumali, zkoumali jsme počet a tempo generovaných přechodných řešení, kde přechodné řešení je definováno jako přiřazení studentů k místnostem (tj. každá akce provedená účastníkem generuje přechodné řešení). Jak je znázorněno na obr. 6 A a B, pozorujeme, že skupiny nejen generovaly více přechodných řešení než náhodní, nejrychlejší a nejefektivnější členové ekvivalentně velkých nominálních skupin ( pro všechny, 95% CI , , a v tomto pořadí;příloha SI, tabulka S23); udělali to také ve vyšší míře ( pro všechny, 95% CIs , , a , v tomto pořadí; příloha SI, tabulka S23). Interaktivní skupiny také vykazovaly širší rádius řešení, definovaný jako maximální editační vzdálenost (tj. počet rozdílů v přiřazení student/místnost) mezi prvním úplným řešením (tj. všichni studenti přiřazení k místnostem, ale konflikty mohou být nevyřešené) a všemi následujícími kompletní řešení, což naznačuje, že zkoumali prostor řešení šířeji (obr. 6C; pro všechny, 95% CIs , , , respektive ; příloha SI, tabulka S23). Tento kvalitativní závěr jsme také potvrdili pomocí dvou dalších měřítek průzkumu: procento řešení v rámci editační vzdálenosti dvou konečného řešení a procento mezilehlých řešení, která zahrnovala porušení omezení (příloha SI, obr. S13 a S14).
Mechanické rozdíly v přístupech k řešení problémů mezi interagujícími skupinami a jednotlivci. Interaktivní skupiny generují (A) více řešení, (B) rychleji a (C) zkoumají prostor řešení šířeji. (D) Kvalita nejlépe nalezeného řešení (ať již předloženo či nikoli) však není lepší než řešení, které nalezly nominální skupiny jednotlivců s nejvyšším skóre. Chybové úsečky označují 95% intervaly spolehlivosti.
Ve světle těchto pozorování je o to překvapivější, že interagující skupiny nenašly kvalitnější řešení než člen nominálních skupin s nejvyšším skóre (obr. 6D; ; Příloha SI, tabulka S23). Částečně lze tuto mezeru vysvětlit tím, že interagující skupiny také nedokážou předložit své nejlépe nalezené řešení rychleji než jednotlivec s nejvyšším skóre: jednotlivec s nejvyšším skóre ve všech složitostech nepředloží své nejlépe nalezené řešení času, zatímco interagující skupiny nepředloží svá nejlepší řešení času (; rozdíl v proporcích). V důsledku toho byla předložená řešení interagujících skupin ve srovnání s jednotlivými členy s nejvyšším skóre horší, než kdyby každý předložil své nejlépe nalezené řešení (srovnej obr. 3A s obr. 6D), i když i tak zůstává určitá mezera.
Co může vysvětlit kombinaci silné synergie v efektivitě a pouze slabé synergie pro kvalitu a rychlost řešení? Dřívější výzkum, který konceptualizuje řešení problémů jako adaptivní vyhledávání v drsném prostředí výkonu (14, 27), kde každý bod na krajině představuje jedno řešení zadání místnosti a výška bodu představuje výkon tohoto úkolu, poskytuje několik, možná vzájemně související, vysvětlení. Jedním z potenciálních vysvětlení je, že jedinci s nejvyšším skóre mají lepší reprezentace (nízkorozměrné aproximace) skutečného výkonu, což jim umožňuje vyhodnocovat řešení (a trajektorie řešení) offline, aniž by je testovali pomocí experimentů (41, 42). Lepší reprezentace mohou vést k přesnějším offline vyhodnocením a efektivnějšímu hledání (26, 43, 44), které se vyznačují menším počtem přechodných řešení a vyšší kvalitou řešení. Alternativně mohou mít skupiny řešitelů problémů protichůdné zájmy (např. maximalizace skóre vs. minimalizace trvání) a tudíž různé vize správného postupu (45). Pokud je to pravda, skupiny mohou těžit z centrální koordinace přidělením vedoucího skupiny (45) nebo z intervencí souvisejících s procesem, jako je vynucování občasných přestávek v interakci (46, 47). Ještě další možností je, že když je čas omezený, mohou se strategie vyhledávání, které umožňují rychlé vítězství (tj. strmé zlepšení výkonu na začátku) a snižují množství průzkumu, jevit jako lepší (26). Proto, zatímco strategie vyhledávání prohlubující místní cestu (např. lezení do kopce) přijatá členy s nejvyšším skóre v ekvivalentně velkých nominálních skupinách může poskytnout krátkodobé výkonnostní výhody, strategie interagujících skupin spočívající v rozšíření vyhledávací domény může být výhodnější. dlouhodobě (48, 49).
Diskuse
U mnoha zajímavých úkolů se manažeři mohou rozhodnout, zda přidělí úkol interagující skupině nebo srovnatelnému počtu jednotlivců pracujících nezávisle (12). Pro nastavení, jako je tato, naše výsledky nabízejí několik postřehů. Za prvé, rozhodnutí o tom, jak přidělit práci – interagujícím skupinám nebo nominálním skupinám – by měla záviset na složitosti daného úkolu a způsobu hodnocení výkonu. Například, pokud chtěl manažer najít funkční řešení pro CSOP v co nejkratším čase, doporučení by bylo požádat skupinu, aby problém vyřešila, když je problém složitý, ale požádat nezávislé řešitele problému, když je to jednoduché. Je pozoruhodné, že zde prezentované výsledky trvání a účinnosti mohou ve skutečnosti podceňovat, jak by to fungovalo v praxi. Například, pokud by byla práce organizována v nominálních skupinách, toto uspořádání by stále produkovalo několik různých řešení, mezi kterými by se některý manažer mohl rozhodnout. Přestože naše operacionalizace nominálních skupin simulovala situaci, ve které manažer činí rozhodnutí okamžitě, existují okolnosti, kdy manažer může chtít zvážit výhody různých řešení, což by zabralo nenulovou dobu. To není případ interagujících skupin, kde je rozhodovací proces již zahrnut do uplynulého času cvičení řešení problému.
Zadruhé, naše zjištění také naznačují, že možným vysvětlením, proč ztráty skupinových procesů figurovaly ve výzkumných zjištěních výrazněji než synergické zisky (12), je to, že laboratorní studie skupinového výkonu obecně spoléhají na velmi jednoduché úkoly. Dosud nejjasnější laboratorní důkazy o vynikajícím výkonu skupiny, i když vzácné, pocházejí ze skupin pracujících na relativně složitých úkolech (13, 46, 50, 51); nicméně skutečnost, že složitost úkolů se v rámci jedné studie systematicky neměnila, představuje hlavní zdroj nekontrolovaných variací v minulých výzkumech (17, 36).
Za třetí, naše analýza toho, jak se vzájemně spolupracující skupiny a nezávislí jednotlivci liší v čase, který stráví během různých částí procesu řešení problémů, nabízí pohled na to, jak by bylo možné skupinové procesy zlepšit. Například naše zjištění, že skupiny tráví více času rozhodováním, že úkol byl dokončen (tj. dosažením konsensu), naznačuje, že přidělení vedoucího skupiny se schopností jednostranně učinit toto rozhodnutí, jak to dělá jednotlivec, by mělo snížit tento zdroj zpoždění. , čímž se zlepší výkon skupiny. Navíc naše zjištění, že interagující skupiny s menší pravděpodobností předloží své nejlepší řešení, naznačuje, že uložení jejich nejlepších řešení tak, aby je bylo možné znovu načíst a případně upravit v následujících krocích (všudypřítomná funkce softwaru pro osobní produktivitu), by také mělo zlepšit jejich výkon ( 46).
Za čtvrté, naše analýza dynamiky řešení skupin vs. jednotlivci vyvolává další hádanky pro budoucí práci. Zejména pokud skupiny generují více řešení rychleji a efektivněji v širším rozsahu prostoru řešení než dokonce i jednotlivci s nejvyšším skóre, proč nenajdou lepší řešení?
Nakonec docházíme k závěru, že vědě o skupinovém výkonu by prospělo hlubší, systematičtější zhodnocení podobností a rozdílů mezi úkoly, které mají skupiny plnit, a to jak v laboratoři, tak v terénu. Je potřeba komplexní, empiricky podložená teorie skupinových úkolů (12). Výzkumný program, který systematicky měnil typy úkolů spolu s povolenými skupinovými procesy a dalšími kontextovými faktory, by posunul základní vědu o skupinovém řešení problémů a zároveň by se zabýval praktickými aplikacemi.
Materiály a metody
Studie byla přezkoumána Poradním výborem pro etiku výzkumu společnosti Microsoft a schválena Radou pro hodnocení výzkumných institucí společnosti Microsoft (MSR IRB; Schválení 0000019). Všichni účastníci poskytli výslovný souhlas s účastí v této studii a MSR IRB schválila postup souhlasu. Náš experimentální design, velikost vzorku a analýzy porovnávající výkon napříč interagujícími skupinami a nominálními skupinami byly před sběrem dat předem zaregistrovány (AsPredicted 13123). Všechny ostatní analýzy jsou průzkumné.
Algorithmic Solver.
Každý problém přiřazení místnosti jsme modelovali jako problém programování se smíšenými celými čísly a pomocí softwaru IBM ILOG CPLEX Optimization Studio jsme vygenerovali dobu běhu pro počítače k vyřešení každého problému. je vysoce výkonný matematický programovací řešič pro lineární programování, smíšené celočíselné programování a kvadratické programování. Software běžel na notebooku s mikroprocesorem Intel Core i5 pracujícím na rychlosti 2,6 GHz. Spustili jsme software pomocí výchozí konfigurace parametrů. Jednotkou doby běhu v souboru úlohy jsou „ticks“, což je jednotka CPLEX pro měření množství vykonané práce. Korespondence tiků s časem hodin se na různých platformách (včetně hardwaru, softwaru, zatížení stroje atd.) liší, ale vzhledem k problému programování se smíšenými celými čísly a nastavením parametrů jsou tiky potřebné k vyřešení problému deterministické. V tomto smyslu je spolehlivost test-retest algoritmického řešiče 1. Další podrobnosti viz dodatek SI, oddíl 1.4.2.
Statistická analýza.
Protože každá interagující skupina (nebo jednotlivec) dokončila pět úkolů přiřazení místnosti, provedli jsme testy na rozdíly mezi podmínkami na úrovni úkolu. Pro interakční efekty jsme data modelovali pomocí zobecněného lineárního smíšeného modelu pro každý výsledek (např. skóre, trvání a účinnost) s náhodným efektem pro skupinu nebo individuální identifikátor. Tyto modely zohledňují vnořenou strukturu dat. Všechny statistické testy byly dvoustranné (podle naší předregistrace). Podrobnosti o statistických testech jsou v příloze SI, oddíl S7.
Standardizované koeficienty.
Abychom umožnili smysluplné srovnání velikostí efektů u úkolů různé úrovně složitosti, standardizujeme různé metriky výkonu (např. skóre, trvání, účinnost a počet řešení) v každé úrovni složitosti. Například standardizovaná hodnota měření X, měřená pro instanci úlohy i o složitosti c, je definována jakokde je definována jako střední hodnota X napříč všemi instancemi úlohy při složitosti c (pro interagující a nominální skupiny), a je SD.
Dostupnost dat
Data a kód replikace jsou k dispozici na Harvard Dataverse, https://doi.org/10.7910/DVN/RP2OCY (52). Experiment byl vyvinut pomocí platformy Empirica (53). Zdrojový kód úkolu přiřazení místnosti lze nalézt na https://github.com/amaatouq/room-assignment-csop a zdrojový kód testu Reading the Mind in the Eyes lze nalézt na https://github .com/amaatouq/rme-test.
Poděkování
Děkujeme Valery Yakubovich, Hazhir Rahmandad a James Houghton za jejich užitečné diskuse a zpětnou vazbu. Autoři děkují Nadaci Alfreda P. Sloana (G-2020-13924) za finanční podporu.
Poznámky pod čarou
Příspěvky autorů: A.A., M.Y. a D.J.W. navržený výzkum; A.A., M.Y. a D.J.W. provedený výzkum; A.A., M.A., M.Y. a D.J.W. přispěli novými činidly/analytickými nástroji; A.A., M.A., M.Y. a D.J.W. analyzovaná data; a A.A., M.A., M.Y. a D.J.W. napsal papír.
Autoři neprohlašují žádný konkurenční zájem.
Tento článek je přímým podáním PNAS.
Tento článek obsahuje podpůrné informace online na https://www.pnas.org/lookup/suppl/doi:10.1073/pnas.2101062118/-/DCSupplemental.
Tento článek s otevřeným přístupem je distribuován pod licencí Creative Commons Attribution-NonCommercial-NoDerivatives License 4.0 (CC BY-NC-ND).