Точно както е трудно да се разбере разговор, без да се знае контекстът му, за биолозите може да бъде трудно да разберат значението на генната експресия, без да познават средата на клетката. За да решат този проблем, изследователи от Princeton Engineering са разработили метод за изясняване на околната среда на клетката, така че биолозите да могат да осмислят повече информацията за генната експресия.
Изследователите, ръководени от професора по компютърни науки Бен Рафаел, се надяват, че новата система ще отвори вратата за идентифициране на редки видове клетки и избор на възможности за лечение на рак с нова прецизност. Рафаел е старши автор на статия, описваща метода, публикувана на 16 май в Nature Methods.
Основната техника за свързване на генната експресия със средата на клетката, наречена пространствена транскриптомика (ST), съществува от няколко години. Учените разбиват тъканни проби върху микромащабна решетка и свързват всяко място в мрежата с информация за генната експресия. Проблемът е, че настоящите изчислителни инструменти могат да анализират само пространствени модели на генна експресия в две измерения. Експериментите, които използват множество срезове от една тъканна проба - като област на мозъка, сърцето или тумора - са трудни за синтезиране в пълна картина на клетъчните типове в тъканта.
Методът на изследователите от Принстън, наречен PASTE (for Probabilistic Alignment of ST Experiments), интегрира информация от множество срезове, взети от една и съща тъканна проба, осигурявайки триизмерен изглед на генната експресия в тумор или развиващ се орган. Когато покритието на последователността в експеримент е ограничено поради технически или финансови проблеми, PASTE може също да обедини информация от множество тъканни срезове в един двуизмерен консенсусен срез с по-богата информация за генната експресия.
„Нашият метод беше мотивиран от наблюдението, че често биолозите извършват множество експерименти с една и съща тъкан“, каза Рафаел. „Сега, тези репликирани експерименти не са точно едни и същи клетки, но са от една и съща тъкан и следователно трябва да бъдат много сходни.“
Техниката на екипа може да подравни множество срезове от една тъканна проба, категоризирайки клетки въз основа на техните профили на генна експресия, като същевременно запазва физическото местоположение на клетките в тъканта.
Проектът започна през лятото на 2020 г., след като Макс Ланд, концентратор по математика от випуск 2021 на Принстън, взе курса на Рафаел „Алгоритми в изчислителната биология“. Развълнуван от бързо развиващата се област и възможността да се подобри разбирането за човешкото здраве и болести, Ланд се обърна към Рафаел, за да се включи в изследванията, и започна да работи върху код, за да разработи това, което стана методът PASTE. Той беше посъветван от Рафаел и от водещия автор на изследването Рон Зейра, бивш постдокторант в Принстън, който сега е изследовател в компанията за прецизно здраве Verily.
Работата беше във фокуса на старшата дисертация на Ланд и той беше съавтор на статията заедно със Зейра, Рафаел и Александър Стрзалковски, доктор по компютърни науки. студент. Сега компютърен биолог в Memorial Sloan Kettering Cancer Center в Ню Йорк, Ланд каза, че наставничеството на Зейра и Рафаел е изиграло важна роля в преследването му на изследователска кариера.
Екипът разработи своя метод, използвайки данни за симулирана генна експресия от изследване на пространствена транскриптомия на тумор на гърдата, където съответствието между тъканните срезове е установено преди това. След това те оцениха метода върху данни, събрани от проби от префронталния кортекс на мозъка, който има известна структура, състояща се от слоеве от различни типове клетки с уникални сигнатури на генна експресия.
Изследователите също приложиха PASTE към данни, събрани от биопсии на рак на кожата на четири различни пациенти. Предишен анализ на тези данни предполага сложна смесица от видове клетки, с висока степен на смесени ракови и здрави клетки. Методът PASTE обаче разкри, че очевидно ниската пространствена кохерентност в три от пробите на пациентите вероятно се дължи на ниското покритие на последователността в експериментите. Новият анализ показа, че клетките са групирани в по-последователни клъстери, по-биологично правдоподобен сценарий.
„След като интегрираме няколко от тези срезове и ефективно увеличим покритието на данните, получаваме по-пространствено съгласувани групи от клетки, което е по-разумно, отколкото всеки тип клетка да бъде произволно позициониран в тъканта“, каза Зейра.
Досега най-големият набор от данни, който екипът е анализирал, беше проба от сърдечна тъкан с девет резена, но те са се насочили към експерименти с ембриони на мишки, които включват повече от 30 резена. Освен изчислителните съображения, експериментите с пространствена транскриптомия в този мащаб остават скъпи за много лаборатории, каза Рафаел.
Все пак, добави той, „надяваме се, че наличието на инструмент като PASTE ще насърчи повече изследователи да извършват повтарящи се експерименти, защото сега те действително могат да използват информацията от допълнителни срезове по начин, който не са могли лесно да правят преди.“
Изследователската статия „Подреждане и интегриране на данни за пространствена транскриптомия“ беше подкрепена от финансиране от Националния институт по рака на САЩ.
Справка: Zeira R, Land M, Strzalkowski A, Raphael BJ. Подравняване и интегриране на пространствени транскриптомични данни. Nat методи. 2022 г. doi: 10.1038/s41592-022-01459-6
Тази статия е препубликувана от следните материали. Забележка: материалът може да е редактиран за дължина и съдържание. За допълнителна информация, моля, свържете се с цитирания източник.