Assim como é difícil entender uma conversa sem conhecer seu contexto, pode ser difícil para os biólogos entender o significado da expressão gênica sem conhecer o ambiente de uma célula. Para resolver esse problema, os pesquisadores da Princeton Engineering desenvolveram um método para elucidar os arredores de uma célula para que os biólogos possam dar mais significado às informações de expressão gênica.
Os pesquisadores, liderados pelo professor de Ciência da Computação Ben Raphael, esperam que o novo sistema abra a porta para identificar tipos de células raras e escolher opções de tratamento de câncer com nova precisão. Raphael é o autor sênior de um artigo descrevendo o método publicado em 16 de maio na Nature Methods.
A técnica básica de vincular a expressão gênica com o ambiente de uma célula, chamada transcriptômica espacial (ST), existe há vários anos. Os cientistas dividem as amostras de tecido em uma grade de microescala e vinculam cada ponto da grade com informações sobre a expressão do gene. O problema é que as ferramentas computacionais atuais só podem analisar padrões espaciais de expressão gênica em duas dimensões. Experimentos que usam várias fatias de uma única amostra de tecido – como uma região de um cérebro, coração ou tumor – são difíceis de sintetizar em uma imagem completa dos tipos de células no tecido.
O método dos pesquisadores de Princeton, chamado PASTE (para Probabilistic Alignment of ST Experiments), integra informações de várias fatias retiradas da mesma amostra de tecido, fornecendo uma visão tridimensional da expressão gênica dentro de um tumor ou órgão em desenvolvimento. Quando a cobertura da sequência em um experimento é limitada devido a problemas técnicos ou de custo, o PASTE também pode mesclar informações de várias fatias de tecido em uma única fatia de consenso bidimensional com informações de expressão gênica mais ricas.
“Nosso método foi motivado pela observação de que muitas vezes os biólogos realizam vários experimentos a partir do mesmo tecido”, disse Raphael. “Agora, esses experimentos replicados não são exatamente as mesmas células, mas são do mesmo tecido e, portanto, devem ser altamente semelhantes”.
A técnica da equipe pode alinhar várias fatias de uma única amostra de tecido, categorizando as células com base em seus perfis de expressão gênica, preservando a localização física das células dentro do tecido.
O projeto começou no verão de 2020, depois que Max Land, um concentrador de matemática da turma de 2021 de Princeton, fez o curso de Raphael “Algorithms in Computational Biology”. Animado com o campo em rápida evolução e a oportunidade de melhorar a compreensão da saúde e doença humana, Land abordou Raphael sobre se envolver em pesquisa e começou a trabalhar no código para desenvolver o que se tornou o método PASTE. Ele foi aconselhado por Raphael e pelo principal autor do estudo, Ron Zeira, um ex-pesquisador de pós-doutorado em Princeton que agora é um cientista pesquisador da empresa de saúde de precisão Verily.
O trabalho foi o foco da tese de graduação de Land, e ele co-escreveu o artigo junto com Zeira, Raphael e Alexander Strzalkowski, um Ph.D em ciência da computação. estudante. Agora biólogo computacional no Memorial Sloan Kettering Cancer Center, na cidade de Nova York, Land disse que a orientação de Zeira e Raphael foi fundamental em sua busca por uma carreira de pesquisa.
A equipe desenvolveu seu método usando dados de expressão gênica simulados de um estudo de transcriptômica espacial de um tumor de mama, onde a correspondência entre fatias de tecido foi previamente estabelecida. Eles então avaliaram o método em dados coletados de amostras do córtex pré-frontal do cérebro, que tem uma estrutura conhecida que consiste em camadas de diferentes tipos de células com assinaturas únicas de expressão gênica.
Os pesquisadores também aplicaram o PASTE aos dados coletados de biópsias de câncer de pele de quatro pacientes diferentes. Uma análise anterior desses dados havia sugerido uma colcha de retalhos complexa de tipos de células, com um alto grau de células cancerígenas e saudáveis misturadas. O método PASTE, no entanto, revelou que a aparente baixa coerência espacial em três das amostras dos pacientes provavelmente se devia à baixa cobertura de sequência nos experimentos. A nova análise mostrou que as células foram agrupadas em grupos mais contíguos, um cenário biologicamente mais plausível.
“Depois de integrar várias dessas fatias e aumentar efetivamente a cobertura dos dados, obtemos agrupamentos de células mais coerentes espacialmente, o que é mais razoável do que cada tipo de célula sendo posicionado aleatoriamente no tecido”, disse Zeira.
Até agora, o maior conjunto de dados que a equipe analisou foi uma amostra de tecido cardíaco com nove fatias, mas eles estão de olho em experimentos de embriões de camundongos que incluem mais de 30 fatias. Além de considerações computacionais, os experimentos de transcriptômica espacial nessa escala continuam caros para muitos laboratórios, disse Raphael.
Ainda assim, ele acrescentou, “esperamos que ter uma ferramenta como o PASTE encoraje mais pesquisadores a realizar experimentos replicados, porque agora eles podem realmente usar as informações de fatias adicionais de uma maneira que não podiam fazer antes”.
O artigo de pesquisa "Alignment and Integration of Spatial Transcriptmics Data" foi financiado pelo U.S. National Cancer Institute.
Referência: Zeira R, Land M, Strzalkowski A, Raphael BJ. Alinhamento e integração de dados de transcriptômica espacial. Métodos Nat. 2022. doi: 10.1038/s41592-022-01459-6 See More
Este artigo foi republicado a partir dos seguintes materiais. Nota: o material pode ter sido editado em tamanho e conteúdo. Para mais informações, entre em contato com a fonte citada.