De una manera clásica en la Universidad de California, San Diego, una conversación que se escuchó inadvertidamente en el café del campus se convirtió en un proyecto interdisciplinario, haciendo que los cursos intensivos en informática fueran aún más emocionantes y ahorrando hasta ahora más de $1 millón. Este esfuerzo proporciona mejores ecosistemas de hardware y software para estudiantes de posgrado y estudiantes de pregrado en la Universidad de California, San Diego, y sus profesores para explorar problemas en proyectos y planes de estudios del mundo real, intensivos en datos y computacionalmente intensivos.
Todo comenzó con más de tres años de café como Larry Smarr, profesor de informática e ingeniería en la Universidad de California, San Diego, en el patio Bear de Jacobs Engineering College. Al hacer cola, Smarr escuchó inadvertidamente a un estudiante decir: "Si no ejecuté TensorFlow en la GPU para resolver un problema real, no podría obtener una entrevista de trabajo. "
Aunque los acertijos de este estudiante pueden sonar muy técnicos y altamente específicos, Smart escuchó una necesidad general; Él vio una oportunidad. En particular, Smarr se da cuenta de que la innovación que dirige el proyecto de investigación financiado por la National Science Foundation (NSF), Pacific Research Platform (PRP), se puede utilizar para crear mejores instalaciones informáticas para cursos temáticos que dependen en gran medida del aprendizaje automático, la visualización de datos y otros recursos informáticos. This infrastructure would make it easier for professors to offer courses that challenge students to solve real-world data- and computation-intensive problems, including things like what he heard at the coffee cart: running TensorFlow on a GPU on a real problem.
Avance rápido hacia 2022, una chispa de la idea de Smarr se ha convertido en una asociación entre escuelas llamada la plataforma de ciencia de datos/aprendizaje automático de la Universidad de California en San Diego o JupyterHub, la Universidad de California. A través de esta plataforma, Los bloques de construcción informáticos baratos y de alto rendimiento diseñados para la investigación intensiva en informática en todo el país para Smarr y sus colaboradores de PRP ahora son también sistemas dinámicos para estudiantes y profesores de la Universidad de California en San Diego que utilizan el aprendizaje automático, la visualización de datos y otras herramientas informáticas y de datos intensivos. La plataforma ha sido ampliamente utilizada en varios departamentos del campus, incluida la enseñanza de ciencias biológicas, ciencias cognitivas, ciencias de la computación, ciencias de la información, ingeniería, ciencias de la salud, ciencias marinas, medicina, música, ciencias físicas, cursos de salud pública.
Este es un proyecto de asociación único que utiliza innovaciones de investigación computacional financiadas por el gobierno federal para el aula. Para lograr un salto de la investigación a las aplicaciones en el aula, un equipo creativo y diligente interdisciplinario de la Universidad de California, San Diego, se unió. Los servicios de tecnología de la información/servicios académicos y técnicos en la Universidad de California, San Diego, han aumentado dramáticamente. El arquitecto principal Adam Tilghman y el programador jefe David Andersen lideraron la implementación con el liderazgo y el apoyo financiero de Vince Kellen, director de información de la Universidad de California, San Diego, y Valerie Polichar, directora sénior de tecnología académica. Kellen dijo que el proyecto ha ayudado al campus a evitar más de $1 millón en gastos de computación en la nube.
Al mismo tiempo, el proyecto proporciona una herramienta para las comunidades de la Universidad de California, San Diego, para alentar a los estudiantes y las ideas a moverse hacia adelante y hacia atrás entre los proyectos de la clase y los proyectos de investigación de seguimiento.
"Nuestros estudiantes obtienen el mismo nivel de poder de cómputo que los investigadores, que generalmente solo usan sistemas avanzados como las supercomputadoras. Los estudiantes están explorando problemas de datos más complejos porque pueden ", dijo Smar, director fundador del Instituto de Tecnología de la Información y Telecomunicaciones de California (Calit2), socio de la Universidad de California, San Diego/Universidad de California, Irvine. Calit2 ahora se está expandiendo, incluida la Universidad de California, Riverside.
Genómica personal
Melissa Gymrek es una de las profesoras en el campus que utiliza la plataforma de ciencia de datos/aprendizaje automático de la Universidad de California en San Diego. Es profesora de informática e ingeniería y genética médica.
Sus estudiantes escriben y ejecutan código en un entorno de software llamado Jupyter notebook que se ejecuta en la plataforma de la Universidad de California, San Diego. "Pueden escribir código en su cuaderno y presionar Ejecutar para ver el resultado. Pueden crear números para visualizar datos. Ahora estamos prestando más atención a la visualización de datos ", dijo Gymrek.
Uno de los miles de estudiantes de la Universidad de California, San Diego, que hace un uso extensivo de la plataforma es Zhang Xuan. A través de los datos y los cursos de visualización intensiva en CSE284, Zhang se dio cuenta de que el centro de su doctorado era una estructura genética de alto orden. Las disertaciones-R-loops-pueden ajustarse mediante repeticiones cortas en tándem (STR), que son el centro de la mayoría de los estudios en el laboratorio de Gymrek. Sin una infraestructura informática que aborde los problemas curriculares del mundo real, Zhang no cree que esté asociada con la investigación.
Después de asistir al curso de Gymrek, Zhang también se dio cuenta de que podía postularse para obtener su propio perfil de investigación independiente en la plataforma de ciencia de datos/aprendizaje automático de la Universidad de California, San Diego, para mantener el acceso a todos los cursos y continuar desarrollándose sobre esa base. (Cuando los cuadernos de Jupyter se alojan en la nube de negocios, los estudiantes a menudo no tienen acceso a sus cursos de fortificación de datos al final del curso, A menos que descarguen sus propios datos.)
"Pensé que era solo para el curso, pero luego me di cuenta de que el cuaderno de Jupyter podría usarse para investigación sin perder la visita a Jupyterhub a través de la Universidad de California", dijo Zhang.
Esta infraestructura educativa también beneficia a los profesores.
"Con estos cuadernos de Jupyter, puede incrustar automáticamente el sistema de puntuación. Ahorra mucho trabajo ", dijo Kim Rick. Puede especificar cuántos puntos obtiene un estudiante, y si obtienen el código correcto, explica. Antes de usar el sistema, los estudiantes envían el archivo PDF del conjunto de ejercicios a los estudiantes, lo que hace que el puntaje consuma más tiempo. Difícil más de una docena de estudiantes. Ahora puedes acercarte ", dijo Kim Rick. De hecho, ha podido ampliar su programa de posgrado en genómica personal a más de 50 estudiantes, en comparación con una docena antes de obtener estas nuevas herramientas.
Ahora también puede subir tareas y calificaciones directamente al sistema de gestión de aprendizaje del campus Canvas.
La plataforma realmente está transformando la educación. A diferencia de muchas innovaciones tecnológicas de aprendizaje, las clases en cada departamento de la Universidad de California, San Diego, utilizan una plataforma de ciencia de datos/aprendizaje automático. Miles de estudiantes lo usan cada año. Esta es una innovación verdaderamente influyente que prepara a nuestros estudiantes para convertirse en líderes e innovadores en la graduación en muchas áreas, a veces inesperadas ", dijo Polichar.
Hardware de productos de investigación y educación
"Si construyes una supercomputadora distribuida, como PRP, en el hardware del producto, puedes seguir la Ley de Moore", explica Smarr.
De acuerdo con esta estrategia de hardware de productos básicos, Smarr y sus colaboradores de PRP han desarrollado diseños de hardware que mejoran el rendimiento y reducen los precios. Los componentes informáticos desarrollados por PRP, reutilizados por ITS en la Universidad de California, San Diego, son computadoras de rack que incluyen CPU multinúcleo, ocho unidades de procesamiento de gráficos (GPU) y están optimizados para proyectos de uso intensivo de datos, incluida la aceleración del aprendizaje de la máquina en la GPU. Estas PC ejecutan una amplia gama de software de vanguardia para ayudar a los estudiantes a escribir programas del sistema, registrar los resultados en cuadernos de Jupyter y realizar una variedad de análisis de datos y algoritmos de aprendizaje automático para sus problemas.
Basado en este enfoque de hardware de productos básicos de computación de alto rendimiento, la Universidad de California, San Diego, ha creado un ecosistema dinámico e innovador de "campo" para cursos intensivos en datos e informática, no solo servicios comerciales de computación en la nube.
Tilghman dijo: "La nube de negocios no proporciona un ecosistema que permita a los estudiantes tener la misma plataforma entre los cursos, o tienen la misma plataforma en el curso que en la investigación". "Esto es especialmente cierto en el campo de los estudiantes de posgrado, donde los estudiantes comienzan a trabajar en el contexto del plan de estudios y continúan trabajando en el estudio. Esta es la continuidad, incluso desde estudiantes de pregrado hasta ahora. Creo que esta es una de las ventajas innovadoras de la Universidad de California, San Diego. "
Los profesores y estudiantes de la Universidad de California, San Diego, están interesados en obtener más información sobre la plataforma de ciencia de datos/aprendizaje automático y pueden encontrar más detalles e información de contacto en su sitio web.
"He estado en 50 años", dijo Smart. "No sé cuántos ejemplos hay y veo que la investigación y la educación están tan estrechamente vinculadas en un círculo. "
Esta combinación de investigación y educación ha inyectado vitalidad a la cultura innovadora y relevante de la Universidad de California, San Diego.
Albert P. Pisano, decano de la Facultad de Ingeniería de Jacobs en la Universidad de California, San Diego, dijo: "Ya sea en la industria, la academia o el sector público, los estudiantes en el campus deben trabajar en las instalaciones computacionales relacionadas con su futuro." "Estos ecosistemas de tecnología de la información que se están creando e implementando en el campus son cruciales para mejorar la capacidad de los estudiantes para aprovechar la innovación para servir a la comunidad. "
Para ver videos que proporcionan una descripción general de la Plataforma de Investigación del Pacífico (PRP) y muestras de proyectos de investigación habilitados para la plataforma, visite el sitio web de la Plataforma de Investigación del Pacífico.
Larry Smarr es el investigador principal de PRP y el Instituto Conjunto de Subvenciones (NSF OAC-1541349, OAC-1826967, CNS-1730158, Santiago CNS-2100237)