BioinfinvRepro

Curso de introducción a la bioinformática e investigación reproducible

View the Project on GitHub u-genoma/BioinfinvRepro

Introducción a la bioinformática e investigación reproducible para análisis genómicos

Mediante una colaboración entre el Posgrado en Ciencias Biológicas de la Universidad Nacional Autónoma de México, CONABIO y la U. de Chile, ofreceremos un curso intensivo de bioinformática, orientado a entregar las herramientas básicas para análisis de datos genómicos en el contexto de genética, especialmente la genética de poblaciones.

INSTRUCTORES ENCARGADOS: Dra. Alicia Mastretta Yanes, PhD. (México) Catedrática CONACYT-CONABIO, www.mastrettayanes-lab.org

Dr. Ricardo Verdugo Salgado, PhD (Chile) Profesor Asistente, Programa de Genética Humana, ICBM, Facultad de Medicina, Universidad de Chile http://genomed.med.uchile.cl

INSTRUCTURES PARTICIPANTES:

Karen Oróstica Tapia, PhD. Investigadora Docente, Insitituto de Ciencia de Datos, Universidad del Desarrollo https://ingenieria.udd.cl/persona/karen-orostica

Constanza de la Fuente, PhD. Programa de Genética Humana, ICBM, Facultad de Medicina, Universidad de Chile https://orcid.org/0000-0002-2857-3615

INSTRUCTORES de versiones pasadas:

Dra. Camille Truong, PhD. Investigadora Instituto de Biología, UNAM camilletruong.wixsite.com

Dr. Matthieu J. Miossec, PhD Bioinformatics Analyst, Wellcome Centre for Human Genetics de la Universidad de Oxford https://www.researchgate.net/profile/Matthieu-Miossec

Dr. Luis Castañeda, PhD Profesor Asistente, Programa de Genética Humana, ICBM, Facultad de Medicina, Universidad de Chile https://sites.google.com/site/lecastane/

Dr. Pablo Saenz Agudelo Profesor Asociado, Instituto de Ciencias Ambientales y Evolutivas, Facultad de Ciencias, Universidad Austral de Chile http://icaev.cl/academicos/pablo-saenz-agudelo/

Los materiales aquí presentados son de acceso libre. La transmisión online y videos de clases se pueden encontrar en este canal de Youtube

Objetivos

El objetivo general es brindar a los y las alumnas las herramientas computacionales de software libre, mejores prácticas y metodologías de reproducibilidad de la ciencia para efectuar, documentar y publicar proyectos bioinformáticos de análisis genómicos.

Los objetivos particulares son:

  1. Formar a los y las alumnas en los principios de investigación reproducible y metodologías para organizar proyectos bioinformáticos
  2. Introducir a los alumnos a bash, R y git
  3. Presentar a los alumnos los tipos de datos genéticos producidos por la secuenciación de siguiente generación
  4. Introducir a los y las alumnas al análisis e datos genómicos y genomas reducidos
  5. Revisar a nivel teórico y práctico los métodos bioinformáticos clásicos de análisis secuencias genómicas
  6. Asesorar a los alumnos en la realización de sus propios proyectos bioinformáticos

Que sí es este curso

Que NO es este curso

En otras palabras, en este curso no te vamos a decir qué programa utilizar ni discutir a profundidad métodos de ensamblado, etc. Para eso hay cursos especializados intensivos de un par de días que asumen ya saben usar la terminal.

Algunos ejemplos:

Dinámica del curso

¿Cómo serán las clases?

El curso es teórico-práctico, por lo que se requiere traigan su laptop con Mac o GNU/Linux (no Windows, sorry, lo intenté 2 años y es una pesadilla para todxs) y:

Este repositorio

El repositorio está dividido en un folder por Unidad. Dentro de cada folder subiremos los apuntes y código utilizado en cada clase conforme los vayamos viendo en el semestre, así como los enlaces a las tareas.

Las notas de este repositorio están escritas en formato Markdown y, como notarás, el repositorio se encuentra hospedado en GitHub.

Cubriremos ambas herramientas en el curso, pero en resumen:

En este mismo repositorio de github están las versiones de cursos que hemos dado los años pasados. Cada curso está en una “rama” de del repositorio (más adelante veremos qué es esto). Si estás siguiendo este curso en youtube en un año diferente al del curso, quizá sea necesario que cambies la rama para que los videos correspondan con los apuntes.

En la unidad 2 aprenderemos a utilizar github desde la línea de comando, pero por lo pronto, para hacer los ejercicios de la unidad 1: baja el respositorio y guárdalo en tu escritorio. Para bajarlo da click en el botón verde del lado derecho que dice “Clone or Download” y selecciona “Download zip”.

Mecanismo de calificación

El curso se dividirá en tres secciones que se calificarán por separado. Se asiganarán tareas al final de cada sesión. El resultados de la tareas debe ser enviado para evaluación cada viernes hasta las 23:00 hrs. Cada tarea será evaluada con una nota del 1-7. La nota de la unidad será calculada como:

El “Proyecto” de la unidad consiste una carpeta dentro de un repositorio personal en Github donde el estudiante debe depositar sus tareas. Veremos cómo hacerlo en la sesión 2 de la Unidad 1.

Todas las unidades son obligatorias.

Copiar o plagiar (tareas, exámenes, trabajo final, lo que sea) es motivo suficiente para reprobarte sin lugar a discusión.

Temario

VIDEO: Bienvenida al curso

Unidad 1 Introducción a la programación

Sesión 1: Mis primeros comandos

VIDEO: Sesión 1.1

Trabajo individual:

Sesión 2: Organización de un proyecto bioinformático

VIDEO: Sesión 1.2

Trabajo individual:

Sesión 1,3: Introducción a R con un enfoque bioinformático

VIDEO: Sesión 1.3

Trabajo individual:

Unidad 2 Genética de poblaciones con software especializado

Sesión 1: Datos genéticos

VIDEO: Sesión 2.1

Sesión 2: Análisis genético de poblaciones

VIDEO: Sesión 2.2

Sesión 3: Genética de Poblaciones 2

Profesora: Constanza de la Fuente, Programa de Genética Humana, Facultad de Medicina, Universidad de Chile PPT: Sesión 2.3 VIDEO: Sesión 2.3

Unidad 3 Generación y alineamiento de datos NGS

Sesión 1 Generación y QC de datos NGS

PPT: Sesión 3.1 VIDEO: Sesión 3.1

Trabajo individual:

Sesión 2: Introducción a las bases de datos

PPT: Sesión 3.2 VIDEO: Sesión 3.2

Sesión 3: Análisis de secuencias

Trabajo individual:

Sesión 4: Análisis de ADN con CLC

Sesión 5: Genómica del cáncer

Unidad 4 Análisis de transcriptomas

Sesión 1 Expresión diferencial

Sesión 2 Análisis funcional

Material:

Sesión 3 RNA-seq

Material: