Skip to content

INMEGEN/Pipelines_INMEGEN

Repository files navigation

INMEGEN

Nextflow run with docker

Flujos de trabajo

Este repositorio contiene información detallada sobre los flujos de trabajo (pipelines) desarrollados y automatizados en el Instituto Nacional de Medicina Genómica (INMEGEN), asociados a los servicios de anślisis bioinformśticos del Inmegen.

Para saber más y realizar una solicitud del servicio de análisis, visita nuestro sitio web dando clic aquí.

El principal objetivo de estos pipelines es el procesamiento de datos provenientes de secuenciación masiva (Whole Genome Sequencing [WGS]/Whole Exome Sequencing [WES], RNA sequencing [RNA-seq]) de manera reproducible y repetible, con base en el uso de herramientas confiables y avaladas por la comunidad científica.

En cada uno de los siguientes directorios de este repositorio [marcado entre corchetes] se encuentran las instrucciones necesarias para ejecutar cada flujo de trabajo:

  • Cuantificación y Análisis de expresión diferencial a partir de datos de RNA-seq [QDEA-RNAseq]
  • Identificación conjunta de variantes germinales a partir de datos WGS/WES [VC-Germline]
  • Identificación de variantes somáticas a partir de datos WGS/WES [VC-Somatic]
  • Identificación de variantes a partir de datos de RNA-seq [VC-RNAseq]
  • Análisis de calidad de archivos de secuenciación masiva en formato FASTQ [Fastq-QC]
  • Identificación conjunta de variantes germinales a partir de datos WGS/WES con bootstrapping [BT-VC-Germinal]

Los directorios que contienen pipelines de procesamiento que son requeridos por más de un flujo de trabajo

  • Preprocesamiento de archivos FASTQ [Data-preprocessing]
  • Anotación de variantes con Annovar [Annotation]

Otros directorios contienen información general:

  • Los procesos en los que están divididos los flujos de trabajo se encuentran en el directorio [modules]
  • El diagrama de flujo correspondiente a cada pipeline se encuentra en la carpeta [flowcharts]
  • El directorio [docker] contiene el Dockerfile para crear el repositorio pipelines_inmegen

Para ejecutar los pipelines

Como pre-requisito para ejecutar los pipelines es necesario contar con:

  1. NextFlow (versión mayor o gual a 22.10.7)

  2. Docker (versión mayor o gual a 23.0.5)

Además, es necesario clonar la imagen de docker de este repositorio con el comando

docker pull pipelinesinmegen/pipelines_inmegen:public

En caso de querer construir la imagen de docker con el Dockerfile que se encuentra en el directorio [docker] utiliza:

docker build -t pipelinesinmegen/pipelines_inmegen:public -f Dockerfile .

Finalmente, clonar este repositorio utilizando:

git clone https://github.com/INMEGEN/Pipelines_INMEGEN.git

NOTA: Debes asegurarte de que el directorio de docker cuente con suficiente espacio para generar la imagen (~ 8 GB).

Políticas de uso

Los flujos de este repositorio pueden ser descargados y utilizados sin restricciones para uso académico. En caso de utilizar cualquiera de estos flujos solicitamos incluir la siguiente frase en los productos académicos generados: “Agradecemos a la Subdirección de Genómica Poblacional y a la Subdirección de Bioinformática del Instituto Nacional de Medicina Genómica por proveer flujos de trabajo que han sido utilizados de forma parcial o total como parte del análisis de este trabajo (We acknowledge the Population Genomics and the Bioinformatics Departments from the National Institute of Genomic Medicine for providing workflows that were, either partially or completely, used as part of the analysis in this work )”

Si requieres el apoyo de nuestro personal para implementar alguno de estos flujos de trabajo en tus datos, este se considerará un servicio. Por lo tanto, se cobrará de acuerdo a los tabuladores existentes en la cartera de servicios INMEGEN.

NOTA: por un tiempo limitado, estos servicios estarán disponibles gratuitamente para personal interno del INMEGEN.

En ningún caso nuestros servicios incluyen interpretación de resultados o generación de resultados más allá de los descritos como parte del flujo de trabajo.

En caso de querer iniciar una colaboración académica con alguno de los miembros de este proyecto favor de contactarnos directamente.

No está permitida la utilización de estos flujos de trabajo con fines comerciales por terceros.

Equipo de desarrollo

Daniel Pérez-Calixto dperez@inmegen.gob.mx

Laura Gómez-Romero lgomez@inmegen.gob.mx

Alejandra Cervera Taboada acerverat@inmegen.gob.mx

Licencia

Pipelines INMEGEN © 2023 by INMEGEN is licensed under CC BY-NC-SA 4.0

Contacto

Visita nuestro sitio web.

Cualquier duda o comentario escribir a nuestro correo de contacto