Seleccione máquinas virtuales N2 de Google Cloud para ejecutar sus cargas de trabajo de genómica de manera más eficiente y rentable

Kit de herramientas de análisis de genómica

  • Los racimos de máquinas virtuales N2 de Google Cloud completaron tareas de genómica en tan solo un 75 % del tiempo en comparación con los racimos de máquinas virtuales estándar C2.

  • Los racimos de máquinas virtuales N2 de Google Cloud completaron tareas de genómica con tan solo un 78 % del costo en comparación con los racimos de máquinas virtuales estándar C2.

author-image

Por

Al compararlas con otras máquinas virtuales de Google Cloud, las máquinas virtuales N2 que cuentan con procesadores escalables Intel® Xeon® de 2ª Generación redujeron el tiempo y el costo de ejecutar tareas de kit de herramientas de análisis de genómica hasta en un 25 %.

Las tareas de genómica requieren una gran cantidad de recursos de computación. Es importante investigar el desempeño de diferentes opciones de máquinas virtuales si las está comprando en la nube pública. La elección correcta puede reducir drásticamente la cantidad gastada en ejecutar estas cargas de trabajo. Para ilustrar las formas en que las máquinas virtuales pueden variar en términos de desempeño y costo, Intel llevó a cabo pruebas de análisis de referencia en racimos de tres series de máquinas virtuales de Google Cloud: estándar N2 y estándar C2, ambos con procesadores escalables Intel® Xeon® de 2ª Generación, y las estándar N1 con procesadores escalables Intel® Xeon® de 1ª Generación.

El análisis de referencia de Cromwell en Google Cloud midió la rapidez con que estas máquinas virtuales ejecutaron 24 tareas en la aplicación de kit de herramientas de análisis de genómica (GATK). Los resultados de las pruebas mostraron que el racimo estándar N2 realizó las tareas en menos tiempo que los otros racimos, lo que dio lugar a un costo menor. Ejecute sus cargas de trabajo de genómica en máquinas virtuales estándar N2 con procesadores escalables Intel® Xeon® de 2ª Generación para obtener eficiencia y rentabilidad.

Los racimos de máquinas virtuales estándar N2 superaron a los racimos de máquinas virtuales estándar N1 y además cuestan menos

Como se muestra en la Figura 1, en nuestras pruebas el racimo de máquinas virtuales N2 con procesadores escalables Intel® Xeon® de 2ª Generación completó las tareas de genómica en la aplicación GATK en 75 % del tiempo que le tomó al racimo de máquinas virtuales estándar N1. Cuando el racimo de máquinas virtuales de uno completa un conjunto de tareas en menos tiempo, eso significa que uno paga menos tiempo de actividad de la máquina, lo que quiere decir más ingresos. Esta eficiencia se traduce en ahorro: el costo de ejecutar las tareas en el racimo de máquinas virtuales N2 sería un 21 % menor que con el racimo N1.

Figura 1. Tiempo y costo relativos para completar tareas de genómica. Los números menores son mejores.

Los racimos de máquinas virtuales estándar N2 superaron a los racimos de máquinas virtuales estándar C2 y además cuestan menos

Como se muestra en la Figura 2, en nuestras pruebas el racimo de máquinas virtuales N2, con procesadores escalables Intel® Xeon® de 2ª Generación, completó las tareas de genómica en la aplicación GATK en un 78 % del tiempo que le tomó al racimo de máquinas estándar C2. Esta eficiencia se traduce en ahorro: el costo de ejecutar las tareas en el racimo de máquinas virtuales N2 sería un 22 % menor que con el racimo N1.

Figura 2. Tiempo y costo relativos para completar tareas de genómica. Los números menores son mejores.

Conclusión

Como las aplicaciones de análisis de genómica son tan exigentes de computación, se hace vital seleccionar una máquina virtual de la nube con un desempeño robusto. En nuestras pruebas, mostramos que las máquinas virtuales estándar N2 de Google Cloud con procesadores escalables Intel® Xeon® de 2ª Generación redujeron el tiempo y el costo para completar tareas de genómica, en comparación con las máquinas virtuales estándar N1 y C2.

Más información

Para comenzar a ejecutar sus cargas de trabajo de genómica en máquinas virtuales N2 de Google Cloud, con procesadores escalables Intel® Xeon® de 2ª Generación, visite https://cloud.google.com/compute/docs/general-purpose-machines#n2_machines.

Todas las pruebas de Intel en GCP/us-central1 del 10/9/2020 al 9/10/2020. Todas las pruebas: CentOS 7, Conjunto de datos de entrada 30X cobertura de secuencia completa de genoma humano (WGS); NA12878, canal de mejores prácticas para llamado de variantes en líneas de gérmenes con preprocesamiento, GATK 4.0.10.1, Biblioteca de kernel de genómica (GKL) 0.8.6, Cromwell 52, Picard 2.20, BWA 0.7.15-r1140, Samtools 1.3.1. Herramientas en https://hub.docker.com/r/broadinstitute/genomes-in-the-cloud/: us.gcr.io/broad-gotc-prod/genomes-in-the-cloud:2.4.3-1564508330, us.gcr.io/broad-gatk/gatk:4.0.10.1. Flujo de trabajo definido: https://github.com/gatk-workflows/gatk4-genome-processing-pipeline/blob/master/WholeGenomeGermlineSingleSample.wdl. Iteraciones ejecutadas: 3. Detalles de máquina virtual: máquina serie N1: procesador escalable Intel® Xeon® 1ª Generación (Skylake): N1-estándar-2: 2 vCPUs, 7,5 GB de RAM; N1-estándar-16: 16 vCPUs, 60 GB de RAM. Máquinas serie N2: procesador escalable Intel® Xeon® de 2ª Generación (Cascade Lake): N2-estándar-2: 2 vCPUs, 8 GB de RAM; N2-estándar-16: 16 vCPUs, 64 GB de RAM. Máquinas serie C2: procesador escalable Intel® Xeon® de 2ª Generación (Cascade Lake): C2-estándar-4: 4 vCPUs, 16 GB de RAM. C2-estándar-16: 16 vCPUs, 64 GB de RAM.