Analice más datos con hasta 1,72 veces el rendimiento para cargas de trabajo de Apache Spark con instancias de Amazon EC2 M5n con procesadores escalables de Intel Xeon de 2ª Generación

Apache Spark

  • Analice más datos con 1,57 veces el rendimiento en instancias pequeñas.

  • 1,42 veces el rendimiento en instancias medianas.

  • 1,72 veces el rendimiento en instancias grandes.

author-image

Por

Características de las instancias Intel® Xeon® los procesadores escalables de los servicios web de Amazon serie M5n

Aumente el rendimiento para el aprendizaje automático con los procesadores escalables de 2ª generación de los procesadores escalables de la serie Amazon EC2 M5n Intel Xeon

A medida que los big data siguen creciendo, las organizaciones deben encontrar maneras de ordenar y aprovechar las lecciones que se aprovecharon de esos datos para seguir siendo ágiles en el mercado. Ejecutar el análisis de datos en la nube descarga molestias de administración previa a la administración, pero puede dificultar discernir el impacto que la elección de instancia puede tener en el desempeño de cargas de trabajo de análisis de datos complejas. Para las cargas de trabajo de Apache Spark en Amazon EC2, la selección de instancias M5n habilitadas por los procesadores escalables de 2da generación Intel Xeon puede proporcionar más rendimiento para ordenar a través de más datos a la vez a fin de proporcionarle información más rápidamente.

En pruebas de dos implementaciones de aprendizaje automático en las que se comparan instancias de Amazon EC2, instancias más recientes de la serie M5n habilitadas por Intel Xeon de 2ª generación.

Los procesadores escalables superaron a las instancias de la serie M4 anteriores con Intel Xeon procesadores E5 v4, lo que ofrece hasta 1,72 veces el rendimiento de datos para las cargas de trabajo de Apache Spark.

Ya sea que sus cargas de trabajo de aprendizaje automático requieran tamaños de instancias pequeñas, medianas o grandes, seleccionar las instancias de la serie M5n con procesadores escalables Intel Xeon de 2ª Generación en lugar de instancias M4 anteriores, puede analizar más datos y ofrecer perspectivas que se pueden llevar a la acción con mayor rapidez.

Mejore el tiempo para obtener información sobre las instancias pequeñas

Todos los datos que una organización recopila solo vale la pena si pueden entenderlos rápidamente. Por ejemplo, las predicciones de las preferencias de los clientes y las inferencias similares deben funcionar en tiempo real para tener un impacto empresarial, y esto requiere tecnología actualizada que pueda ofrecer resultados de manera más rápida.

Figura 1. Comparación de rendimiento relativo en instancias pequeñas (8 vCPU/32 GB de RAM) para cargas de trabajo de clúster k-means y clasificación najve bayesianas del conjunto de análisis de referencia HiBench.

Las pruebas que comparan instancias pequeñas con ocho vCPUs muestran la elección de instancias de Amazon EC2 M5n con procesadores escalables de Intel® Xeon® de 2a Generación que ofrecen hasta 1,57 veces el rendimiento para cargas de trabajo de aprendizaje automático Apache Spark de instancias de la serie M4 con procesadores Intel Xeon E5 v4.

Mejore el tiempo para obtener perspectivas sobre las instancias medianas

Al igual que con los casos pequeños, las pruebas que comparan instancias medianas con 16 vCPUs mostraron que las instancias Amazon EC2 M5n con procesadores escalables de Intel® Xeon® de 2da Generación mejoraron ambas implementaciones de aprendizaje automático en Apache Spark, en este caso, ofreciendo hasta 1,42 veces el rendimiento de las instancias M4 más antiguas.

Figura 2. Comparación de rendimiento relativo en instancias intermedias (16 vCPU/64 GB de RAM) para la clasificación nave bayesiana y las cargas de trabajo de clúster k-means del conjunto de análisis de referencia HiBench.

Mejore el tiempo para obtener perspectivas sobre las instancias grandes

Las pruebas muestran que los tamaños de instancias grandes (con 64 vCPU) tuvieron el aumento más espectacular del desempeño del aprendizaje automático, ya que ofrecían hasta 1,72 veces el rendimiento de las instancias de la serie M4 para una carga de trabajo de clústeres k-means.

Figura 3. Comparación de rendimiento relativo en instancias grandes (64 vCPU/256 GB de RAM) para la clasificación de Na and Bayesian y las cargas de trabajo de clúster k-means del conjunto de análisis de desempeño HiBench.

Esto significa que las organizaciones que buscan obtener rápidamente perspectivas que se puedan llevar a la práctica a partir de los datos pueden beneficiarse con la selección de instancias de Amazon EC2 M5n mejoradas habilitadas por los procesadores escalables de Intel Xeon de 2da Generación, independientemente del tamaño de las instancias que requieran.

Aprende más

Para comenzar sus implementaciones de Apache Spark en instancias de la serie Amazon EC2 M5n con procesadores escalables Intel Xeon de 2da Generación, visite http://intel.com/AWS.

Para obtener más información sobre las pruebas, visite http://facts.pt/3Kjn66x.

El contenido de esta página es una combinación de la traducción humana y automática del contenido original en inglés. Este contenido se ofrece únicamente para su comodidad como información general y no debe considerarse completa o precisa. Si hay alguna contradicción entre la versión en inglés de esta página y la traducción, prevalecerá la versión en inglés. Consulte la versión en inglés de esta página.