Lossless Ethernet en redes convergentes de alto rendimiento

Lossless Ethernet en redes convergentes de alto rendimiento

Tiempo de lectura estimado: 8 minutos


Esta conferencia magistral pertenece al Módulo 1 "Redes y arquitecturas" de C1b3rWall Academy 2021. El objetivo de la misma es proporcionar los fundamentos básicos para comprender las nuevas tecnologías que se están desarrollando en el área de networking en el Data Center.

¿Qué es Lossless Ethernet?

El término hace referencia a las adaptaciones del protocolo Ethernet (IEEE 802.3), permitiendo que su uso sea más adecuado en entornos de alto rendimiento en los Centros de datos (CPD o Data Center). La característica común de las mejoras consideradas para este uso es la reducción en la pérdida de paquetes

Ethernet es una tecnología bastante antigua (los primeros usos datan de la década de los 80) que se ha ido expandiendo por todo el mundo. Su última versión es de 2017 a tasas de transmisión efectiva de 400Gbps y se está trabajando en velocidades superiores a 1Tbps. Esta tecnología se caracteriza por:

  • Ser barata (en comparación con tecnologías alternativas).
  • Tener un protocolo simple.
  • Ser fácil de usar.
  • Ser escalable.
  • Tener retrocompatibilidad.
  • Tener mucha oferta.

¿Qué es el Data Center?

Se trata de los nodos del sistema en los que se concentran los recursos de computación y almacenamiento de los datos que utilizan las aplicaciones de nuestra organización. Se aclara que al hablar de Data Center, Centro de procesamiento de datos o CPD, se está hablando del uso y no de la ubicación.

En los Data Center se está dando una transformación por diferentes motivos, como es la introducción de las GPU acompañando a las CPU o las unidades de estado sólido (SSD) y el aumento de velocidad que suponen. 

El Ethernet ha triunfado por las características descritas anteriormente (barato, protocolo simple...), pero hay que remarcar lo que no hace o dónde no es el protocolo más eficiente: fiabilidad, eficiencia y origen no determinista, sin una pauta exacta de cuándo se envían las cosas ni cómo llegan. 

Las otras redes

Para resolver las necesidades específicas de los entornos de almacenamiento o HPC, se han aplicado históricamente soluciones de interconexión de nicho, siendo las más comunes Fiber Channel (FC) e Infiniband (IB):

  • Fiber Channel: Es una tecnología que nace con la intención de almacenamiento, concretamente en el entorno de almacenamiento de bloques (SAN) desde la década de los 90. Las velocidades más comunes son 8GFC, 16GFC y 32GFC, aunque existe la evolución hasta los 256GFC.
  • Infiniband: Tecnología en el ámbito de las CPU y GPU. Surge a inIcio de la década de los 2000 como alternativa a los buses PCI para agilizar la interconexión de elementos de computación en los Data Center. Las velocidades más comunes van de 25Gbps a 400Gbps, y se esperan evoluciones por encima de 1Tbps.

Estas alternativas funcionan perfectamente y realmente no había alternativas reales al nicho que estaban ocupando. La desventaja radica en que precisamente son tecnologías de nicho, no son fácilmente integrables con los estándares de la industria, son costosas y tienen pocos proveedores

Data Center Bridging

A finales de la década de los 2000 se retoma la iniciativa de ofrecer una alternativa para que Ethernet pudiera ser utilizada como tecnología de red entre todos los elementos del Data Center, pero sin verse afectada por la posible pérdida de tramas o paquetes. La IEEE publicó varios estándares que apuntaban en esa dirección, incluyendo:

  • Priority-based Flow Control (PFC): IEEE 802.1Qbb. Establece mecanismos de control de flujos para evitar la pérdida de tramas o paquetes en caso de congestión.
  • Enhanced Transmission Selection (ETS): IEEE 802.1Qaz. Permite asignar recursos de ancho de banda a categorías de tráfico.
  • Data Center Bridging eXchange (DCBX): IEEE 802.1Qaz. Permite detectar los recursos y elementos de la red, extremo a extremo.

RoCEv2

Remote Direct Memory Access (RDMA) es un mecanismo de acceso directo desde la memoria principal de un sistema computacional a la de otros sistemas, sin la cooperación del sistema operativo. Esto permite la realización de sistemas de alto rendimiento y operaciones de baja latencia. Lo curioso es que esta tecnología sirve tanto para InfiniBand como para la parte de almacenamiento

¿Por qué es importante Lossless Ethernet?

Muchas de las tecnologías disruptivas de la actualidad, como Big Data, Blockchain o la Inteligencia Artificial, son intensivas en el uso de GPU y memoria de alto rendimiento. Tener un sistema de red eficiente en precio y rendimiento puede ayudar a sacar el máximo partido a la infraestructura de cómputo y almacenamiento, sin que ello se traduzca en mayores costes o una complea curva de aprendizaje.

Recomendaciones generales

En ocasiones, algunos proyectos fracasan por algo muy sencillo que está más allá de la tecnología: mantenerse informado a través de distintas fuentes para tener una mejor visión de qué es lo que mejor se va a adaptar al desarrollo del proyecto. Además, los equipos de trabajo de computación, almacenamiento y networking deben establecer ciertos objetivos comunes y comprender cuál es la prioridad del resto de miembros del equipo. Por último, se recomienda utilizar, en la medida de lo posible, arquitecturas y tecnologías abiertas, de forma que permitan cierta libertad a medida que evoluciona el proyecto.


Ponente: Víctor Jiménez Ramos

Víctor es  IP CTO de Huawei Enterprise España. Acumula más de 20 años de experiencia en el área de IP Networking. y es especialista en diseño y aplicación práctica de soluciones de redes para Campus y Data Center.