066 | Redundancia de enlaces de comunicación dentro de un mismo edificio: Cobre, fibra óptica y bonding
Publicado el 28.07.2025
Redundancia de enlaces de comunicación dentro de un mismo edificio: cobre, fibra y bonding
En el artículo anterior vimos por qué la redundancia de enlaces de comunicación no es un capricho, sino una necesidad urgente para garantizar la continuidad del negocio. Hoy nos centraremos en el nivel más básico, pero no menos crítico: la conexión entre servidores y el equipo de red dentro de un mismo edificio, ya sea una sala de servidores, un centro de datos (CPD) o una oficina común.
Es precisamente aquí, en un entorno aparentemente controlado, donde con mayor frecuencia ocurren las interrupciones más molestas: alguien mueve accidentalmente un cable, falla un puerto del switch o incluso se avería todo el switch.
Especificidad del problema en la red local
Dentro de un mismo edificio (o CPD) se trata de transmisión de datos de alta velocidad entre servidores de aplicaciones, bases de datos, sistemas de almacenamiento (SAN/NAS) y redes internas. Si esta conexión se interrumpe, aunque sea por segundos, puede provocar fallos en aplicaciones, pérdida de sesiones, corrupción de datos y otros problemas graves.
Soluciones típicas para la tolerancia a fallos en la conexión local
Para minimizar los riesgos se emplean los siguientes enfoques:
1. Interfaces de red redundantes (NICs) en los servidores
Casi cualquier servidor moderno dispone de varias tarjetas de red. No es casualidad. Conectar un servidor a la red mediante dos o más NICs es el primer y más sencillo paso hacia la tolerancia a fallos. Si una tarjeta falla, la otra puede asumir sus funciones.
2. Dos conmutadores (switches) independientes
Conectar cada servidor a dos conmutadores diferentes e independientes (o a dos stacks de conmutadores distintos) es el estándar de oro en los CPD. Si un conmutador falla por completo, el servidor seguirá funcionando a través del otro.
- Cómo se ve: Cada servidor tiene al menos dos cables de red, cada uno conectado a un conmutador físico distinto.
3. Agregación de enlaces (Link Aggregation / Bonding / EtherChannel / LACP)
Probablemente ésta sea una de las soluciones más potentes y extendidas. La agregación de enlaces (en Linux se denomina bonding) permite combinar varias interfaces de red físicas en el servidor (y los puertos correspondientes en el conmutador) en una única interfaz lógica. Esto aporta dos beneficios clave:
- Aumento del ancho de banda: La suma de la velocidad de todos los enlaces combinados. Por ejemplo, dos enlaces de 1 Gbps pueden proporcionar 2 Gbps.
- Tolerancia a fallos: Si un cable físico o un puerto del conmutador falla, el tráfico se redirige automáticamente a los canales restantes dentro del grupo.
Diferentes modos de bonding:
active-backup(mode 1): El más simple y común para tolerancia a fallos. Una interfaz está activa y la otra en espera. Si la activa falla, la de reserva entra en funcionamiento inmediatamente. No aumenta el ancho de banda.balance-xor(mode 2): Distribuye el tráfico entre todas las interfaces activas basándose en un hash XOR (por ejemplo, según las direcciones MAC de origen/destino). Proporciona balanceo de carga y tolerancia a fallos.802.3ad(LACP — Link Aggregation Control Protocol, modo 4): Protocolo estandarizado que negocia dinámicamente con el conmutador la agregación de enlaces. Es el modo más inteligente, que ofrece el mejor balanceo y tolerancia en un entorno coordinado. Requiere soporte LACP en el conmutador.
Configuración: La configuración del bonding requiere ajustes tanto en el servidor Linux como en el conmutador de red. Para LACP deben “ponerse de acuerdo” entre sí.
4. Uso de diferentes tipos de cableado
En sistemas críticos se puede considerar el uso de diferentes tipos de cables para distintas conexiones:
- Cobre (UTP/STP): Barato y conveniente para distancias cortas. Susceptible a interferencias electromagnéticas y con limitaciones de longitud.
- Fibra óptica: Más cara, pero ofrece mucho mayor velocidad, alcance e inmunidad total a las interferencias electromagnéticas. Ideal para enlaces entre conmutadores y conexiones a sistemas de almacenamiento.
Usar tipos distintos puede proteger frente a fallos específicos.
5. Redundancia de módulos SFP
Si utiliza fibra óptica, no olvide los módulos SFP/SFP+. Mantenga siempre módulos de repuesto por si alguno falla.
6. Redundancia de conexiones a sistemas de almacenamiento (Multipathing I/O)
Para servidores conectados a sistemas de almacenamiento compartido (SAN/NAS) es crucial configurar conexiones multipath (Multipathing I/O). Esto permite que el servidor tenga múltiples rutas de acceso a un mismo disco o LUN en el sistema de almacenamiento. Si una ruta (por ejemplo, un cable, un puerto HBA Fibre Channel o un puerto del almacenamiento) falla, los datos siguen fluyendo por otra ruta, garantizando continuidad.
¿Qué falla a este nivel?
- Fallo de la tarjeta de red en el servidor.
- Fallo de un puerto en el conmutador.
- Rotura o daño del cable (patch cord).
- Fallo completo del conmutador (evento raro, pero posible).
- Fallo del módulo SFP.
Ejemplos de configuraciones
- Tolerancia básica a fallos: Servidor con 2 NICs conectadas a 2 conmutadores distintos. NIC1 a SW1, NIC2 a SW2. En el servidor se configura
active-backupbonding. - Alta disponibilidad y rendimiento: Servidor con 2 NICs agrupadas en LACP-bonding. Cada cable va a un conmutador distinto, que pueden estar apilados o en clúster para presentarse como un único dispositivo al LACP.
Monitoreo
La redundancia eficaz no es posible sin un monitoreo constante:
- Estado de los puertos: Si están activos, si hay errores en los puertos.
- Estado de las interfaces bonding: Qué interfaz está activa, si hay conmutaciones.
- Disponibilidad de puertas de enlace/IP remotas: Pings o comprobaciones de disponibilidad a puntos clave de la red.
Conclusión
Garantizar la tolerancia a fallos de las conexiones dentro de un mismo edificio es la base de una infraestructura TI fiable. El uso de componentes redundantes (NICs, conmutadores) junto con tecnologías de agregación de enlaces (bonding/LACP) y la elección adecuada del cableado permiten aumentar significativamente la disponibilidad de sus servidores y aplicaciones. No olvide las conexiones multipath al almacenamiento y el monitoreo continuo.
En el siguiente artículo subiremos un nivel y discutiremos cómo garantizar la redundancia de enlaces de comunicación entre oficinas geográficamente distribuidas.