Saltearse al contenido

Salud del Nodo

Este documento describe cómo puedes verificar y monitorear la salud de tu validator y validator fullnode (VFN) en la red de Aptos. Muchos de los métodos descritos aquí dependen de las métricas de tiempo de ejecución que tus nodos recolectan y reportan. Estas métricas son recolectadas por el binario del nodo Aptos y se exponen vía un endpoint de métricas Prometheus. Para una descripción detallada de las métricas importantes, ver la documentación del Servicio de Inspección de Nodos y Métricas Importantes del Nodo.

Después de desplegar tus nodos y conectarlos a la red de Aptos, deberías verificar que tus nodos estén ejecutándose correctamente.

Puedes verificar la corrección de tus nodos inspeccionando varias métricas simples. Sigue estos pasos:

  1. Verifica si tus nodos están sincronizando estado ejecutando este comando:

    Ventana de terminal
    curl 127.0.0.1:9101/metrics 2> /dev/null | grep "aptos_state_sync_version"

    Deberías esperar ver las versiones synced o synced_states aumentando. Las versiones deberían comenzar a aumentar para tu VFN primero, luego eventualmente tu nodo validator comenzará a sincronizar.

  2. Verifica que tu validator se esté conectando a otros pares en la red.

    Ventana de terminal
    curl 127.0.0.1:9101/metrics 2> /dev/null | grep "aptos_connections{.*\"Validator\".*}"

    El comando producirá el número de conexiones entrantes y salientes de tu nodo validator. Por ejemplo:

    Ventana de terminal
    aptos_connections{direction="inbound",network_id="Validator",peer_id="f326fd30",role_type="validator"} 5
    aptos_connections{direction="outbound",network_id="Validator",peer_id="f326fd30",role_type="validator"} 2

    Mientras una de las métricas sea mayor que cero, tu nodo validator está conectado a al menos uno de los pares en la red. Si tu validator no está conectado a ningún par, asegúrate de que tu VFN haya completado la sincronización primero. Una vez que tu VFN haya terminado de sincronizar, tu nodo validator comenzará a sincronizar y eventualmente podrá conectarse a otros pares.

  3. Después de que tu nodo sincronice a la última versión, también puedes verificar si el consenso está progresando, y tu nodo está proponiendo.

    Ventana de terminal
    curl 127.0.0.1:9101/metrics 2> /dev/null | grep "aptos_consensus_current_round"
    curl 127.0.0.1:9101/metrics 2> /dev/null | grep "aptos_consensus_proposals_count"

    Deberías esperar ver estos números continuar aumentando.

Si eres un operador de nodo, hay varias herramientas disponibles para ti para verificar la salud de tu nodo en adelante:

El equipo de Aptos Labs también puede monitorear tu nodo remotamente usando Telemetría de Nodo. Cuando habilitas telemetría en tus nodos, el binario del nodo Aptos enviará datos de telemetría en segundo plano, que incluye las métricas del nodo. Los datos de telemetría de tu nodo son necesarios para evaluar el rendimiento, vitalidad y salud de tus nodos.

Si tu nodo está usando la configuración por defecto sin deshabilitar explícitamente la telemetría, y tiene acceso de salida HTTPS a internet, entonces reportará varias métricas clave a Aptos Labs. Aptos Labs también observará los eventos on-chain como propuestas por hora en tu nodo, como se define en los criterios de vitalidad.