La integración de NVML con New Relic proporciona información valiosa sobre la utilización de GPU y el rendimiento métrico de su aplicación y sistemas, lo que facilita la optimización de recursos, la identificación del cuello de botella y el mantenimiento de la estabilidad y eficiencia generales en su entorno.
Luego de configurar la integración NVML con New Relic, vea sus datos en un dashboard listo para usar.
Configurar la integración NVML
Complete los siguientes pasos para configurar la integración NVML:
Instalar el agente de infraestructura
Para emplear la integración NVML, primero debe instalar el agente de infraestructura en el mismo host. El agente de infraestructura monitorea el host en sí, mientras que la integración nvml extiende su monitoreo con datos específicos de su clúster gpu.
Utilice NRI-Flex para capturar métricas
Flex viene incluido con el agente New Relic Infrastructure . Debe configurar NRI-Flex para nvml y crear un archivo de configuración flexible. Sigue estos pasos:
Cree un archivo llamado
nvml-config.yml
en la siguiente ruta:- para Linux,
/etc/newrelic-infra/integrations.d
- para Windows,
C:\Program Files\New Relic\newrelic-infra\integrations.d\
- para Linux,
Utilice el siguiente fragmento para actualizar su archivo de configuración llamado
nvml-config.yml
integrations:- name: nri-flex# interval: 30sconfig:name: NVMLexampleapis:- name: nvmlfile: <PATH_TO_METRIC_CSV_FILE>
Reiniciar el agente de infraestructura.
Utilice las instrucciones de nuestros documentos del agente de infraestructura para reiniciar su agente de infraestructura. Este es un comando básico que debería funcionar para la mayoría de las personas:
$sudo systemctl restart newrelic-infra.service
Ver tu nvml métrica en New Relic
Una vez que haya completado la configuración anterior, podrá ver su métrica utilizando nuestra plantilla dashboard prediseñadas. Para acceder a este dashboard:
Vaya a one.newrelic.com > + Integrations & Agents.
Haga clic en la pestaña del Dashboards .
En el cuadro de búsqueda, escriba
nvml
.Selecciónelo y haga clic en Install.
Para instrumentar el nvml inicio rápido y ver métricas y alertas, también puede seguir nuestra página NVML inicio rápido haciendo clic en el botón
Install now
.Aquí hay una consulta de ejemplo para verificar la cantidad de dispositivos en la GPU:
SELECT latest(temperature_gpu) FROM nvmlSample TIMESERIES
¿Que sigue?
Para obtener más información sobre cómo crear una consulta NRQL y generar un panel, consulte estos documentos:
Introducción al generador de consultas para crear consultas básicas y avanzadas.
Introducción al panel para personalizar tu dashboard y realizar diferentes acciones.
Administre su dashboard para ajustar su
modo de visualización o para agregar más contenido a su dashboard.