banner

Blog

Jul 01, 2023

Previsión inmediata de rayos con aerosol

npj Climate and Atmospheric Science volumen 6, número de artículo: 126 (2023) Citar este artículo

97 Accesos

2 altmétrico

Detalles de métricas

La predicción precisa y oportuna de la aparición de rayos desempeña un papel crucial en la salvaguardia del bienestar humano y del medio ambiente global. Anteriormente se han empleado modelos basados ​​en aprendizaje automático para predecir la ocurrencia de rayos, lo que ofrece ventajas en la eficiencia de cálculo. Sin embargo, estos modelos se han visto obstaculizados por una precisión limitada debido a una representación inadecuada de los intrincados mecanismos que impulsan los rayos y un conjunto de datos de entrenamiento restringido. Para abordar estas limitaciones, presentamos un enfoque de aprendizaje automático que integra características de aerosoles para capturar de manera más efectiva los mecanismos de los rayos, complementado con observaciones satelitales enriquecidas del Geostationary Lightning Mapper (GLM). Mediante el entrenamiento de un modelo LightGBM bien optimizado, generamos con éxito relámpagos espacialmente continuos (0,25° por 0,25°) y cada hora sobre los Estados Unidos contiguos (CONUS) durante la temporada de verano, superando el rendimiento de las líneas de base competitivas. El rendimiento del modelo se evalúa utilizando varias métricas, incluida la precisión (94,3%), la probabilidad de detección (POD, 75,0%), la tasa de falsas alarmas (FAR, 38,1%), el área bajo la curva de precisión-recuperación (PRC-AUC, 0,727). . Además del conjunto de datos enriquecido, el rendimiento mejorado se puede atribuir a la inclusión de características de aerosoles, lo que ha mejorado significativamente el modelo. Este aspecto crucial ha sido pasado por alto en estudios anteriores. Además, nuestro modelo desentraña la influencia de la composición de los aerosoles y la carga en la formación de rayos, lo que indica que una alta carga de aerosoles que consiste en sulfatos y compuestos orgánicos tiende a mejorar la actividad de los rayos, mientras que el carbono negro la inhibe. Estos hallazgos se alinean con el conocimiento científico actual y demuestran el inmenso potencial para dilucidar los complejos mecanismos subyacentes a los fenómenos de rayos asociados a aerosoles.

Los rayos, una causa importante de muertes humanas naturales, representan una amenaza importante para la sociedad moderna, provocando más de 4.000 muertes en todo el mundo cada año1,2. Además, provoca importantes pérdidas económicas: solo Estados Unidos sufre daños por valor de alrededor de mil millones de dólares al año. La predicción oportuna y precisa de la aparición de rayos desempeña un papel vital a la hora de facilitar la preparación para emergencias y las medidas de protección. Además, los rayos sirven como fuente natural primaria de óxidos de nitrógeno, ejerciendo así una influencia considerable en la química atmosférica3, lo que subraya la importancia de la predicción de los rayos para salvaguardar el bienestar humano y el medio ambiente global.

Los rayos ocurren comúnmente durante la formación de tormentas eléctricas, que generalmente se caracterizan por altos niveles de humedad y una atmósfera inestable4,5,6,7,8. Los modelos numéricos pueden simular explícitamente la formación de rayos incorporando procesos microfísicos parametrizados9,10. Sin embargo, los modelos numéricos actuales luchan por lograr un equilibrio entre una alta detectabilidad de rayos y bajas tasas de falsas alarmas (FAR), lo que limita su aplicabilidad en la predicción de rayos11,12,13. Además, las demandas computacionales de la simulación de rayos dentro de modelos numéricos impiden la eficiencia de la predicción inmediata de rayos, donde la puntualidad es crucial en dominios como la aviación y la fabricación. Por el contrario, los modelos de relámpagos basados ​​en datos basados ​​en observaciones han surgido como métodos eficientes para lograr predicciones inmediatas de relámpagos precisas, aprovechando muestras reales a un costo computacional más bajo. Por ejemplo, Mostajabi et al.14 fueron pioneros en la exploración de modelos basados ​​en datos para la predicción inmediata de relámpagos en horas futuras con una precisión notable utilizando únicamente variables meteorológicas. Además, la capacidad inherente de los modelos de aprendizaje automático para capturar características no lineales permite un alto rendimiento incluso con entradas de características simples y prácticas. Hasta ahora, se han explorado una serie de modelos de aprendizaje automático para predecir la aparición de rayos con variables meteorológicas, ya sea desde una estación meteorológica o un modelo meteorológico y un radar meteorológico asimilados, incluida la red neuronal artificial y el árbol de decisión15, la máquina de aumento de gradiente de luz (LightGBM) 16, máquinas de vectores de soporte y bosques aleatorios17 y redes neuronales recurrentes de memoria a corto plazo18. Los modelos actuales de aprendizaje automático demuestran una alta eficiencia; sin embargo, todavía enfrentan desafíos con FAR alto en niveles de alta probabilidad de detección (POD)17. Esta limitación puede atribuirse a conjuntos de datos de entrenamiento insuficientes y a datos de características incompletos utilizados en modelos anteriores, lo que se explicará detalladamente en secciones posteriores.

En primer lugar, los estudios anteriores se basaron principalmente en redes terrestres de detección de rayos y sensores a bordo de satélites de órbita polar, que presentan limitaciones significativas en términos de eficiencia de detección y cobertura espacial por paso elevado, lo que limita la precisión de los modelos basados ​​en la observación para la predicción de rayos19,20. 21,22. Junto con el desarrollo de los satélites geoestacionarios, está disponible el seguimiento en tiempo real de la aparición de rayos en el espacio. En particular, el sensor Geostationary Lightning Mapper (GLM) a bordo de los satélites geoestacionarios operativos ambientales (GOES) puede capturar las características detalladas de la ocurrencia de rayos con una cobertura espaciotemporal completa para respaldar el análisis, incluido el diagnóstico de los modelos numéricos actuales23,24, la investigación sobre la asociación de fenómenos naturales. eventos en el sistema climático25,26,27 y prevención de riesgos28,29. Esta alta eficiencia de detección de rayos nube-tierra (CG) e intranube (IC) derivados del GLM tiene un gran potencial para proporcionar un registro confiable de ocurrencia de rayos30 para el modelo basado en observación para la predicción de rayos.

En segundo lugar, una limitación crucial de los modelos actuales de aprendizaje automático para la predicción de rayos es su dependencia exclusiva de la información meteorológica, ignorando la influencia significativa de los aerosoles en los patrones de rayos. Sin embargo, los estudios observacionales han demostrado el impacto sustancial de los aerosoles en la formación de rayos31,32. Por un lado, los aerosoles pueden estimular la convección, promoviendo la colisión de partículas y mejorando la disipación de carga. Por otro lado, los aerosoles poseen notables propiedades radiativas que suprimen la activación de partículas33,34,35,36. Además, los distintos componentes de los aerosoles exhiben diversas vías de influencia en las descargas de rayos37. Por lo tanto, incorporar información detallada sobre aerosoles se vuelve esencial para mejorar el rendimiento de los modelos de predicción de rayos. Las mediciones basadas en satélites proporcionan un seguimiento en tiempo real de los componentes químicos de los aerosoles a una escala espaciotemporal integral. Además, los estudios han indicado una estrecha relación entre los aerosoles cercanos a la superficie y las PM2,5, lo que permite un seguimiento oportuno de la distribución de aerosoles cerca de la superficie38,39. Al aprovechar modelos de aprendizaje automático bien diseñados que incorporan información sobre aerosoles y utilizar conjuntos de datos enriquecidos por satélite, se anticipan mejoras significativas en el rendimiento de la predicción de rayos.

En este estudio, nuestro objetivo fue mejorar el modelo existente de predicción inmediata de relámpagos incorporando información de aerosoles, específicamente la profundidad óptica y la composición del aerosol, además de variables meteorológicas convencionales y redes terrestres. Además, utilizamos observaciones de satélites geoestacionarios como fuente de datos principal y etiqueta para el modelo de predicción inmediata de relámpagos, considerando su estabilidad y disponibilidad de datos. Los resultados de la evaluación se evaluaron utilizando métricas comunes de investigación de pronósticos e información inmediata. Nuestros hallazgos demuestran la eficacia del aprendizaje automático basado en aerosoles para predecir la aparición de rayos en la próxima hora, al tiempo que proporcionan información valiosa sobre el papel de los aerosoles en la formación de rayos.

Este artículo está organizado de la siguiente forma: En la siguiente sección, presentamos los resultados y el análisis del modelo de predicción inmediata de relámpagos que propusimos, utilizando información de aerosoles y observaciones de satélites geoestacionarios. Posteriormente, procedemos con una discusión de los hallazgos y sacamos nuestras conclusiones.

Para entrenar y validar el modelo de predicción de rayos, recopilamos una base de datos de rayos que comprende observaciones del Geostationary Lightning Mapper (GLM) a bordo del satélite geoestacionario (GOES-16). Los datos se etiquetaron según la presencia o ausencia de actividad de rayos. Además, los datos meteorológicos y de aerosoles se obtuvieron de productos de pronóstico proporcionados por el Servicio de Monitoreo de la Atmósfera de Copernicus (CAMS) y se utilizaron como características de entrada para el modelo. Se emplearon varios esquemas de validación y métricas de evaluación para evaluar el desempeño del modelo. La información detallada sobre los métodos de validación se puede encontrar en la sección Métodos, mientras que la Tabla 1 presenta los parámetros de evaluación y las métricas utilizadas. La Figura 1 ilustra el rendimiento del modelo de predicción de rayos propuesto, que fue entrenado y validado de forma cruzada durante el verano de 2020. La curva de precisión-recuperación de la figura muestra la compensación entre precisión y recuperación en umbrales de diferencia (etiquetada como "Validación cruzada"). en verano de 2020” en la Fig. 1). El modelo exhibió una prometedora capacidad de predicción inmediata de rayos, como lo demuestra un PRC-AUC de 0,727 para el modelo LightGBM. En particular, la forma de la curva de precisión-recuperación indica que el modelo puede mantener una proporción baja de predicciones de falsas alarmas cuando se desea una mayor precisión. Específicamente, en un umbral en el que el modelo alcanza un POD del 75 %, un nivel común en los modelos existentes, se determinó que el FAR era del 38 %. La comparación de la curva de recuperación de precisión de este modelo LightGBM con la de un clasificador aleatorio resalta la capacidad del modelo para distinguir eficazmente entre casos de rayos y no rayos.

El modelo se evalúa bajo dos esquemas: validación cruzada 10 veces y validación fuera de muestra con pruebas establecidas a partir del verano de 2021.

Además, realizamos una evaluación del modelo propuesto con respecto a su transferibilidad, que se refiere a la capacidad del modelo entrenado para aplicarse a un rango temporal de interés diferente. En este esquema de validación, el modelo se entrenó utilizando conjuntos de datos del verano de 2020 y posteriormente se probó con datos del verano de 2021. La Figura 1 ilustra el rendimiento del modelo cuando se aplicó al verano de 2021 (etiquetado como "Validación fuera de muestra en el verano de 2021" en la figura 1). En particular, se observa poco contraste en comparación con el desempeño en el verano de 2020. El modelo transferido exhibe un PRC-AUC ligeramente reducido de 0,699 en comparación con su aplicación en 2020. Esto indica una excelente transferibilidad del modelo, lo que implica el potencial del modelo para incorporarse a modelos de parametrización y Se utilizará para interpretar la aparición de rayos durante la simulación numérica en el futuro.

Para evaluar la efectividad del modelo de predicción de rayos propuesto en comparación con los modelos de referencia comúnmente utilizados, es decir, el modelo de persistencia y el modelo CAPE (como se describe en detalle en el Método complementario 1), realizamos una intercomparación integral de modelos. La evaluación de estos modelos se basa en métricas establecidas utilizadas en estudios anteriores para comparar modelos de ocurrencia de rayos, a saber, POD, FAR, Critical Success Index (CSI) y Heidke Skill Score (HSS). Los resultados se presentan en la Fig. 2, donde el modelo propuesto logra el POD más alto (0,75 para este modelo, 0,53 para el modelo de Persistencia y 0,47 para el modelo CAPE), CSI (0,53 para este modelo, 0,37 para el modelo de Persistencia, y 0,13 para el modelo CAPE) y HSS (0,66 para este modelo, 0,55 para el modelo de Persistencia y 0,20 para el modelo CAPE). Además, el modelo propuesto exhibe el FAR más bajo (0,38 para este modelo, 0,45 para el modelo de Persistencia y 0,85 para el modelo CAPE), lo que indica su capacidad superior para capturar con precisión la ocurrencia de rayos y superar los enfoques de predicción de referencia.

Los modelos de referencia incluyen el modelo de persistencia, el modelo CAPE, el modelo de agotamiento de datos que se entrena con una matriz de mapeo de rayos (LMA) y un modelo sin aerosol como entrada. Las métricas de evaluación incluyen POD, FAR, CSI y HSS.

Para enfatizar la efectividad espacial del modelo de predicción de rayos en CONUS, la distribución espacial de dos métricas clave, POD y FAR, se presenta utilizando conjuntos de datos de validación en las Fig. 3a, b. Los resultados demuestran que ambas métricas exhiben valores más altos en el sureste de CONUS, que se alinea con regiones caracterizadas por una elevada densidad de rayos. Además, se observa que la distribución espacial del rendimiento del modelo se correlaciona con la distribución de la densidad de los rayos, como se muestra en la Fig. 3c. Específicamente, las regiones con escasa ocurrencia de rayos exhiben valores de POD más bajos, alcanzando aproximadamente el 30% en áreas donde las densidades de destellos caen por debajo de 0,05 destellos por kilómetro cuadrado. Este fenómeno se puede atribuir al conjunto de datos desequilibrado utilizado en el proceso de aprendizaje automático, donde las muestras con relámpagos poco frecuentes pueden contribuir al menor rendimiento en estas regiones.

a Distribución espacial de recuerdo (POD) en CONUS; b distribución espacial de precisión (1-FAR) en CONUS; yc la distribución espacial de la densidad de rayos durante el verano de 2020.

Estudios anteriores han indicado que los modelos de predicción de rayos basados ​​en aprendizaje automático, que utilizan datos de radar y redes de rayos terrestres, demuestran habilidades moderadas de predicción inmediata. En este estudio, presentamos una mejora en la precisión del modelo mediante la incorporación de observaciones enriquecidas con datos del GLM a bordo del satélite geoestacionario GOES-16, que proporciona una cobertura espacial completa. Comparamos el modelo propuesto y el modelo de predicción de rayos simulado sobre la base de las observaciones del conjunto de mapeo de rayos (LMA) de acceso público (etiquetado como modelo de "agotamiento de datos" a continuación), que ha sido ampliamente investigado para estudiar los patrones de rayos40. 41. En comparación con el modelo propuesto (modelo enriquecido con datos), el modelo de agotamiento de datos utiliza observaciones de LMA para predecir los rayos. Los detalles de la LMA y las ubicaciones de sus centros correspondientes se explican en el Método complementario 2 y se presentan en la Tabla complementaria 1. La Figura 2 ilustra el rendimiento superior del modelo enriquecido con datos en comparación con el modelo con agotamiento de datos en todas las métricas de evaluación. Aunque el POD del modelo enriquecido con datos (75%) es sólo ligeramente superior al del modelo con agotamiento de datos (72%), el FAR del modelo con agotamiento de datos (56%) es significativamente mayor que el del modelo enriquecido con datos (36%). %). Además, el CSI y el HSS para el modelo de agotamiento de datos (38% y 48% respectivamente) indican deficiencias inherentes en el modelo sin el enriquecimiento proporcionado por las observaciones de satélites geoestacionarios.

Esta mejora en el rendimiento del modelo también se atribuye a la estabilidad de detección que ofrecen las observaciones de los satélites geoestacionarios. En comparación con las observaciones espaciales, la red de detección terrestre muestra una eficiencia de detección decreciente a medida que aumenta la distancia desde el centro de la red. Demostramos que el modelo de agotamiento de datos experimenta una disminución en la precisión al aumentar la distancia desde el centro de la red, como se muestra en la Figura 1 complementaria. Específicamente, el CSI del modelo disminuye en un 0,78% y el FAR aumenta en un 1% cada 50 km de distancia. desde el centro de red. Se ha determinado que las pendientes de las métricas del modelo con respecto a la distancia son estadísticamente significativas en una prueba t de una cola con un valor de p inferior a 0,05. El rendimiento del modelo basado en LMA se vuelve cada vez más limitado en regiones donde no hay equipos LMA locales disponibles debido a su dependencia de la distancia. Por el contrario, la mayor estabilidad proporcionada por las observaciones de los satélites geoestacionarios protege el modelo de predicción de una menor robustez y amplía su aplicabilidad a una gama más amplia de regiones.

Numerosos estudios han documentado el impacto de los aerosoles en la aparición de rayos de largo alcance, y los diferentes componentes de los aerosoles muestran efectos distintos, ya sea suprimiendo o mejorando la actividad de los rayos37,42,43. Este estudio analiza la variabilidad diurna de rayos y aerosoles, con el objetivo de descubrir los patrones temporales de aparición de rayos y comportamiento de aerosoles. Según la Figura complementaria 2, la distribución de la aparición de rayos muestra una preferencia pronunciada por las horas de la tarde y la noche, con observaciones limitadas durante las horas de la mañana. Este patrón temporal distintivo indica que los predictores con características temporales poseen el potencial de pronosticar la ocurrencia de rayos. La variación diurna de la profundidad óptica del aerosol (AOD), como se muestra en la Figura complementaria 2b, se alinea con el patrón observado en la aparición de rayos. Esta consistencia sugiere que la información sobre aerosoles puede servir como un predictor temporal confiable de eventos relámpagos. Además, ajustamos las anomalías de la variabilidad diurna con la densidad media de relámpagos en las horas en que la densidad media de relámpagos excede 0,001 destellos/km2, se observa una correlación alta (r de Pearson = 0,897) como en la figura complementaria 2d, mientras que una correlación más baja para la temperatura (r de Pearson = 0,772) como en la Figura complementaria 2e. Para explorar más a fondo el efecto de indicación de múltiples factores, se utiliza un análisis de correlación cruzada retardada (TLCC) para revelar el efecto de indicación de series temporales de estos factores44. Como se muestra en la Figura complementaria 3, AOD exhibe una sincronicidad sobresaliente con la ocurrencia de rayos sin compensación y mantiene una alta correlación con una compensación de -1 h, lo que indica que la tendencia de AOD puede marcar bien la tendencia de ocurrencia de rayos en el momento actual y predecir la ocurrencia de rayos en la hora siguiente, mientras que las variables meteorológicas que incluyen la humedad relativa (compensación de +4 h) y la temperatura (compensación de -2 h) muestran una indicación inferior de la ocurrencia de rayos. Por tanto, las observaciones de aerosoles muestran un gran potencial para indicar la aparición de rayos en términos de variación temporal.

En consecuencia, se puede anticipar un mejor rendimiento de la predicción de rayos mediante la utilización de modelos de aprendizaje automático mejor diseñados que incorporen información sobre aerosoles. El rendimiento de los modelos con y sin información de aerosoles se compara en escenarios de aplicación donde se requiere una POD alta, como se muestra en la Fig. 4. Cuando el umbral de POD es inferior al 70%, la contribución de la información de aerosoles a la previsibilidad de los rayos es mínima. Este fenómeno se puede atribuir a la información aportada por los datos meteorológicos y los registros históricos de rayos. Estas fuentes adicionales de información ayudan a capturar los patrones espaciales y temporales de la ocurrencia de rayos, reduciendo así la influencia de los aerosoles. Sin embargo, a niveles más altos de POD, la contribución significativa de la información de aerosoles se vuelve más prominente, dominando el rendimiento de la predicción. Cuando el umbral POD se establece por encima del 75 %, la diferencia en las tasas de rechazo correcto entre modelos con y sin información de aerosol supera el 10 %. Esto indica que los datos de aerosoles proporcionan información valiosa para la predicción de rayos, como lo demuestran las tasas mejoradas de rechazo correcto a medida que aumenta la demanda de POD. Sin embargo, lograr predicciones precisas de la aparición de rayos con una POD alta superior al 80% sigue siendo un desafío sin una comprensión profunda de los intrincados mecanismos que involucran a los aerosoles y otros factores que cuantifican el proceso completo de formación de rayos. Si bien los resultados sugieren que la información sobre aerosoles puede mejorar la previsibilidad de los rayos, todavía hay margen para seguir mejorando el rendimiento del modelo. Esto se puede lograr incorporando características cuantificables adicionales relacionadas con la formación de rayos.

Los dos modelos (con y sin información de aerosol como entrada del modelo) se comparan en términos de la tasa de rechazo correcta (1-FAR) dadas diferentes condiciones de POD.

La distribución estadística de AOD se muestra en la Fig. 5a, lo que revela que en la mayoría de los casos, los valores de AOD están por debajo de 0,2, lo que representa aproximadamente el 80% del total de casos. Luego, el análisis se centró en la relación entre el rendimiento del modelo y la carga de aerosol, como se ilustra en la Fig. 5b. A medida que el AOD aumenta hasta 0,2, ambos modelos demuestran una mejora en términos de CSI y FAR. En comparación con el modelo sin AOD, el modelo propuesto muestra una mayor robustez, con un FAR que oscila entre el 30% y el 50%, mientras que el otro modelo tiene dificultades para predecir la ocurrencia de rayos con un FAR superior al 50% para valores de AOD inferiores a 0,1, lo que representa alrededor de 40% del total de casos. La diferencia en CSI entre los modelos sigue siendo significativa en situaciones de bajo AOD. Sin embargo, a medida que el AOD aumenta a 0,4, el contraste entre los dos modelos disminuyó gradualmente. A medida que el AOD continúa aumentando, lo que podría indicar un evento de contaminación del aire, la discrepancia en el rendimiento del modelo se expande aún más. En esta etapa, la inclusión de información sobre aerosoles puede reducir aproximadamente el 40% de los informes de advertencias falsas.

un histograma de muestras de datos en términos de AOD; b rendimiento del modelo en términos de CSI a diferentes niveles de AOD para los modelos con y sin información de aerosoles como entrada; c histograma de muestras de datos en términos de hora local; d Distribución diurna del rendimiento del modelo en términos de CSI para los modelos con y sin información de aerosoles como entrada.

Las observaciones de aerosoles tienen un impacto significativo en la variabilidad temporal del rendimiento del modelo. Como se muestra en la Fig. 5d, el modelo de predicción de rayos con AOD demuestra un rendimiento estable durante todo el día. Durante el horario local antes de las 14:00 horas, ambos modelos presentan sólo diferencias menores. Sin embargo, después de las 2 de la tarde, las características del aerosol juegan un papel crucial en la mejora del rendimiento del modelo. La inclusión de información sobre aerosoles da como resultado una reducción del FAR de 0,10 a 0,15 después de las 2 p. m., lo que indica que el 25 % de las alertas tempranas falsas se evitan al considerar las características de los aerosoles. De manera similar, para CSI, la información de aerosoles contribuye a una elevación de CSI de 0,05 a 0,10. Es importante señalar que el período de tiempo durante el cual el rendimiento del modelo se ve mejorado por la información de aerosoles (de 3 a 11 p. m.) no se superpone completamente con el rango de tiempo de ocurrencia relativamente alta de rayos (de 6 p. m. a 2 a. m.). Esto sugiere que la información sobre aerosoles no indica directamente la aparición inmediata de rayos, sino que proporciona información sobre la tendencia de la aparición futura de rayos. Esta observación se alinea bien con el hallazgo presentado en la figura complementaria 3.

La contribución de las observaciones de aerosoles muestra patrones variables en las diferentes regiones. La Figura 4 complementaria ilustra la mejora del modelo a través de observaciones de aerosoles en CONUS. En la mayoría de las regiones, los aerosoles demuestran un impacto positivo en la POD del modelo de predicción de rayos, particularmente en las regiones sureste y medio oeste de CONUS. La importancia de los aerosoles se hace evidente en el sureste del CONUS, que experimenta las mayores densidades de destellos. Los resultados indican que la aparición de rayos se vuelve más detectable con la ayuda de observaciones de aerosoles, lo que resulta en una mejora notable de aproximadamente el 10%. Con respecto a la reducción del FAR debido a los aerosoles, la distribución de la mejora del modelo sigue patrones similares a los observados en términos de POD y CSI, siendo las regiones CONUS sureste y medio oeste las que más se benefician de las observaciones de aerosoles. Sin embargo, todavía hay ciertas áreas donde la incorporación de características de aerosoles podría afectar potencialmente el rendimiento del modelo, especialmente en las regiones de la costa oeste. Esto podría atribuirse a diferentes regímenes de efectos de los aerosoles, en particular la distribución espacial de los aerosoles (por ejemplo, carbono negro de los incendios forestales45) en la costa oeste.

El método Shapley Additive ExPlanation Approach (SHAP) sirve como una herramienta valiosa para interpretar modelos de aprendizaje automático y analizar sus características. La Figura 6 presenta un análisis de la importancia de las características, que revela las 10 características principales que más contribuyen a la predicción de rayos. Los nombres completos correspondientes a las siglas de las características se pueden encontrar en la Tabla complementaria 2. Entre estas variables, la densidad del destello emerge como el predictor más fuerte de los relámpagos, mientras que la importancia de los componentes de los aerosoles varía. El sulfato se destaca como el predictor más influyente de la ocurrencia de rayos, seguido por la sal marina, el carbono negro y los compuestos orgánicos, que muestran una importancia moderada en la predicción. La contribución de la composición de los aerosoles y las profundidades ópticas subraya su gran relevancia en la predicción de rayos. Las variables meteorológicas, tradicionalmente utilizadas como predictores de rayos, exhiben una capacidad moderada para predecir rayos de forma inmediata. Por ejemplo, la humedad relativa demuestra la mayor previsibilidad entre las variables climáticas, lo que se alinea con el conocimiento previo sobre los mecanismos de formación de rayos y respalda aún más la idea de que la ocurrencia de rayos favorece los altos niveles de humedad4,5,6,7,8. El análisis SHAP demuestra ser una herramienta valiosa para identificar si la composición de los aerosoles afecta positiva o negativamente la aparición de rayos. Los niveles crecientes de componentes de aerosoles como sulfato, compuestos orgánicos y sal marina corresponden a valores SHAP más altos, lo que indica su interpretación como factores potenciadores de los rayos según el modelo de aprendizaje automático. Por el contrario, el carbono negro presenta un efecto negativo sobre la aparición de rayos. Estos resultados son consistentes con investigaciones previas sobre el impacto de los componentes de los aerosoles en los rayos46,47. En la sección Discusión se proporciona una comparación y un análisis más detallados con la base de conocimientos existente. En consecuencia, optimizar el modelo de predicción requiere una combinación de caracterización de aerosoles y variables climáticas.

La importancia de las características se clasifica según el valor SHAP absoluto medio de las características.

En este estudio, proponemos un modelo basado en datos de observación de alta precisión para la predicción de la ocurrencia de rayos, utilizando el marco de aumento de gradiente LightGBM. Nuestro modelo integra observaciones de aerosoles y variables meteorológicas, lo que lo convierte en uno de los modelos de predicción de rayos más precisos disponibles actualmente (precisión = 94,3 %, POD = 75 %, FAR = 38 %, AUC = 0,727). Al incorporar estudios previos de observación y modelización que examinan la relación entre aerosoles y rayos, demostramos el impacto significativo de los aerosoles en la predicción de rayos. Los aerosoles influyen principalmente en los rayos a través de sus propiedades microfísicas y radiativas. Estudios anteriores han explorado varios modelos para la predicción inmediata de la ocurrencia de rayos, incluidas simulaciones numéricas y enfoques de aprendizaje automático. Sin embargo, estos enfoques aún no han alcanzado el nivel deseado de rendimiento del modelo. Numerosos estudios han identificado una mayor densidad de relámpagos en áreas metropolitanas o regiones a favor del viento, en parte atribuible a los efectos microfísicos de los aerosoles48,49. Los estudios de casos regionales, particularmente en el norte y centro de África, también han informado de la influencia de diferentes tipos de aerosoles en los rayos35. Estos estudios destacan que los efectos dominantes de los aerosoles, ya sean microfísicos o radiativos, dependen del tipo de aerosol y, en última instancia, afectan la velocidad de los rayos a través de la carga de aerosol. Sin embargo, en el CONUS la variabilidad en la carga y composición de los aerosoles es mucho mayor que en estudios anteriores, lo que plantea desafíos para desenredar estadísticamente los efectos de los tipos de aerosoles y la carga sola. El aprendizaje automático interpretable, capaz de capturar relaciones no lineales complejas dentro del modelo, ofrece una herramienta adecuada para analizar la contribución de las composiciones de aerosoles. En este estudio, aprovechando observaciones enriquecidas del GLM y empleando un modelo de aprendizaje automático interpretable, el análisis de características proporciona información sobre la influencia de las composiciones de aerosoles en la aparición de rayos. El análisis revela consistentemente un impacto negativo de las especies de carbono negro en los aerosoles en la frecuencia de los rayos, lo que se alinea con estudios teóricos que enfatizan el efecto de calentamiento del carbono negro, lo que conduce a cambios de convección e inhibe la aparición de rayos35,50,51. Además, el análisis subraya la importancia significativa de los aerosoles de sulfato, lo que concuerda con informes anteriores46. Como indican Jin et al.52, los aerosoles de sulfato promueven procesos microfísicos en fase de hielo, intensificando la actividad de los rayos. Independientemente de la composición del aerosol, se observa una contribución negativa a la aparición de rayos cuando la AOD supera un determinado umbral, lo que respalda las observaciones de Shi et al.53. Nuestro modelo propuesto también identifica los aerosoles de sal marina como estimulantes de la aparición de rayos, aunque informes recientes sugieren que el comportamiento de los aerosoles de sal marina varía según los modos de las partículas37. Esta discrepancia puede atribuirse a la carga relativamente menor de aerosoles de sal marina en el CONUS en comparación con las condiciones marítimas, combinada con el predominio de aerosoles de modo fino en tierra. En general, el análisis de características demuestra un fuerte acuerdo con los estudios teóricos y de modelado de la ocurrencia de rayos, lo que ofrece un enfoque potencial para parametrizar la ocurrencia de rayos en modelos numéricos en el futuro.

En el apartado de Resultados se ha analizado la aplicabilidad del modelo propuesto en función de las condiciones meteorológicas y la información de aerosoles. El modelo demuestra un sólido rendimiento en regiones con altas densidades de rayos y cargas de aerosoles moderadas y altas. Dado que las regiones con alta demanda de protección contra rayos coinciden en gran medida con las regiones donde el modelo funciona bien, se puede aplicar de manera efectiva en áreas donde se necesita urgentemente un modelo preciso de predicción de rayos para mitigar las pérdidas económicas causadas por eventos extremos de rayos. Sin embargo, el modelo muestra una precisión limitada en regiones con bajas frecuencias de rayos o baja carga de aerosoles, observadas principalmente en el CONUS occidental. En estas regiones, se ha descubierto que muchos casos presentan una gran incertidumbre a la hora de predecir la aparición de rayos. Esta aplicabilidad reducida se puede atribuir a la capacidad limitada de los modelos para manejar el conjunto de datos desequilibrado entre casos activos e inactivos contra rayos. A pesar de los esfuerzos realizados en este estudio para abordar este problema de desequilibrio, como la pérdida focal como reemplazo de la función de pérdida convencional, este desafío aún restringe la aplicación del modelo de predicción en regiones con escasez de rayos. Para mejorar la aplicabilidad del modelo en el CONUS occidental, las mejoras futuras en los modelos de aprendizaje automático deberían centrarse en abordar el problema del desequilibrio. Al abordar este desafío, se puede mejorar el rendimiento y la aplicabilidad del modelo en regiones con bajas frecuencias de rayos.

El desarrollo de modelos basados ​​en datos depende en gran medida de la calidad de los conjuntos de datos de observación. En el contexto de las observaciones de aerosoles, los datos actuales se obtienen de los productos de pronóstico CAMS, que incorporan observaciones satelitales en tiempo real en modelos numéricos para simular la composición atmosférica. En este estudio, proponemos la utilización de observaciones de aerosoles en tiempo real como predictores de la aparición de rayos. Idealmente, las observaciones directas de aerosoles desde satélites capturarían con precisión la composición de los aerosoles y permitirían una predicción precisa de los rayos. Sin embargo, los productos en aerosol existentes enfrentan limitaciones debido a imágenes satelitales incompletas y una cobertura inadecuada de información válida sobre aerosoles. A medida que continúan evolucionando los avances en la recuperación de aerosoles por satélite, se espera que los modelos de predicción de rayos basados ​​en aerosoles en tiempo real muestren un rendimiento mejorado.

En este estudio, el conjunto de datos de las observaciones de la ocurrencia de rayos se recupera del satélite geoestacionario GLM a bordo GOES-16, que es un detector transitorio óptico de infrarrojo cercano de un solo canal a bordo de un satélite54,55,56. El GLM es el sensor a bordo de un satélite geoestacionario que se puede utilizar para mapear el total de relámpagos con observaciones regionales continuas y una resolución espacial fina. El sensor GLM de alta resolución (1372 × 1300 píxeles) está equipado con un dispositivo de carga acoplada (CCD) con un filtro de interferencia de banda estrecha que funciona en el rango del infrarrojo cercano (777,4 nm), con un amplio campo de visión (FOV) que cubre la mayor parte de hemisferio occidental57. La resolución espacial de GLM es de 8 km en el nadir, alcanzando los 14 km en los bordes, registra rayos cada ~2 ms y entrega un archivo de datos compilados cada 20 s58,59. GLM proporciona tres niveles de observaciones: eventos, grupos y destellos, que representan la iluminación individual con una resolución de 2 ms, eventos de rayos en la misma ventana de tiempo de 2 ms y grupos de rayos que se superponen dentro de 15 km en el espacio 330 ms en el tiempo, respectivamente ( Goodman et al., 2013). En este estudio, utilizamos el nivel de destello de los productos GLM para etiquetar la aparición de rayos dentro de un píxel. Los productos flash GLM detectan todo tipo de rayos de forma continua, con una fina resolución espacial y una eficiencia de detección superior al 70%30. En este estudio, recuperamos el producto de datos GLM L2+ de la serie GOES-R (GRGLMPROD) para nuestro análisis. Debido a las ventajas anteriores del GLM, la observación de la región concentrada que incluye los Estados Unidos contiguos con detección de rayos con alta resolución temporal (20 s) y cobertura espacial completa es posible para enriquecer las muestras válidas para la predicción de rayos basada en datos de observación. modelo. La Figura 3 muestra la distribución de la densidad de rayos en verano en CONUS. La mayoría de los relámpagos ocurren en el CONUS sureste, mientras que el CONUS occidental no observa relámpagos frecuentes durante el período de estudio. Las regiones costeras del sureste del CONUS muestran un mayor registro de ocurrencia de rayos que las regiones del interior. La mayor densidad de relámpagos se encuentra en Florida (valor medio de 6,40 relámpagos/km2 y desviación estándar de 5,79 relámpagos/km2).

Para caracterizar mejor los aerosoles con una cobertura espacial completa, la información de aerosoles utilizada en este modelo consiste en la profundidad óptica del aerosol de cinco componentes del aerosol (incluido el carbono negro, el polvo, el carbono orgánico, el sulfato y la sal marina) y la concentración superficial de PM2,5 que representan el nivel inferior de aerosol como complemento de la información vertical del aerosol. Para cumplir con la predicción inmediata de la ocurrencia de rayos, en este estudio se obtienen productos de pronóstico de aerosoles. La profundidad óptica del componente individual del aerosol se obtiene de los productos de pronóstico de la composición atmosférica global del Servicio de Monitoreo de la Atmósfera de Copernicus (CAMS)60,61. El conjunto de datos es un producto a nivel horario proporcionado por el servicio de pronóstico en tiempo real a partir de la asimilación combinando un pronóstico anterior con observaciones satelitales actuales.

El conjunto de datos de PM2.5 espacialmente continuo y por hora en tiempo real se obtiene siguiendo un método publicado por Zeng62, que utiliza modelos de aprendizaje automático para estimar PM2.5 de superficie espacialmente continua a nivel horario en función de las condiciones meteorológicas y la información auxiliar. En este método, las mediciones fundamentales in situ se obtienen de la red de monitoreo del Sistema de Calidad del Aire (AQS) operada por la Agencia de Protección Ambiental de los Estados Unidos. Los conjuntos de datos se validan mediante un método de validación cruzada de 10 veces con R2 de 0,791 y RMSE de 4,33 μg/m3, como se muestra en la figura complementaria 6a. La Figura complementaria 6b muestra la distribución mapeada de PM2.5 con continuidad espacial como resultado de la estimación del modelo.

Al igual que en estudios anteriores14,17, en el modelo de predicción se seleccionan seis factores meteorológicos que tienen ciertas indicaciones sobre los rayos, incluyendo la presión superficial (SP), la temperatura a 500 hPa (T500), la humedad relativa a 500 hPa (SH), 10 m Velocidad del viento del componente U a 500 hPa (UW), velocidad del viento del componente V a 10 m a 500 hPa (VW)63. Para ser coherente con el AOD, los factores meteorológicos seleccionados se obtienen del mismo conjunto de datos de pronósticos de composición atmosférica global del CAMS para evitar cualquier error causado por la heterogeneidad de las fuentes de datos.

Tanto el pronóstico de composición de aerosoles como el pronóstico meteorológico de CAMS se interpolaron en cuadrículas de 0,25° × 0,25° y un nivel temporal de una hora mediante interpolación bilineal. Las estadísticas de todas las variables incluidas en el conjunto de datos se muestran en la Tabla complementaria 2.

Una vez finalizada la recopilación de datos, el conjunto de datos GLM y los productos CAMS se preprocesan mediante una cuadrícula de 0,25°, seguido del filtrado de datos donde se eliminan del conjunto de datos los ruidos sospechosos y los valores atípicos. Los ruidos y valores atípicos se definen como la ocurrencia de un rayo cuyo destello se registra menos de cinco veces en 5 minutos (aproximadamente en 15 archivos), considerando la continuidad espacial y temporal intrínseca del rayo.

En este estudio, seleccionamos el modelo LightGBM para pronosticar la aparición de rayos en la próxima hora (Fig. 7), considerando su excelente desempeño en tareas de clasificación manteniendo un bajo costo de cálculo.

Flujo del modelo para integrar el conjunto de datos meteorológicos, de aerosoles y auxiliares en el modelo LightGBM y generar la predicción de la aparición de rayos en la hora futura.

Como modelo de aprendizaje automático altamente eficiente basado en el árbol de decisión de aumento de gradiente, LightGBM se ha aplicado ampliamente debido a sus ventajas de bajo costo computacional y alta precisión de aprendizaje, especialmente cuando se procesan conjuntos de datos grandes y complejos64. Dado el gran conjunto de datos horario y espacialmente continuo para la predicción de rayos, LightGBM se considera la herramienta más adecuada debido a su tiempo de procesamiento de cálculo muy reducido y su alta precisión.

Los hiperparámetros del modelo LightGBM se optimizaron utilizando una estrategia de búsqueda de cuadrícula, donde se probaron varias combinaciones de hiperparámetros en lotes. Se seleccionó la mejor combinación de hiperparámetros en función de los resultados de estas pruebas. La configuración optimizada de los hiperparámetros se puede encontrar en la Tabla complementaria 3.

Para abordar el posible problema de desequilibrio de datos (baja fracción de casos activos por rayos en el total de casos), se implementa la función de pérdida focal en el modelo lightGBM, con la expresión de la función de pérdida en la ecuación. (1). Los hiperparámetros de ponderación α y γ se introdujeron en la capa LightGBM para enfatizar las clases positivas mal clasificadas. En nuestro proceso de optimización, establecemos α = 0,75 y γ = 0 (en la figura complementaria 5) para lograr el equilibrio deseado entre precisión y recuperación en las predicciones del modelo.

dónde:

Los parámetros y denotan la clase de verdad fundamental y p denota la probabilidad estimada del modelo para la clase con etiqueta y = 1.

El modelo LightGBM se puede expresar como la ecuación. (2), donde el subíndice t representa el momento actual, mientras que t + 1 representa el estado del rayo en la hora siguiente, que es el objetivo de la predicción. El resultado de la predicción del modelo es un resultado de clasificación binaria, donde 0 representa que no se produjeron relámpagos y 1 representa que se produjeron relámpagos en la siguiente hora. La información temporal se captura mediante la inclusión del día del año (DOY) y la hora local (HH) como características. Para abordar la importancia de los aerosoles, la ecuación. (3) elimina la información sobre aerosoles para predecir la ocurrencia de rayos y se compara con la ecuación. (2).

El período de estudio es el verano de 2020 (junio, julio y agosto), cuando los rayos son los más frecuentes a lo largo de un año, y hay 37.415.530 registros para entrenar y probar el modelo LightGBM. También evaluamos la transferibilidad del modelo probándolo en el conjunto de datos del verano de 2021, aunque se entrenó únicamente en el conjunto de datos del verano de 2020.

En este estudio, el rendimiento del modelo se evalúa mediante un método de validación cruzada de 10 días, que es un enfoque de evaluación común para evaluar el rendimiento general del modelo. En cada pliegue, los conjuntos de datos se dividen en días consecutivos que abarcan aproximadamente 1/10 del período total de estudio y, posteriormente, se asignan como conjunto de prueba, mientras que otras muestras de datos se asignan como conjunto de entrenamiento. Luego, el modelo de aprendizaje automático LightGBM se entrena con el conjunto de entrenamiento y se evalúa su rendimiento en el conjunto de prueba. El proceso se repite 10 veces hasta que todas las muestras hayan sido asignadas como conjunto de prueba por una vez. El rendimiento general del modelo se determina tomando el promedio de las 10 ejecuciones.

Para interpretar el modelo de aprendizaje automático y abordar la comprensión de las características, se aplica el método Shapley Additive ExPlanation Approach (SHAP) en el modelo LightGBM (M1). SHAP se ha utilizado ampliamente en estudios recientes para interpretar los modelos de aprendizaje automático basados ​​en redes neuronales y en árboles65,66,67. El enfoque SHAP distribuye las ganancias totales entre los jugadores basándose en la teoría de juegos de coalición68. SHAP puede recuperar la contribución cuantitativa de cada característica en cada muestra para un modelo de aprendizaje automático bien entrenado, que puede explicar el modelo de aprendizaje automático e interpretar la importancia de la característica en una vista específica de la muestra. En la teoría SHAP, la diferencia de predicción de un modelo por parte de una variable es aportada por su contribución marginal. Considerando los efectos interactivos entre las variables, se calcula cada combinación de variables posible de cada muestra69. Por lo tanto, los resultados pueden interpretarse como una suma lineal de atribuciones de características, como se expresa en la ecuación. (4). Al interpretar el modelo LightGBM con SHAP, podemos obtener la contribución individual de cada característica a la ocurrencia de rayos, y de ahí se puede derivar la importancia relativa de cada variable.

dónde

SHAPi representa el valor SHAP de la variable i,

SHAP0 representa el valor esperado de la salida del modelo para el conjunto de datos, \({\text{LN}}_{\text{prob}}\) muestra la probabilidad prevista de ocurrencia de rayos, un valor continuo entre 0 y 1.

La observación de rayos realizada por Geostationary Lightning Mapper se recupera a través de https://www.avl.class.noaa.gov/. La observación de rayos realizada por Lightning Mapping Array se recupera a través de https://search.earthdata.nasa.gov/. Las observaciones de AQS PM2.5 basadas en sitios a nivel del suelo se obtienen de https://aqs.epa.gov/aqsweb/airdata/. Los datos meteorológicos y de aerosoles del CAMS se obtienen de https://ads.atmosphere.copernicus.eu/. Los datos derivados que respaldan los hallazgos de este estudio están disponibles del autor correspondiente previa solicitud razonable. Los conjuntos de datos de demostración para el entrenamiento de modelos están disponibles en Zenodo70.

Los códigos fuente importantes y los códigos de procesamiento relativos para el análisis de este estudio están disponibles en Github71.

Borden, KA & Cutter, SL Patrones espaciales de mortalidad por amenazas naturales en Estados Unidos. En t. J. Salud Geogr. 7, 1-13 (2008).

Artículo de Google Scholar

Cooper, MA & Holle, RL Reducción de las lesiones por rayos en todo el mundo, 1.ª ed. (Springer International Publishing, 2019).

Levy, H., Moxim, W. y Kasibhatla, P. Una fuente de rayos global tridimensional dependiente del tiempo de NOx troposférico. J. Geophys. Res. Atmos. 101, 22911–22922 (1996).

Artículo de Google Scholar

Carey, L. & Rutledge, S. Un estudio de caso de radar multiparamétrico de la evolución microfísica y cinemática de una tormenta productora de rayos. Meteorito. Atmos. Física. 59, 33–64 (1996).

Artículo de Google Scholar

Kamra, AK y Ramesh Kumar, P. Variabilidad regional en la actividad de los rayos en el sur de Asia. En t. J. Climatol. 41, 625–646 (2021).

Artículo de Google Scholar

Kotroni, V. & Lagouvardos, K. Los rayos en el Mediterráneo y su relación con la temperatura de la superficie del mar. Reinar. Res. Letón. 11, 034006 (2016).

Artículo de Google Scholar

Xiong, YJ, Qie, XS, Zhou, YJ, Yuan, T. & Zhang, TL Respuestas regionales de la actividad de los rayos a la humedad relativa de la superficie. Mentón. J. Geophys. 49, 311–318 (2006).

Artículo de Google Scholar

Griffiths, R. & Phelps, C. Los efectos de la presión del aire y el contenido de vapor de agua en la propagación de serpentinas de corona positivas y sus implicaciones para la iniciación de rayos. Meteorol QJR. Soc. 102, 419–426 (1976).

Artículo de Google Scholar

Yair, Y. et al. Predicción del potencial de actividad de rayos en tormentas mediterráneas basándose en los campos dinámicos y microfísicos del modelo Weather Research and Forecasting (WRF). J. Geophys. Res. Atmos. 115 (2010).

López, P. Una parametrización de rayos para el sistema de pronóstico integrado ECMWF. Lun. Tiempo Rev. 144, 3057–3075 (2016).

Artículo de Google Scholar

Gharaylou, M., Farahani, MM, Mahmoudian, A. y Hosseini, M. Predicción de la actividad de los rayos utilizando el modelo WRF-ELEC: impacto de las condiciones iniciales y de contorno. J. Atmós. Sol. Terr. Física. 210, 105438 (2020).

Artículo de Google Scholar

Zepka, G., Pinto, O. Jr & Saraiva, A. Predicción de rayos en el sureste de Brasil utilizando el modelo WRF. Atmos. Res. 135, 344–362 (2014).

Artículo de Google Scholar

Giannaros, TM, Kotroni, V. y Lagouvardos, K. Predicción de la actividad de los rayos en Grecia con el modelo Weather Research and Forecasting (WRF). Atmos. Res. 156, 1-13 (2015).

Artículo de Google Scholar

Mostajabi, A., Finney, DL, Rubinstein, M. y Rachidi, F. Predicción inmediata de la aparición de relámpagos a partir de parámetros meteorológicos comúnmente disponibles utilizando técnicas de aprendizaje automático. npj Clim. Atmos. Ciencia. 2, 1-15 (2019).

Artículo de Google Scholar

Pakdaman, M., Naghab, SS, Khazanedari, L., Malbousi, S. y Falamarzi, Y. Predicción de rayos utilizando un enfoque de aprendizaje conjunto para el noreste de Irán. J. Atmós. Sol. Terr. Física. Rev.209, 105417 (2020).

Artículo de Google Scholar

Leinonen, J., Hamann, U., Germann, U. y Mecikalski, JR Predicción inmediata de los peligros de las tormentas mediante el aprendizaje automático: el impacto de las fuentes de datos en el rendimiento. Nat. Peligros Sistema Tierra Ciencia. 22, 577–597 (2022).

Artículo de Google Scholar

Luna, S.-H. y Kim, Y.-H. Predicción de relámpagos alrededor de la Península de Corea mediante el posprocesamiento de datos del ECMWF mediante SVM y submuestreo. Atmos. Res. 243, 105026 (2020).

Artículo de Google Scholar

Essa, Y., Ajoodha, R. & Hunt, HG Una red neuronal recurrente LSTM para la predicción de relámpagos en el sur de África utilizando datos históricos de series temporales. En: Conferencia IEEE Asia-Pacífico de 2020 sobre ciencias de la computación e ingeniería de datos (CSDE) (IEEE, 2020).

Leal, AF, Rakov, V., Alves, ER & Lopes, MN Estimación de distancias de rayos CG utilizando mediciones de campo E de una sola estación y técnicas de aprendizaje automático. En: Simposio Internacional sobre Protección contra Rayos 2019 (XV SIPDA) (IEEE, 2019).

Coombs, ML y cols. Previsión y detección a corto plazo de explosiones durante la erupción del volcán Bogoslof, Alaska, en 2016-2017. Frente. Ciencia de la Tierra. 6, 122 (2018).

Artículo de Google Scholar

Cecil, DJ, Buechler, DE y Blakeslee, RJ Climatología TRMM LIS de aparición de tormentas y tasas de relámpagos condicionales. J. Clim. 28, 6536–6547 (2015).

Artículo de Google Scholar

Rudlosky, SD y Shea, DT Evaluación del rendimiento de WWLLN en relación con TRMM/LIS. Geofís. Res. Letón. 40, 2344–2348 (2013).

Artículo de Google Scholar

Honda, T., Sato, Y. & Miyoshi, T. Impactos potenciales de las observaciones de relámpagos en la predicción numérica del tiempo con procesos de rayos explícitos. J. Geophys. Res. Atmos. 126, e2021JD034611 (2021).

Artículo de Google Scholar

Silva, SJ, Keller, CA y Hardin, J. Uso de un enfoque de aprendizaje automático explicable para caracterizar los errores del modelo del sistema terrestre: aplicación del análisis SHAP para modelar la aparición de relámpagos. J. Adv. Modelo. Sistema Tierra. 14, e2021MS002881 (2022).

Artículo de Google Scholar

Heuscher, L., Liu, C., Gatlin, P. & Petersen, WA Relación entre rayos, precipitaciones y características ambientales en latitudes medias/altas desde una perspectiva GLM y GPM. J. Geophys. Res. Atmos. 127, e2022JD036894 (2022).

Artículo de Google Scholar

Rodríguez‐Pérez, JR, Ordóñez, C., Roca‐Pardiñas, J., Vecín‐Arias, D. & Castedo‐Dorado, F. Evaluación de la ocurrencia de incendios provocados por rayos mediante modelos aditivos espacialmente generalizados: un estudio de caso en el centro de España. Anal de riesgo. 40, 1418-1437 (2020).

Artículo de Google Scholar

Schultz, CJ, Andrews, VP, Genareau, KD y Naeger, AR Observaciones de relámpagos en relación con las transiciones en la actividad volcánica durante la erupción de Fuego del 3 de junio de 2018. Ciencia. Representante 10, 1-12 (2020).

Artículo de Google Scholar

Murphy, KM, Bruning, EC, Schultz, CJ & Vanos, JK Una evaluación espaciotemporal del riesgo de rayos utilizando datos cartográficos de rayos. Clima climático. Soc. 13, 571–589 (2021).

Artículo de Google Scholar

Montañá, J. et al. Uso potencial de la detección de rayos desde el espacio en sistemas de energía eléctrica. eléctrico. Sistema de energía. Res. 213, 108730 (2022).

Artículo de Google Scholar

Bateman, M. & Mach, D. Eficiencia de detección preliminar y evaluación de la tasa de falsas alarmas del Geostationary Lightning Mapper en el satélite GOES-16. J. Aplica. Sensores remotos 14, 032406 (2020).

Artículo de Google Scholar

Thornton, JA, Virts, KS, Holzworth, RH y Mitchell, TP Mejora de los rayos sobre las principales rutas marítimas oceánicas. Geofís. Res. Letón. 44, 9102–9111 (2017).

Artículo de Google Scholar

Altaratz, O., Kucienska, B., Kostinski, A., Raga, GB y Koren, I. Asociación global de aerosol con densidad de destello de relámpagos intensos. Reinar. Res. Letón. 12, 114037 (2017).

Artículo de Google Scholar

Altaratz, O., Koren, I., Yair, Y. & Price, C. El impacto de los aerosoles en la actividad de los rayos en las tormentas eléctricas. En: XII Conferencia Plinius sobre Tormentas del Mediterráneo (2010).

Liu, Y. et al. Efectos de los aerosoles sobre las características de los rayos: una comparación de regímenes limpios y contaminados. Geofís. Res. Letón. 47, e2019GL086825 (2020).

Google Académico

Wang, Q., Li, Z., Guo, J., Zhao, C. y Cribb, M. El impacto climático de los aerosoles en la frecuencia de los relámpagos: ¿es detectable a partir de mediciones a largo plazo? Atmos. Química. Física. 18, 12797–12816 (2018).

Artículo de Google Scholar

Sun, M. y col. Efectos de los aerosoles sobre la electrificación y las descargas de rayos en una tormenta multicelular simulada por el modelo WRF-ELEC. Atmos. Química. Física. 21, 14141–14158 (2021).

Artículo de Google Scholar

Pan, Z. y col. La espesa espuma del mar inhibe los rayos. Nat. Comunitario. 13, 1–7 (2022).

Artículo de Google Scholar

Engel-Cox, JA, Holloman, CH, Coutant, BW y Hoff, RM Evaluación cualitativa y cuantitativa de datos de sensores satelitales MODIS para la calidad del aire a escala regional y urbana. Atmos. Reinar. 38, 2495–2509 (2004).

Artículo de Google Scholar

Hu, X., Waller, L., Lyapustin, A., Wang, Y. & Liu, Y. Tendencias espaciales y temporales de 10 años de las concentraciones de PM 2,5 en el sureste de EE. UU. estimadas utilizando datos satelitales de alta resolución. Atmos. Química. Física. 14, 6301–6314 (2014).

Artículo de Google Scholar

Fuchs, BR & Rutledge, SA Investigación de ubicaciones de relámpagos en convección aislada utilizando observaciones LMA. J. Geophys. Res. Atmos. 123, 6158–6174 (2018).

Artículo de Google Scholar

López, JA et al. Dimensión espacio-temporal de los relámpagos basada en Lightning Mapping Array tridimensional. Atmos. Res. 197, 255–264 (2017).

Artículo de Google Scholar

Tao, WK, Chen, JP, Li, Z., Wang, C. y Zhang, C. Impacto de los aerosoles en las nubes convectivas y la precipitación. Rev. Geophys. 50 (2012).

Altaratz, O., Koren, I., Remer, L. y Hirsch, E. Fortalecimiento de las nubes mediante aerosoles: acoplamiento entre microfísica y dinámica. Atmos. Res. 140, 38–60 (2014).

Artículo de Google Scholar

Shen, C. Análisis de la correlación cruzada retardada en el tiempo sin tendencia entre dos series de tiempo no estacionarias. Física. Letón. A 379, 680–687 (2015).

Artículo de Google Scholar

Larkin, NK, Raffuse, SM & Strand, TM Emisiones de incendios forestales, carbono y clima: inventarios de emisiones de EE. UU. Ecológico. Gestionar. 317, 61–69 (2014).

Artículo de Google Scholar

Zhao, P. y col. Distintos efectos de los aerosoles sobre los rayos de nube a tierra en las regiones de meseta y cuenca de Sichuan, suroeste de China. Atmos. Química. Física. 20, 13379–13397 (2020).

Artículo de Google Scholar

Proestakis, E. et al. Aerosoles y actividad de rayos: el efecto del perfil vertical y el tipo de aerosol. Atmos. Res. 182, 243–255 (2016).

Artículo de Google Scholar

Orville, RE y cols. Mejora de los rayos de nube a tierra sobre Houston, Texas. Geofís. Res. Letón. 28, 2597–2600 (2001).

Artículo de Google Scholar

Van Den Heever, SC & Cotton, WR Impactos de los aerosoles urbanos en las tormentas convectivas a favor del viento. J. Aplica. Meteorol. Climatol. 46, 828–850 (2007).

Artículo de Google Scholar

Zhao, P. y col. Relación potencial entre aerosoles y rayos positivos de nube a tierra durante la estación cálida en Sichuan, suroeste de China. Frente. Reinar. Ciencia. 1112 (2022).

Menon, S., Hansen, J., Nazarenko, L. y Luo, Y. Efectos climáticos de los aerosoles de carbono negro en China e India. Ciencia 297, 2250–2253 (2002).

Artículo de Google Scholar

Jin, Q., Grandey, BS, Rothenberg, D., Avramov, A. & Wang, C. Impactos en los efectos radiativos de las nubes inducidos por aerosoles coexistentes convertidos a partir de emisiones de DMS marítimos y de envíos internacionales. Atmos. Química. Física. 18, 16793–16808 (2018).

Artículo de Google Scholar

Shi, Z., Wang, H., Tan, Y., Li, L. y Li, C. Influencia de los aerosoles en la actividad de los rayos en el centro y este de China. Atmos. Ciencia. Letón. 21, e957 (2020).

Artículo de Google Scholar

Edgington, S., Tillier, C. y Anderson, M. Diseño, calibración y pruebas en órbita del mapeador de rayos geoestacionario en el satélite meteorológico de la serie GOES-R. En: Conferencia Internacional sobre Óptica Espacial — ICSO 2018 (Sociedad Internacional de Óptica y Fotónica, 2019).

Mach, DM Estabilidad del algoritmo de agrupamiento de Lightning Mapper geoestacionario. J. Geophys. Res. Atmos. 125, e2019JD031900 (2020).

Artículo de Google Scholar

Rudlosky, SD, Goodman, SJ, Virts, KS & Bruning, EC Observaciones iniciales del mapeador de rayos geoestacionarios. Geofís. Res. Letón. 46, 1097-1104 (2019).

Artículo de Google Scholar

Goodman, SJ y cols. El mapeador de rayos geoestacionario (GLM) GOES-R. Atmos. Res. 125, 34–49 (2013).

Artículo de Google Scholar

Oda, PS, Enoré, DP, Mattos, EV, Gonçalves, WA & Albrecht, RI Una evaluación inicial de la distribución de la densidad de velocidad de destello (FRD) total en Brasil a partir de observaciones del mapeador de rayos geoestacionario (GLM) GOES-16. Atmos. Res. 270, 106081 (2022).

Artículo de Google Scholar

Peterson, MJ y cols. La Nueva Organización Meteorológica Mundial certificó los extremos de los relámpagos megaflash por su distancia (709 km) y duración (16,73 s) registrados desde el espacio. Geofís. Res. Letón. 47, e2020GL088888 (2020).

Artículo de Google Scholar

Flemming, J. y col. Química troposférica en el Sistema Integrado de Predicción del ECMWF. Geociencias. Desarrollo de modelos. 8, 975–1003 (2015).

Artículo de Google Scholar

Courtier, P., Thépaut, JN & Hollingsworth, A. Una estrategia para la implementación operativa de 4D-Var, utilizando un enfoque incremental. Meteorol QJR. Soc. 120, 1367-1387 (1994).

Artículo de Google Scholar

Zeng, Z. y col. Estimación horaria de PM2 en superficie. 5 concentraciones en toda China a partir de observaciones meteorológicas de alta densidad mediante aprendizaje automático. Atmos. Res. 254, 105516 (2021).

Artículo de Google Scholar

Hersbach, H. y col. El reanálisis global del ERA5. Meteorol QJR. Soc. 146, 1999-2049 (2020).

Ke, G. y col. Lightgbm: un árbol de decisión que impulsa el gradiente altamente eficiente. Proc. Adv. Inf. neuronal. Proceso. Sistema. 30, 3146–3154 (2017).

Google Académico

Wu, Y., Lin, S., Shi, K., Ye, Z. y Fang, Y. Predicción estacional de PM2 diaria. 5 concentraciones con aprendizaje automático interpretable: un estudio de caso de Beijing, China. Reinar. Ciencia. Contaminación. Res. 29, 45821–836 (2022).

Hou, L. y col. Revelar a los buzos de la contaminación por neblina mediante aprendizaje automático explicable. Reinar. Ciencia. Tecnología. Letón. 9 (2022).

García, MV & Aznarte, JL Explicaciones de los aditivos de Shapley para la predicción de NO2. Ecológico. inf. 56, 101039 (2020).

Artículo de Google Scholar

Shapley, LS en Contribuciones a la teoría de juegos II (eds. Kuhn, H. y Tucker, A.) (Princeton University Press, 1953).

Lundberg, SM y Lee, S.-I. Un enfoque unificado para interpretar las predicciones de los modelos. Proc. Adv. Inf. neuronal. Proceso. Sistema. 30 (2017).

Song, G., Li, S. & Xing, J. Archivo de datos de predicción inmediata de rayos basado en aprendizaje automático, Zenodo https://doi.org/10.5281/zenodo.8141921 (2023).

Canción, G. lightning-nowcast-model, Github https://github.com/ARSgesong/lightning-nowcast-model (2023).

Descargar referencias

Este estudio fue financiado por la Fundación Nacional de Ciencias Naturales de China [No: 41975022] y la Fundación para Grupos de Investigación Innovadores de la Fundación de Ciencias Naturales de Hubei [No: 2020CFA003].

Laboratorio clave de Hubei de teledetección cuantitativa de la tierra y la atmósfera, Escuela de teledetección e ingeniería de la información, Universidad de Wuhan, 430000, Hubei, China

Ge Song y Siwei Li

Laboratorio estatal clave de ingeniería de la información en topografía, cartografía y teledetección, Universidad de Wuhan, Wuhan, China

Si Wei Li

Laboratorio Hubei Luojia, Universidad de Wuhan, 430000, Hubei, China

Si Wei Li

Departamento de Ingeniería Civil y Ambiental, Universidad de Tennessee, Knoxville, TN 37996, EE. UU.

Jia Xing

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

SG: Metodología, Investigación, Desarrollo de modelos, Análisis formal, Escritura: preparación del borrador original, Escritura: revisión y edición. LS: Conceptualización, Investigación, Adquisición de fondos, Supervisión, Redacción—Revisión y Edición. XJ: Supervisión, redacción: revisión y edición.

Correspondencia a Siwei Li.

Los autores declaran no tener conflictos de intereses.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Song, G., Li, S. & Xing, J. Lightning nowcasting con aprendizaje automático basado en aerosoles y conjunto de datos enriquecidos por satélite. npj Clim Atmos Sci 6, 126 (2023). https://doi.org/10.1038/s41612-023-00451-x

Descargar cita

Recibido: 22 de febrero de 2023

Aceptado: 10 de agosto de 2023

Publicado: 24 de agosto de 2023

DOI: https://doi.org/10.1038/s41612-023-00451-x

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

COMPARTIR