Aplicación de métodos agregados en la detección de puntos atípicos en series de tiempo meteorológicas

Application of ensemble methods in outlier point detection in meteorological time series

Autoría SCIMAGO INSTITUTIONS RANKINGS

Resumen

Para este trabajo de investigación, se estudió el desempeño de los métodos agregados en la detección de valores atípicos punto en series temporales uni-variables meteorológicas, utilizando la métrica F1 como medida de desempeño. Para esto se creó un programa que permite aplicar 3 clasificadores no agregados (regresión de soporte vectorial, ARIMA, redes bayesianas) y 3 clasificadores agregados (apilamiento, bagging y AdaBoost) a 3 conjuntos de datos de mediciones meteorológicas (precipitación, temperatura máxima y radiación solar).

Usando esta aplicación, se ejecutó un diseño experimental para comparar los clasificadores. En este diseño, primero se obtuvo el promedio de F1 de los clasificadores realizando múltiples pruebas en cada conjunto de datos. Luego, mediante una prueba estadística de hipótesis se compararon los promedios obtenidos por los clasificadores para determinar si las diferencias observadas eran significativas. Finalmente, se realizó un análisis de los resultados, enfocado en comparar el desempeño de los clasificadores agregados contra el desempeño del mejor clasificador no agregado en cada conjunto de datos.

En general se encontró que es posible mejorar significativamente el desempeño al detectar valores atípicos punto en algunas series temporales uni-variables utilizando métodos agregados. Sin embargo, para lograr esta mejora se deben reunir condiciones que, aunque varían dependiendo del método agregado, en general apuntan a mejorar la diversidad de los clasificadores base. Cuando no se reúnen estas condiciones, los métodos agregados no tuvieron una diferencia significativa en el desempeño con respecto al algoritmo no agregado que obtuvo el mejor desempeño en el conjunto de datos.

Palabra clave: Valores atípicos; Métodos agregados; ARIMA; Regresión de soporte vectorial; SVR; Red bayesiana; Apilamiento; Bagging; AdaBoost.

[46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63]

-	Entrenamiento	Validación	Pruebas
Precipitación diaria	6000	3000	12000 (40 conjuntos de 300 valores )
Temperatura máxima	3000	1500	6000 (40 conjuntos de 150 valores )
Exposición solar	1300	650	2600 (40 conjuntos de 65 valores )

[70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91]

Conjunto de datos	Rango percentil inferior	Rango inferior	Rango percentil superior	Rango superior
Precipitación diaria	-	-	98 - 100	20 - 66
Temperatura máxima	0 - 1	4,4 - 10,4	99 - 100	37 ,9 - 46, 4
Exposición solar	0 - 1	0,3 - 2,7	99 - 100	33 ,1 - 34, 5

[129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151]

Promedio de F1	Precipitación	Temperatura Máxima	Exposición Solar
Mejor clasificador no agregado	0.807 (SVR)	0.764 (ARIMA)	0.719 ( SVR )
Apilamiento	0.780	0.885	0.683
Bagging	0.811	0.752	0.714
AdaBoost	0.807	0.763	0.711

[163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190]

-	Precipitación	Temperatura Máxima	Exposición Solar
F1 Mejor Clasificador agregado	0.811 (Bagging)	0.885 (Apilamiento)	0.714 (Bagging)
F1 Mejor Clasificador no agregado	0.807 (SVR)	0.764 (ARIMA)	0.719 (SVR)
Diferencia F1	0.004	0.121	-0.005
Valor-p Nemenyi	0.9996	0.0084	1.0000
Diferencia significativa?	No	Sí	No

[204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221]

Promedio de coeficiente kappa	Precipitación	Temperatura Máxima	Exposición Solar
Apilamiento	0.846	0.460	0.277
Bagging	0.964	0.938	0.837
AdaBoost	0.349	0.627	0.251

[235] [236] [240] [241] [242] [243] [244] [245] [246] [247] [248] [249] [250] [251] [252] [253] [254] [255] [256] [257] [258] [259] [260] [261] [262] [263] [264] [265] [266] [267] [268] [269] [270] [271] [272] [273] [274] [275] [276] [277] [278] [279] [280] [281] [282] [283] [284] [285] [286] [287] [288]

Conjunto de datos	Valor	Iteración [237] [238] [239]
Conjunto de datos	Valor	1	2	3	4
Precipitación	Error	0.017	0.083	-	-
Precipitación	Peso	4.033	2.405	-	-
Temperatura máxima	Error	0.018	0.440	0.491	0.499
Temperatura máxima	Peso	3.990	0.243	0.038	0.003
Exposición solar	Error	0.020	0.284	0.493	-
Peso	3.870	0.924	0.028	-

vertical_align_top file_download show_chart

more_horizclose
- image
- translate
- link
- article
- vertical_align_top
- file_download
- show_chart
- image
- translate
- link
- article

location_on

None Cartago, Costa Rica, Cartago, Cartago, Costa Rica, CR, 159-7050 , 25502336, 25525354 - E-mail: alramirez@itcr.ac.cr

rss_feed Acompanhe os números deste periódico no seu leitor de RSS

Acessibilidade / Reportar erro