Capítulo 5 Clusters de transmisión
5.1 Identificación de clusters de transmisión
La identificación de clusters de transmisión de los virus del dengue se realiza con el estadístico satscan, este análisis es conocido en ingles como space-time analysis y por lo general es realizado en el software SaTScan. Actualmente existe un paquete en R llamado rsatscan que corre el software SaTScan a través de R. El requisito es tener instalado software SaTScan en el equipo de computo. La identificación de las cadenas de transmisión del dengue con las bases de datos del SINAVE es realizado en R a traves del análisis space-time con la función satscanr del paquete denhotspots
Los primeros cuatro pasos son similares al análisis de los hotspots de transmisión histórica, descrito en el apartado previo. La diferencia rádica en que solo es de ínteres el shapefile de las localidades con la finalidad de extraer los casos de la localidad de interes. Como paso cinco se generan dos archivos para el análisis espacio-temporal de los casos: 1) un archivo que contiene tres columnas llamado cas y 2) un archivo con tres columnas llamado geo, ambos nombrados por convención y con la finalidad nemotécnica. El archivo cas hace referencia al archivo que tiene los casos y el archivo geo hace referencia al archivo con la información geográfica. El archivo cas tiene las variables id (identificador del caso), cases (casos por inicio de síntomas), onset (fecha de inicio de síntomas). El archivo geo tiene las variables id(cases), longitud (long) y latitud (lat).
id | cases | date |
---|---|---|
827450 | 1 | 2020-09-13 |
833109 | 1 | 2020-09-20 |
836058 | 1 | 2020-09-28 |
854971 | 1 | 2020-10-19 |
854719 | 1 | 2020-10-18 |
856688 | 1 | 2020-10-19 |
case | lat | long |
---|---|---|
827450 | 18.85026 | -97.09959 |
833109 | 18.85695 | -97.10044 |
836058 | 18.85752 | -97.10098 |
854971 | 18.84884 | -97.10859 |
854719 | 18.84618 | -97.10410 |
856688 | 18.84520 | -97.08516 |
En el paso seis se definen los parámetros del input, análisis y del output (Figura 5.1). En los parametros del input esta la selección de los archivos cas/geo, el tipo de coordenadas geográficas, la precisión del tiempo (año, mes, día), la fecha de inicio y la fecha del fin del periódo de estudio. Para el análisis de space-time se definió como día (inicio de los síntomas) la precisión del tiempo y las cordenadas fueron longitud/latitud (crs = 4326). En los parámetros del análisis se define el tipo de análisis, el modelo de probabilidad, la agregación del tiempo y la busqueda de áreas con altas tasa, bajas tasas o ambas. En los análisis space-time con dengue se usan los siguientes parámetros:
Analysis/type analysis/Space-Time
Analysis/Probabiliity Model/Space-Time Permutation
Analysis/scan areas/High Rates
Analysis/time aggregation/Days
Advanced Analysis Features/Spatial Window/Maximun Spatial Cluster Size/0.4 km radius
Advanced Analysis Features/Spatial Window/Spatial Window Shape/Circular
Advanced Analysis Features/Cluster Restriction/2 cases
Advanced Analysis Features/Inference/Standard Monte Carlo
Advanced Analysis Features/Inference/Monte Carlo Replications/999
Advanced Analysis Features/Temporal Windows/Maximun Temporal Cluster Size/20 Days
Advanced Analysis Features/Temporal Windows/Minimun Temporal Cluster Size/1 Days (es valor entrada)
En los parámetros del output se define donde se guardaran los archivos de salida y que tipo de archivos. Para los análisis de space-time se solicitan los siguientes archivos:
Shapefile file for GIS software
Cluster Information
Stratified Cluster Information
Location Information
Simulated Log Likelihood Ratios/Test Statistics.
Todos los archivos tienen extensión dBase, excepto el primero que esta compuesto por varias extensiones (.prj, .shp, .shx). adicionalmente pare la información geográfica también existe la extension kml.
5.2 Algoritmo para Space-Time análisis con SaTScan
Bajar las bases de SINAVE.
Geocodificar las bases.
Bajar los shapefile del INEGI.
Seleccionar la localidad de ínteres.
Generar los archivos cas y geo.
Definir los parametros del input, análisis y resultado (output).
Seleccionar los cluster y los casos con valores de p < 0.05
Visualizar los cluster de transmisión.