« VOLVER AL ESPECIAL

Metodología

¿Cómo analizamos los datos de nacimientos?

5 de noviembre del 2015
Hassel Fallas - Editora Unidad de Inteligencia de Datos
hassel.fallas@nacion.com

La creencia popular indicaba que sí: setiembre es el mes en que más costarricenses vienen al mundo. Lo sustentaba la afirmación de que, los nacidos en ese mes, son fruto de las fiestas decembrinas.

Las secciones de Aldea Global e Inteligencia de Datos de La Nación nos unimos para corroborar esa afirmación. Así concebimos este especial de Periodismo de Datos en el cual examinamos 115 años de historia de los nacimientos en Costa Rica.

Descubrimos que el verdadero monarca de la natalidad es el mes de octubre. Setiembre ocupa el tercer puesto, después de diciembre.

La respuesta a esa y otras curiosidades es lo que el lector encontrará en este gráfico y reportajes que también ofrecen información por cantón, contexto histórico, político, social, económico y de salud sobre los partos en el país entre 1900 y 2014.

Además, usted podrá asomarse al futuro para conocer lo que podría acontecer con los nacimientos en la próxima década: ¿Cuántos costarricenses más verán el mundo por primera vez?, ¿cuánto cambiarán las tasas de natalidad por cada 1.000 habitantes?

Esas dudas también las responde esta publicación web y sus versiones para teléfono celular e impresa.

¿Cómo lo hicimos?

El proyecto se fundamentó en el análisis de bases de datos, creadas por la Unidad de Inteligencia de Datos de este medio, con información del Registro Civil, del Instituto Nacional de Estadística y Censos (INEC) y del Centro Centroamericano de Población.

Del Registro Civil se extrajo la información desde el año 1880 con la cantidad de bebés nacidos por fecha exacta. Se excluyó la información de 576 nacimientos cuyas fechas eran inválidas.

Es importante considerar que la fuerte variación de nacimientos entre la década de 1880 y 1890 (261%) puede deberse a un subregistro de los nacimientos en esa época, según confirmó el Registro Civil.

“Factores como la accesibilidad a servicios de salud y a las políticas de registro podrían incidir. Algunas mujeres preferían dar a luz en sus hogares - asistidas por comadronas - en lugar de visitar algún centro hospitalario, es por ello, que no se registraba el nacimiento de sus hijos. También hay que considerar que, para esas fechas, la infraestructura del Registro Civil era más limitada”, comentó Alex Brenes de la Unidad de Estadística de la entidad.

Con esas consideraciones en mente, la Unidad de Inteligencia de Datos de este diario efectuó el estudio a partir de 115 años de historia, iniciando en enero de 1900 y finalizando en diciembre de 2014. En total, en ese periodo se han registrado más de 5,3 millones de nacimientos.

Se estimaron todos los máximos y mínimos mensuales de cantidad de nacimientos por año y se calculó el porcentaje que cada mes representó del total anual.

Así se determinó que octubre es el mes rey por la frecuencia de años en que ha acumulado la mayoría de los nacimientos (53 de 115 años).

Entonces, ¿por qué se creía que el mes dominante es setiembre?

El estudio también permitió establecer que la creencia de que setiembre es el mes dominante en cantidad de nacimientos puede deberse a que, en la última década y media, la cantidad de nacimientos producida es muy similar a la registrada en octubre (100.000).

Sin embargo, entre 2000 y 2014, octubre superó a setiembre en número de bebés en ocho ocasiones, como se muestra en este gráfico.

Ese análisis también permitió ofrecer al lector la posibilidad de saber cuántas personas cumplen años en su misma fecha y cuántos han celebrado en ese mismo día y mes a lo largo de más de un siglo.

Sobre ese último punto debe tomarse en cuenta que en el resultado pueden incluirse personas ya fallecidas.

El apartado denominado “La fiesta de sus hijos por cantón” se realizó empleando los datos de nacimientos, por fecha completa, del INEC. Considere que los datos están disponibles por cantón a partir de 2003 y hasta 2013.

Sobre el gráfico de las concepciones

Para construir ese gráfico, que muestra los patrones de concepciones mensuales, se consideró que el 90% de los niños costarricenses nacen a los nueve meses de gestación. Usando ese parámetro, todos los datos mensuales de alumbramientos se llevaron hasta nueve meses atrás para acercarse al mes más cercano al inicio del embarazo. Esa parte del estudio se inicia en abril de 1899.

Para determinar que el 90% de los bebés vienen a la vida a los nueve meses se usaron datos del INEC desde el año 2000 y hasta el 2013. El resto de los niños costarricenses vienen a la vida a los 8 meses (8%) y otro 2% al cumplir 7 o menos meses de gestación.

Anterior a esos años no hay información disponible sobre meses cumplidos de embarazo de la madre a la hora de dar a luz.

En este apartado era crucial el contexto, entender qué hechos históricos, sociales, económicos, políticos o de salud podrían haber influenciado la natalidad durante las últimas 12 décadas en Costa Rica.

Para ello se revisaron noticias, libros de historia de Costa Rica y la sección de Aldea Global efectuó entrevistas a Mayra Cartín, antropóloga y salubrista pública, y también a Gílbert Brenes, investigador con énfasis en Demografía de la Universidad de Costa Rica (UCR).

Adicionalmente, se consultaron las siguientes fuentes en línea:

  1. https://www.k4health.org/sites/default/files/752228SPA.PDF
  2. http://historia.fcs.ucr.ac.cr/articulos/2008/especial2008/articulos/nuevas/8-genero-Percepciones.pdf
  3. http://encuestas.ccp.ucr.ac.cr/camerica/pdf/sepa1981.pdf
  4. http://www.scielo.sa.cr/scielo.php?script=sci_arttext&pid=S1409-14292011000200007
  5. http://www.historia.fcs.ucr.ac.cr/articulos/2006/7politica_subrepticia.html

La mirada al futuro

Finalmente, el video que revela lo que, potencialmente podría ocurrir con los nacimientos, mes a mes, en la próxima década, se basa en un análisis de series de tiempo entre 1900 y 2014.

El modelo fue construido con la colaboración de Erick Rodríguez, profesional en Inteligencia de Negocios y Minería de Datos y para ello se utilizó el programa R.

Es importante que tenga en cuenta que ese pronóstico es un ejercicio académico y su resultado puede variar a futuro, en función de la economía, nuevos métodos anticonceptivos y estilos de vida, entre otros factores que pueden incidir en la natalidad.

En el siguiente gráfico podrá examinar los resultados de la predicción, en la que octubre se continúa perfilando como el rey de los nacimientos en Costa Rica. Los datos se presentan a partir de 1990 para facilitar su visualización.

La información mensual real de los 115 años de nacimientos en Costa Rica se transformó en una serie de tiempo, la cual se dividió en dos partes: una de aprendizaje y otra de prueba.

Con la serie de prueba se construyeron varias versiones del modelo y se seleccionó aquella que brindó el mejor resultado con relación al error y comparación con la serie original (real). El modelo ganador se entrenó con los datos de la serie completa y se efectuó la predicción.

Adicionalmente, con esos resultados se totalizó la cantidad de nacimientos que habría entre el presente año y el 2024. Los datos estimados para esos 10 años se incluyeron dentro de una serie en la que, a partir de 1950 se estimaron las tasas de natalidad bruta (nacimiento de bebés) por cada 1.000 habitantes) con la intención de mostrar que, aunque la cantidad de nacimientos aumente y haya más población, el número de bebés por hogar será cada vez menor.

Para calcular las tasas por cada 1.000 habitantes se utilizaron las proyecciones de población del Centro Centroamericano de la Población de la UCR entre 1950 y el 2024.

Repitiendo patrones

A la serie de datos con los años y el total de nacimientos se le aplicó un análisis de conglomerados jerárquicos, usando distancia euclidiana. El objetivo era crear grupos de años cuyo comportamiento haya sido similar en cuanto a cantidad de nacimientos.

Se establecieron cinco grupos. El cuarto de ellos rompió la secuencia de años y mostró que la cantidad de recién nacidos de la última década y media es similar a la producida a finales de la década de los 70 e inicios de los 80.

Si desea examinar la base de datos usada para este proyecto puede descargarla:



(XLS) (CSV) (TXT)



Para críticas, comentarios o sugerencias sobre este especial, por favor escríbanos a: data@nacion.com

Comentarios