Download tema 18 - Dirección General de Tráfico

Document related concepts
no text concepts found
Transcript
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
TEMA 18
PRINCIPIOS DE ESTADÍSTICA APLICADA A LA SEGURIDADA VIAL.
ESTADÍSTICA DESCRIPTIVA E INFERENCIA ESTADÍSTICA. LA ESTADÍSTICA Y
EL ESTUDIO DE LOS ACCIDENTES DE TRÁFICO: TÉCNICAS DE
MODELIZACIÓN DE LA FRECUENCIA DE ACCIDENTES. PREDICCIÓN DE LA
FRECUENCIA DE ACCIDENTES EN TRAMOS DE CARRETERA. ANÁLISIS
MULTIVARIANTE DE SERIES TEMPORALES. TÉCNICAS DE MUESTREO Y SU
APLICACIÓN EN LA SEGURIDAD VIAL.
1. INTRODUCCIÓN
2. ESTADÍSTICA DESCRIPTIVA E INFERENCIA ESTADÍSTICA.
2.1. Estadística descriptiva
2.2. Inferencia estadística
3. LA ESTADÍSTICA Y EL ESTUDIO DE LOS ACCIDENTES DE TRÁFICO:
TÉCNICAS DE MODELIZACIÓN DE LA FRECUENCIA DE ACCIDENTES
3.3. Técnicas de modelización de la frecuencia de accidentes.
4. PREDICCIÓN DE LA FRECUENCIA DE ACCIDENTES EN TRAMOS DE
CARRETERA.
4.1. Modelos de variables discretas o de recuento: Modelo de Poisson y Binomial
negativa
5. ANÁLISIS DE SERIES TEMPORALES.
5.1. Modelos ARIMA. Análisis univariante de series temporales
5.2. Modelos ARIMA de intervención
5.3. Modelos de función de transferencia. Análisis multivariante de series temporales
6. TÉCNICAS DE MUESTREO Y SU APLICACIÓN EN LA SEGURIDAD VIAL.
6.1. Técnicas de muestreo
6.2. Muestreo probabilístico
6.2.1. Muestreo aleatorio con y sin reemplazamiento
6.2.2. Muestreo estratificado
6.2.3. Muestreo por conglomerados
6.2.4. Muestreo sistemático
6.3. Aplicaciones de técnicas de muestreo en la seguridad vial
6.3.1. Construcción del indicador de velocidad de flujo libre
6.3.2. Barómetro de opinión sobre seguridad vial
6.3.3. Otras aplicaciones
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 1 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
1. INTRODUCCIÓN
La mejora de la seguridad vial requiere el conocimiento de las causas de los
accidentes de tráfico y una evaluación de los efectos de los factores intervinientes en
dichos accidentes: parque de vehículos, población, movilidad,... Para ello una parte
importante es conocer esas causas, así como la posible evaluación de las medidas
adoptadas, mediante el tratamiento estadístico de toda esa información disponible.
Un análisis descriptivo de los datos es una primera aproximación al estudio de
los accidentes y ofrece una visión somera de lo que está ocurriendo. Sin embargo,
uno no puede quedarse ahí. El siguiente paso es utilizar diferentes técnicas
estadísticas para así poder completar todo aquello que se nos pueda escapar en esa
primera pasada, y así avanzar en la comprensión de los factores causales de los
mismos.
Este tema se puede dividir en dos partes: una primera donde daremos una
breve descripción de la estadística descriptiva y la inferencia estadística. En
segundo lugar, profundizaremos en una serie de técnicas estadísticas que se han
utilizado en seguridad vial.
2. ESTADÍSTICA DESCRIPTIVA E INFERENCIA ESTADÍSTICA
De acuerdo con Martín Pliego, “la estadística se configura como la tecnología
del método científico que proporciona instrumentos para la toma de decisiones
cuando éstas se adoptan en ambiente de incertidumbre, siempre que esta
incertidumbre pueda ser medida en términos de probabilidad. Por ello, la estadística
se preocupa de los métodos de recogida y descripción de datos, así como de
generar técnicas para el análisis de esa información”. Dentro de la estadística
aplicada, se encuentran la estadística descriptiva y la inferencia estadística.
Antes de empezar con esta sección, daremos las definiciones de una serie de
conceptos que vamos a utilizar:
La población es el conjunto de inviduos que presentan unas características
comunes.
Una muestra es un subconjunto de la población que queremos estudiar. Para
tener unos mejores resultados, esta muestra debe ser lo más representativa posible.
Una variable es una característica determinada que posee cada uno de los
elementos la población. Ésta puede ser de distintos tipos:
Cualitativas, categóricas o atributos que se caracterizan porque no toman
valores numéricos sino que describen atributos.
Cuantitativas discretas: toman únicamente valores enteros: corresponden a
contar el número veces que ocurre un suceso: por ejemplo accidentes en un mes.
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 2 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
Cuantitativas continuas: toman valores dentro de un intervalo: por ejemplo
tiempo entre pase de vehículos sucesivos en una sección de aforo.
Una variable puede ser unidimensional o pluridimensional.
2.1. Estadística descriptiva
La estadística descriptiva comprende la ordenación y presentación de los
datos, tras la depuración de las posibles anomalías que hayan podido encontrarse
por el camino.
Esta presentación de los datos puede encontrarse de dos formas:
En forma de tablas, ya sea en forma de tablas simples o mediante tablas de
doble entrada. En estas tablas se suele recoger la siguiente información:
1.
Frecuencias absolutas: es el número de ocurrencias que tiene
cada uno de los valores que toma una variable.
2.
Frecuencia total: es el número de datos observados en una
variable. Corresponde con la suma de las frecuencias absolutas de
cada uno de los valores que toma una variable.
3.
Frecuencia relativa: para cada uno de los valores, este indicador
representa el cociente entre la frecuencia relativa y la frecuencia total.
4.
Frecuencia acumulada absoluta: dado un orden dentro de la
variable, la frecuencia acumulada absoluta es el número de datos cuyo
valor es igual o inferior al mismo.
5.
Frecuencia acumulada relativa: para cada uno de los valores, se
toma el cociente entre la frecuencia acumulada absoluta y la frecuencia
total.
Las variables se pueden presentar como distribuciones agrupadas en
intervalos y distribuciones no agrupadas en intervalos.
Las distribuciones no agrupadas en intervalos son aquellas en la que las
frecuencias se representan al lado del valor que toman, mientras que las
distribuciones se representa mediante una serie de intervalos.
La distribuciones agrupadas en intervalos se utiliza cuando la serie de datos
es grande y, a costa de perder información, queremos trabajar con ellos de una
forma más cómoda.
Las representaciones gráficas más comunes que nos podríamos encontrar
serían:En forma de representaciones gráficas. Estas representaciones gráficas
son un tipo de dibujo que nos ayuda a detectar a simple vista alguna de sus
características más notables que nos pudiera ofrecer una visión general del
fenómeno analizado.
Las representaciones gráficas más comunes que nos podríamos encontrar
serían:

Diagramas de barras: consiste en traza sobre un par de ejes
cartesianos tantas barras como valores tenga la variable de estudio,
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 3 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
teniendo estos una altura proporcional a la frecuencia absoluta del valor
correspondiente.



Diagramas sectoriales: consiste en dividir un círculo en tactos
sectores como valores toma una variable, de forma que el área de cada
sector sea proporcional a la frecuencia absoluta a la frecuencia del
valor correspondiente.
Pictogramas: consiste en una figura alusiva a la variable
analizada y su tamaño debe corresponder con la frecuencia absoluta
de su valor. Son menos comunes que los dos anteriores.
Además de la representación de los datos de un determinado fenómeno, la
estadística descriptiva busca determinar una serie de medidas o parámetros que
intenten resumir la cantidad de información recogida.
Al tener que operar con los distintos valores que puede tomar la variable,
cuando éstas aparecen en forma de distribuciones agrupadas en intervalo, se
necesita coger un valor de cada uno de los intervalos que suele coincidir con el
punto medio. A este valor se le denomina marca de clase.
Las medidas pueden ser:
Medidas de posición. Indican la posición en torno a la cual se distribuyen las
observaciones que presenta la variable. Dentro de este tipo de medidas se puede
diferenciar entre medidas de posición central o promedios (son aquellas que orientan
sobre cual es el valor central de la distribución. Son medidas de posición central la
media aritmética, media armónica, media geométrica) y medidas de posición no
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 4 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
centrales (son aquellas que orientan sobre la posición de una parte cualquiera de la
distribución. Dentro de estas medidas de posición se encuentran los cuantiles).
Medidas de dispersión. La distribución de una variable o fenómeno no puede
ser explicada solamente mediante una medida de posición.
Por ejemplo, tenemos las dos siguientes distribuciones de datos:
(1,2,3,4,5,6,7,8,9)
(5,5,5,5,5,5,5,5,5)
En los dos ejemplos, tenemos una serie de 9 datos, en los que se puede
calcular fácilmente que la media aritmética de ambos conjuntos es 5. Sin embargo,
podemos observar que la diferencia entre ambos es muy grande.
Es por ello, por lo que una medida de posición suele ir acompañada de otra
medida que explique la variabilidad que toman los valores de un fenómeno. A este
tipo de medidas se las conoce como medidas de dispersión. Dentro de este tipo de
medidas se encuentra el rango, la varianza, o el coeficiente de variación de Pearson.
Medidas de forma. Estas medidas definen la forma en la que viene
representada la distribución de una variable y pueden ser de dos tipos: las medidas
de asimetría y las medidas de apuntamiento o curtosis.
Las medidas de asimetría permiten establecer el grado simetría o asimetría
que presenta una distribución. Se dice que una distribución es simétrica cuando
dado un valor central existen el mismo número de valores a ambos lados de dicho
valor, equidistantes del mismo dos a dos y tales que a cada par de valores
equidistantes les corresponde la misma frecuencia absoluta.
Las medidas de curtosis estudian la concentración de valores en la zona
central de dicha distribución, de modo que cuanta más concentración sea la
concentración, más apuntada será la misma.
Medidas de concentración. Tratan de poner en relieve el mayor o menor
grado de igualdad en el reparto del total de los valores de la variable. Estas medidas
son de especial aplicación en variables económicas, tales como renta, salarios, …
En este tipo de variables, las medidas de posición o dispersión no son tan
importantes como la mayor o menor igualdad en su reparto entre los diversos
individuos de una población. Las medidas de concentración más importantes son la
curva de Lorenz y el índice de Gini.
De los cuatro tipos de medida de los que hemos hablado las medidas de
posición y de dispersión son las más utilizadas, si bien las medidas de forma y de
concentración generan un valor añadido y, en algunos casos, toman una especial
relevancia.
Por último, cuando estamos trabajando con dos o más variables, la estadística
descriptiva nos permite observar la dependencia entre las distintas variables de
estudio. Esta dependencia puede ser:
Independencia, cuando no existe ningún tipo de relación entre las variables X
e Y.
Dependencia funcional, cuando existe una función matemática que permite
establecer la correspondencia entre el conjunto de variables X y el conjunto de
variables Y, y sólo puede tomar ese valor.
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 5 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
Dependencia estadística, que es el estado intermedio entre la independencia
y la dependencia funcional.
Esta dependencia estadística se estudia mediante:

Los diagramas de dispersión, que permiten dar una primera
aproximación del grado de dependencia existente entre un conjunto de
variables.

Las rectas de regresión. La recta de regresión es la recta que
minimiza las distancias entre los puntos del diagrama de dispersión y
dicha recta.
En la gráfica anterior se muestra un diagrama de dispersión de
una variable bidimensional con su recta de regresión.
En el caso de dependencia funcional y que esa función sea una
recta, todos los valores pasarán por la recta de regresión.
Aunque la recta de regresión es el tipo de línea de regresión
más común, ésta puede tomar otras formas: polinómica, logarítmica,…

El coeficiente de correlación, es un coeficiente que mide el grado
de relación entre las variables. Puede tomar cualquier valor entre -1 y
1, y cuanto más cercano a uno esté su valor absoluto, más fuerte será
la relación entre esas variables.
2.3. Inferencia estadística
La Inferencia Estadística es la rama de la estadística que se ocupa de sacar
conclusiones sobre una o unas determinadas características de una población a
través de la observación de una muestra aleatoria de esa población. Dicho de otro
modo, se trata de conocer una característica de la población mediante la aplicación
de métodos inductivos.
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 6 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
El fenómeno inverso a la inferencia es el muestreo, el cual consiste en deducir
una serie de características que tiene la muestra a partir de las propiedades que
posee la población.
Toda inferencia tiene un grado de incertidumbre, ya que estamos suponiendo
que toda una población va a seguir la misma distribución que la muestra de la que
estamos partiendo.
A continuación, definiremos una serie de conceptos que nos ayudarán
después a explicar las partes de las que consta la inferencia estadística:
Una variable aleatoria es una función que asocia a cada valor que puede
tomar una muestra un número real. Este concepto es muy importante dentro de la
inferencia estadística. Una variable aleatoria es discreta puede tomar un número
discreto (a lo sumo, numerable) de valores. En caso contrario, estaremos hablando
de variables continuas.
Una muestra aleatoria simple está compuesta de un conjunto de variables
aleatorias independientes y que tienen la misma distribución de probabilidad.
Un estadístico es una función de las variables aleatorias muestrales.
Un estimador es un estadístico muestral que utilizaremos para conocer un
parámetro desconocido.
Podemos dividir la inferencia estadística de dos formas:
Hablamos de inferencia paramétrica cuando conocemos la distribución de
probabilidad y tratamos de descubrir el valor de los parámetros que definen dicha
distribución.
Hablamos de inferencia no paramétrica cuando no sabemos cómo es la
distribución de probabilidad que define la variable.
Los métodos que se utilizan en la inferencia estadística son básicamente
dos: la estimación y el contraste de hipótesis.
Estimación: A través de un estimador, intentamos extrapolar una
característica de la población muestral a la población de estudio.
Debemos de asegurarnos de que cogemos el estimador adecuado para poder
obtener nuestro parámetro. Para ello, el estimador debe de poseer una serie de
propiedades:
-
Estimador insesgado: un estimador es insesgado cuando la esperanza del
estimador es igual al parámetro poblacional.
-
Estimador eficiente: un estimador es eficiente cuando es insesgado y
además tiene mínima varianza.
-
Estimador consistente: un estimador es consistente cuando el límite del
estimador cuando el tamaño de la muestra tiende a infinito es igual al
parámetro poblacional.
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 7 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
-
Estimador suficiente: un estimador es suficiente cuando usa toda la
información que contiene la muestra respecto al parámetro poblacional.
Existen dos tipos de estimación:
Estimación puntual. Consiste en la búsqueda de un valor para el parámetro
buscado en la población de estudio a partir de la muestra aleatoria.
Intervalo de confianza. Consiste en la búsqueda de un intervalo que nos diga,
dada una probabilidad, de que en ese intervalo se encuentre el parámetro
poblacional buscado. Dicha probabilidad se denomina nivel de confianza.
En esta gráfica, se muestra un intervalo de confianza a un nivel de confianza
de 0,95.
Contraste de hipótesis: Los contrastes de hipótesis nos ayudan a crear una
regla de decisión para aceptar o rechazar cierta hipótesis sobre una determinada
característica poblacional.
Se toma una hipótesis de partida, llamada hipótesis nula, sobre el valor de un
parámetro desconocido, y se desarrolla un método en el que dividiremos el dominio
de los posibles valores que puede tomar un parámetro o característica en dos
regiones: una de aceptación donde se acepta la hipótesis nula, y otra donde
rechazamos dicha hipótesis, aceptando otra hipótesis llamada alternativa. La región
en la que rechazamos la hipótesis nula se denomina región crítica.
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 8 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
Cuando realizamos un contraste de hipótesis, nos podemos encontrar con los
siguientes resultados (llamaremos H0 a la hipótesis nula y H1 a la hipótesis
alternativa):
Aceptamos H0
Rechazamos H0
H0 es cierta H0 es falsa
Ok
Error tipo II
Error tipo I Ok
Llamamos nivel de significación del contraste a la probabilidad de cometer un
error de tipo I. Es decir, rechazamos la hipótesis nula cuando está es cierta.
La potencia de un contraste es la probabilidad de que no ocurra un error de
tipo II. Dicho de otra forma, es la probabilidad de que rechacemos la hipótesis nula
cuando está es falsa.
Un contraste de hipótesis es simple cuando la distribución de probabilidad de
la población queda perfectamente especificada. En caso contrario, estaremos
hablando de un contraste de hipótesis compuesto.
Estos contrastes pueden ser paramétricos o no paramétricos. Un tipo de
contraste no paramétrico son los contrastes de bondad de ajuste. En este tipo de
análisis se caracteriza en que la hipótesis nula es el ajuste de la población de
estudio a una distribución de probabilidad dada. Por ejemplo, un contraste que nos
permita decidir si una población sigue una distribución normal.
3. LA ESTADÍSTICA Y EL ESTUDIO DE LOS ACCIDENTES DE TRÁFICO:
TÉCNICAS DE MODELIZACIÓN DE LA FRECUENCIA DE ACCIDENTES.
Los modelos estadísticos pueden clasificarse en función de la información que
utilizan y del objetivo que pretenden. Cuando la información que utilizan corresponde
a una única variable se denominan modelos univariantes.
Cuando incluyen más variables como explicativas del fenómeno que se
pretende analizar se denomina modelos explicativos.
Si el objetivo es determinar cómo se comportan las variables en un instante
temporal dado, se denomina modelos estáticos o de corte transversal: por ejemplo la
relación entre el número de accidentes y vehículos que pasaron por una sección
transversal de una carretera en el año 2010. Pero si se quiere estudiar la relación a
lo largo del tiempo se denominan dinámicos o longitudinales.
Los modelos estadísticos pueden ser utilizados tanto para explicar el efecto de
los factores intervinientes, como para predecir el comportamiento de los accidentes
bajo el supuesto del cumplimiento de ciertos escenarios relativos a la evolución de
las variables independientes que intervienen en el modelo.
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 9 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
En los estudios de seguridad vial, la variable de interés es la frecuencia de
accidentes, es decir el número que de ellos se producen en un espacio y tiempo
determinados. Al ser un fenómeno completamente aleatorio, la variable que lo
representa como es el número de accidentes es aleatoria (V.A.) y la estadística
provee los métodos adecuados. El problema consiste entonces en conocer el
modelo de probabilidad que describe el comportamiento de una V.A., lo cual significa
conocer la proporción de individuos de la variable que toma un conjunto de valores
determinado. La proporción de individuos de una variable que toma un valor
determinado, coincide con la probabilidad de que un individuo elegido al azar tome
dicho valor.
Si el orden en el que se toman los datos es relevante y siguen una secuencia
temporal: mes, año, trimestre) constituyen una serie temporal y su análisis requiere
métodos especiales que tengan en cuenta que el orden de los datos es informativo.
3.1. Técnicas de modelización de la frecuencia de accidentes.
Para la modelización de la frecuencia de accidentes y dependiendo del nivel
de agregación de los datos, existen dos grandes grupos de modelos:

Modelos a nivel “micro” si la magnitud es el número de
accidentes que se produce en un tramo concreto de vía y

Modelos “macro” si la magnitud que se desea estudiar predecir
es el número total de víctimas en la red de carreteras española.
En el nivel “micro”, los datos disponibles de las variables dependientes e
independientes corresponden a entornos y período determinados. Los modelos de
aplicación reciben el nombre de modelos microscópicos.
En la literatura se han identificado aplicaciones de básicamente dos tipos de
modelos:
 Modelos generales de regresión.
 Modelos lineales generales.
En el nivel “macro”, el nivel de agregación de los datos con los que se trabaja
es grande: a nivel nacional o regional y los datos relativos, por ejemplo, al número
de accidentes, son observaciones en el tiempo, es decir que corresponden a
diferentes instantes y el conjunto constituye una serie temporal. Los modelos de
aplicación reciben el nombre de modelos macroscópicos.
En la literatura se pueden encontrar ejemplos de aplicaciones de los
siguientes tipos de modelos de series temporales:
 Modelo de Box-Jenkins (modelos ARIMA y de intervención).
 Modelos estructurales.
 Modelos DRAG.
En todo modelo estadístico, la variable escogida y se descompone en dos
partes: una parte sistemática (predecible) y la parte aleatoria (no predecible).
- La parte sistemática es la que se puede expresar como una función o
combinación de las variables explicativas en un modelo explicativo.
- La parte aleatoria es la que normalmente se resume mediante un término de
error que recoge el efecto de variables omitidas o introducidas con errores de
medición.
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 10 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
Los dos pasos clave en el desarrollo de cualquier tipo de modelo son:
-
Elección del modelo estadístico. En este paso están involucrados los
siguientes aspectos:
 Formulación matemática de la ecuación que relaciona la variable
dependiente con las variables independientes.
 Métodos de ajuste de los parámetros del modelo.
 Métodos de diagnosis.
-
Elección de las variables independientes. La elección se basa en general
en el juicio del investigador. Un aspecto importante es que, debido al nivel de
agregación de las series, muchas de las variables que a priori podrían influir
en las variables dependientes no están disponibles o dependiendo de los
modelos hay aspectos que no pueden ser tenidos en cuenta explícitamente.
Por ejemplo los cambios en el diseño de los vehículos o de las vías no pueden
ser introducidos en modelos macroscópicos.
4. PREDICCIÓN DE LA FRECUENCIA DE ACCIDENTES EN TRAMOS DE
CARRETERA.
Según la clasificación establecida la metodología estadística varía con el tipo de
modelo. Para simplificar y en función de cómo son los datos disponibles vamos a
describir los tipos de modelos estadísticos más utilizados para explicar el
comportamiento y la evolución de la frecuencia de accidente dentro de cada grupo:
en los modelos microscópicos el modelo de Poisson y binomial negativa y en los
modelos macroscópicos los modelos de series temporales (univariante y
multivariante).
4.1. Modelos de variables discretas o de recuento: Modelo de Poisson y
Binomial negativa.
Dentro de estos modelos, los basados en las distribuciones de Poisson y
binomial negativa son los más utilizados en la predicción de accidentes de tráfico,
aunque generalmente en un ámbito local (por ejemplo, influencia de las
características geométricas de la vía en la ocurrencia de accidentes, lo que
constituye como se ha dicho, un análisis a nivel “micro”).
En el modelo de Poisson, se supone que el número de accidentes que tiene lugar
en el área r durante el período t, denotado y(r,t), sigue una distribución de Poisson
de media (r,t) (recordemos que la media de una variable aleatoria con distribución
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 11 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
de Poisson coincide con su varianza). De esta forma, la probabilidad de ocurrencia
de m accidentes viene dada por la fórmula:
P ( y (r , t ) = m) =
( λ(r , t ))m • e
m!
λ
Las principales características de la distribución de Poisson son:


El número medio de sucesos ocurridos por unidad de observación es
constante. En este caso, esto equivale a suponer que la probabilidad de
ocurrencia de un accidente es constante en cada período de observación,
en este caso cada mes. Los autores advierten que a primera vista esta
hipótesis puede parecer demasiado restrictiva. Sin embargo, puede ser
válida si se divide un mes en intervalos temporales (minutos o segundos) lo
suficientemente pequeños como para aceptar que en cada uno de esos
intervalos la probabilidad de accidente es constante; si los accidentes
ocurridos en cada intervalo son independientes, entonces el número de
accidentes ocurridos en el mes entero sigue una distribución de Poisson
con parámetro  igual a la suma de los parámetros correspondientes a
cada uno de los intervalos de observación.
Los sucesos son independientes. En nuestro caso, la ocurrencia de un
accidente no depende de los accidentes que hayan tenido lugar
anteriormente.
El siguiente paso es suponer una relación entre la media de la distribución de
Poisson, (r,t), y un conjunto de variables independientes xi(r,t).
Se acepta una relación entre el valor esperado de la variable respuesta y las
explicativas del tipo exponencial:
λ(r , t ) = exp( ∑α i • x i (r , t ))
Donde los i son parámetros a ajustar. La función exponencial constituye una
elección natural, ya que asegura que el número medio de accidentes es siempre
positivo.
Si todos los factores explicativos han sido identificados, el término y(r,t)-(r,t) será
una perturbación aleatoria, y la variable y(r,t) seguirá un distribución de Poisson. En
la práctica, si se observa que la varianza de y(r,t) es mayor que su media, parte de la
variación sistemática de la serie está siendo absorbida por la perturbación.
Debido a que en la práctica es imposible identificar todos los factores de
influencia, es necesario cambiar la especificación del modelo, de forma que:
λ(r , t ) = exp(( ∑α i • x i (r , t )) + u(r , t ))
Donde el término u(r,t) constituye una perturbación aleatoria. Se puede demostrar
que si exp[u(r,t)] o, equivalentemente, y(r,t), sigue una distribución gamma, entonces
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 12 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
el número de accidentes sigue una distribución binomial negativa, de media y
varianza:
μ(r , t ) = exp( ∑α i • x i (r , t ))
μ( r , t )
)
ξ
Donde  es el factor de forma de la distribución gamma.
σ 2 (r , t ) = μ(r , t ) • (1 +
Es importante mencionar que los modelos basados en las distribuciones de
Poisson y binomial negativa no tienen en cuenta la dependencia temporal de las
observaciones.
Algunos ejemplos de aplicación de estos modelos se pueden encontrar en las
siguientes referencias. Fridstrom y otros (1.991), Arenas et al (2009), Hiselius
(2004).
5. ANÁLISIS DE SERIES TEMPORALES.
La aplicación de los modelos ARIMA y de función de transferencia a la predicción
de series temporales fue desarrollada por Box y Jenkins (1.970).
Las series suelen representarse mediante un gráfico que muestra su evolución
con el tiempo. Cuando se representa una serie se suele prestar atención a la
tendencia y la heterocedasticidad.
La tendencia implica que la serie tiende a crecer o a decrecer a largo plazo.
Cuando una serie permanece más o menos constante, oscilando en torno a un valor,
decimos que la serie no tiene tendencia.
La otra característica de las series es su variabilidad. Decimos que una serie es
homocedástica, si su variabilidad se mantiene constante a lo largo de la serie.
Cuando la variabilidad de la serie aumenta o disminuye a lo largo del tiempo,
decimos que la serie es heterocedasticidad. Gráficamente se representa por el
engrosamiento de la nube de puntos que representa las observaciones de la serie
temporal, con el tiempo. Indudablemente una serie puede tener tendencia y ser
heterocedástica
Las series pueden presentar efectos cíclicos característicos. Por ejemplo, la serie
de temperaturas máximas medias por meses de Madrid, presenta un ciclo
estacional, es decir tiene una estructura que se repite año tras año, como es el caso
en los datos mensuales de accidentes de tráfico en España. El fenómeno del ciclo
estacional es muy corriente en la mayoría de series socioeconómicas y biológica.
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 13 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
5.1. Modelos ARIMA. Análisis univariante de series temporales
Supongamos en primer lugar que deseamos realizar predicciones de los valores
futuros de una serie temporal utilizando como única información la propia historia de
la serie, es decir la información que se va a utilizar corresponde a una única
variable: por ejemplo el número mensual de accidentes en las carreteras españolas.
El modelo adecuado es el modelo de series temporales denominado comúnmente
modelo ARIMA (acrónimo del inglés autoregressive integrated moving average), que
representa un modelo autorregresivo integrado de media móvil que utiliza
variaciones y regresiones de datos estadísticos con el fin de encontrar patrones para
una predicción hacia el futuro. Un modelo ARIMA es un modelo dinámico de series
de tiempo, es decir las estimaciones futuras vienen explicadas por los datos del
pasado y no por variables independientes.
Un modelo ARIMA (p,d,q) indica con el parámetro p el orden de la parte
autoregresiva, con el q el orden de la parte de media móvil y con d el número de
diferencias realizadas para la obtención de un proceso o serie estacionario.
Se define una serie como estacionaria cuando cumple las siguientes características:
 No tiene tendencia.
 Es homocedástica.
 No tiene ciclos estacionales
 La estructura de dependencia se mantiene constante, es decir si una
observación influye sobre la posterior, esto ocurre siempre y no únicamente
entre las observaciones i y j. Esta condición es importante para modelizar la
serie, pues si el fenómeno que genera la serie cambia, es imposible que
podamos prever la evolución de la serie.
 La influencia de las observaciones sobre las posteriores decrece con el
tiempo.
Un tipo especial de serie estacionaria es la serie denominada ruido blanco. Un
ruido blanco es una serie estacionaria tal que ninguna observación influye sobre las
siguientes.
La expresión general de un modelo ARIMA (p,d,q) es:
 p ( B) z t   q ( B)a t
Bz t  z t 1
En el caso general en que se necesiten d diferencias para hacer a la serie zt
estacionaria en media, se tiene:
φ p (B)∇d zt = θ q (B)at
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 14 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
Con B se indica el operador de retardos y con el símbolo  el operador
diferencias cuyo exponente indica el número de diferencias realizadas.
La expansión de la expresión del modelo ARIMA se muestra en la siguiente
ecuación:
(1  1 B  2 B 2 ...   p B p )(1  B) d zt  (1  1 B   2 B 2  ...   q B q )at
Las técnicas de los modelos ARIMA se aplican únicamente a series estacionarias.
Si la serie no es estacionaria, es necesario transformarla hasta conseguir que lo sea,
lo cual puede consistir en diferenciar la misma para eliminar la tendencia y una
transformaciones (logarítmica o de Box-Cox) para estabilizar la varianza.
La transformación Box-Cox está definida para cualquier variable positiva de la
siguiente forma:
Yt y  1

( )
Y t y   y
ln(Y )
t

y  0
y  0
El proceso en la estimación de los modelos ARIMA se puede sintetizar en los
siguientes pasos:
 Representación gráfica de los datos. Inspección visual de la hipótesis de
estacionaridad (media y varianza constantes).
 Determinación, en su caso, del parámetro de la familia de transformaciones
Box-Cox necesario para hacer al proceso estacionario en la varianza.
 Determinación del número de diferencias necesario para hacer al proceso
estacionario en la media (eliminación de tendencia y estacionalidad).
 Representación gráfica de las funciones de autocorrelación simple (FAS) y
parcial (FAP).
 Determinación de los órdenes p y q de los posibles modelos ARIMA que
puedan representar adecuadamente los datos.
 Estimación de los parámetros de los modelos.
 Diagnosis de los modelos.
En particular:
 Independencia de los residuos, mediante la representación gráfica de la FAS
y la FAP y el estadístico de Ljung-Box.
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 15 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
 Contrastes de normalidad de los residuos.
 Secuencia temporal de los residuos.
 Conviene siempre realizar un sobreajuste del modelo, aumentando
sucesivamente en una unidad el orden de la parte autorregresiva y de la parte
de media móvil.
A partir de la diagnosis de los modelos, decidir:
 Si alguno de los modelos seleccionados es adecuado.
 Si conviene reformular el modelo, en particular si se ha detectado una
estructura temporal en los residuos.
Un ejemplo de aplicación de estos métodos al desarrollo de modelos
macroscópicos de predicción de accidentes de tráfico puede encontrarse en
Wagenaar (1.983).
5. 2. Modelos de series temporales ARIMA de intervención
En España, una aplicación de modelos de series temporales denominado modelo
ARIMA de intervención puede encontrarse en Aparicio et al. (2011). En la referencia
se ha desarrollado un modelo en el que la variable respuesta es el número mensual
de víctimas mortales a 24 horas en carretera, desde enero de 1995 hasta marzo de
2011 (195 observaciones), y una de las variables explicativas es el Permiso por
puntos modelado desde su entrada en vigor el 1 de julio de 2006. Adicionalmente y
en virtud del período de análisis, se han introducido otras variables dicotómicas de
control para modelar otros efectos, como la entrada en vigor de la Reforma del
Código Penal (con entrada en vigor el 1 diciembre de 2007), la intensificación de
medidas de seguridad vial desde enero de 2004 así como fenómenos más recientes
asociados al cambio de la movilidad desde julio de 2008 además de otros efectos
más puntuales necesarios para un mejor ajuste.
Los modelos de intervención generalizan la metodología de Box-Jenkins
permitiendo a la trayectoria de la variable respuesta ser influenciada por la
trayectoria de la variable de intervención. El análisis de intervención es un
metodología de modelado de efectos de sucesos conocidos y que actúan sobre el
proceso o bien durante un solo instante o bien a partir de dicho instante en forma de
escalón o de rampa, etc. Formalmente se modela a través de variables ficticias o
dummies que valen 1 a partir del momento de entrada en vigor y 0 para cualquier
otro período.
La expresión del modelo de intervención aplicado es un modelo estacional del
logaritmo del número de accidente (LOG ARIMA (0,1,1) (0,1,1)), es:
Z(t)= Z(t-1)+ Z(t-12)-Z(t-13)-Φ a(t-1)- θ a(t-12)+Φ θ a(t-13)+α X1+β X2+γ X4+μ X5+κ
X6+ ΩX7
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 16 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
Expresión en la que las variables representan:
a)
b) X1=1 a partir de enero de 2004 (=0 el resto de meses de la serie temporal)
c) X2=1 a partir de julio de 2006 (=0 el resto de meses de la serie temporal)
d) X4=1 en julio y agosto de 2006 – 2007, (=0 el resto de meses de la serie
temporal)
e) X5=1 a partir de noviembre de 2007 (=0 el resto de meses de la serie
temporal)
f) X6=1 en setiembre de 2008 (=0 el resto de meses de la serie temporal)
g) X7=1 desde el mes de julio de 2008 (=0 el resto de meses de la serie
temporal)
Y el resto de términos corresponden a la nomenclatura típica de series
temporales antes expuesta.
En un análisis de intervención la implementación de, por ejemplo, el sistema de
permiso por puntos o cinturón de seguridad se trata como una variable exógena, es
decir una variable que no está causada por la respuesta, la causalidad es
unidireccional de la medida al número de fallecidos pero no al revés.
5.3. Modelos de función de transferencia. Análisis multivariante de series
temporales
Estos modelos pueden considerarse una extensión de los modelos ARIMA
cuando se desea estudiar el efecto de una o varias variables independientes o
regresores sobre la variable dependiente.
Los modelos de regresión dinámica o de función de transferencia descomponen la
historia de una serie en dos componentes. La primera describe como una o varias
variables independientes afectan a la variable respuesta. La segunda recoge el
efecto de todas las variables excluidas del modelo. De esta forma:
Yt = Yt * +N t
Donde Yt* es la parte explicada por las variables independientes, y Nt la parte no
explicada o proceso de inercia.
Yt * = ν 0 • X t + ν 1 • X t
1
+ ν 2 • X t 2 ... = (ν 0 + ν 1 • B + ν 2 • B 2 + ...) X t = ν (B ) X t
Donde (B) es la función de transferencia.
Igual que ocurría en el análisis univariante de series, el polinomio de infinitos
coeficientes (B) es sustituido por una función racional, de forma que:
ν (B ) =
ω 0 + ω1 • B + ω 2 • B 2 + ... + ω m • B m
1 δ1 • B
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
δ2 • B
2
...
δa • B
a
Bb =
ω m (B ) b
B
δ a (B )
Tema 18. Página 17 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
Donde Bb se introduce para tener en cuenta que la respuesta puede presentar un
cierto período de decalaje (los b primeros coeficientes de la función de transferencia
son nulos).
La estimación de los parámetros del modelo exige la identificación de los órdenes
m, a y b de la función de transferencia. Existen varios métodos para realizar esta
identificación, siendo el más usual el método de preblanqueado de las series de
Box-Jenkins.
Existen diversos programas informáticos que permiten estimar modelos ARIMA y
de función de transferencia. SPSS permite estimar modelos ARIMA previa
introducción por parte del usuario de los órdenes (p,d,q); sin embargo, no permite la
estimación directa de modelos de función de transferencia.
Los programas SAS y AUTOBOX estima automáticamente modelos ARIMA y de
función de transferencia, con lo cual no es necesaria la identificación previa del
modelo.
Los modelos ARIMA y de función de transferencia están basados en el
tratamiento de series estacionarias. Ello exige diferenciar adecuadamente las series
con objeto de eliminar las componentes de tendencia y estacionalidad. Aquí radica
precisamente la principal diferencia entre estos modelos y los modelos estructurales.
En estos últimos, la tendencia y la estacionalidad de la serie estudiada aparecen de
forma explícita en la formulación del modelo. La referencia básica de estos modelos
es Harvey (1.989).
Un ejemplo de aplicación de estos métodos al desarrollo de modelos
macroscópicos de predicción de accidentes de tráfico puede encontrarse en Harvey
y Durbin (1986), García-Ferrer et al (2006) y García-Ferrer et al (2007), Bijleveld et al
(2008); Bijleveld et al (2010)
6. TÉCNICAS DE MUESTREO Y SU APLICACIÓN EN LA SEGURIDAD VIAL.
Cuando se plantea el objetivo de describir una variable o las relaciones entre un
conjunto de variables, se utilizan técnicas de muestreo que consisten en observar
una muestra representativa de la población o poblaciones de interés.
La población es el conjunto homogéneo de elementos en los se estudia una
característica dada. Como no es posible estudiar todos los elementos (porque es
inviable económicamente, porque el estudio llevaría mucho tiempo, o porque si hay
que hacer ensayos puede implicar la destrucción del elemento) se recurre a un
muestreo estadístico. Ya que no es posible hacer un censo, se realizara un
muestreo seleccionando elementos representativos de la población, por lo que la
clave de un muestro es garantizar la representatividad de la población. En la
selección debe utilizarse toda la información disponible que ilustre o ponga en
evidencia las diferencias entre los elementos. Cuando se tiene en cuenta
información diferenciadora entre los elementos de la población, se dice que el
muestreo es estratificada. En el caso contrario, si esa información no está disponible
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 18 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
o es imposible establecer diferencias, lo cual puede indicar la homogeneidad de los
elementos de la población, se utilizará la técnica de muestreo aleatorio simple.
6.1. Técnicas de muestreo
Ya hemos hecho referencia a la importancia de la correcta elección de la muestra
para que sea representativa para nuestra población pero ¿cómo clasificamos las
diferentes formas de elegir una muestra?. Aunque el tipo de muestreo al que vamos
a referirnos es el muestreo probabilístico, ya que en caso de elegir la técnica
adecuada, es el que nos asegura la representatividad de la muestra y nos permite el
cálculo de la estimación de los errores que se cometen, hay otros tipos de muestreo
además del probabilístico. Las diferencias son:
Muestreo probabilístico: es aquel en el que cada muestra tiene la misma
probabilidad de ser elegida.
Muestreo intencional u opinático: en el que la persona que selecciona la muestra
es quien procura que sea representativa, dependiendo de su intención u opinión,
siendo por tanto la representatividad subjetiva.
Muestreo sin norma: se toma la muestra sin norma alguna, de cualquier manera,
siendo la muestra representativa si la población es homogénea y no se producen
sesgos de selección.
6.2. Muestreo probabilístico.
Dentro del muestreo probabilístico podemos distinguir entre los siguientes tipos:
 Muestreo aleatorio simple con y sin reemplazo.
 Muestreo estratificado.
 Muestreo por conglomerados.
 Muestreo sistemático.
 Otros tipos de muestreo.
6.2.1. Muestreo aleatorio simple con y sin reemplazamiento
El muestreo aleatorio simple se utiliza cuando los elementos de la población son
homogéneos respecto a la característica a estudiar, es decir cuando a priori no
conocemos que elementos de la población tendrán valores altos de ella.
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 19 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
La muestra es aleatoria simple cuando:
 Cada elemento de la población tiene la misma probabilidad de ser elegido.
 Las observaciones se realizan con reemplazamiento, de manera que la
población es idéntica en todas las extracciones.
La primera condición asegura la representatividad de la muestra: si el 20% de los
elementos tiene la característica A y garantizamos con la forma de seleccionar los
elementos que todos tienen la misma probabilidad de aparecer, por término medio
obtendremos un 20% de los datos muestrales con la característica A.
La segunda condición se impone por simplicidad: si el tamaño de la población (N)
es grande con relación al tamaño de la muestra (n), es prácticamente indiferentes
realizar el muestreo con o sin reemplazamiento, pero el análisis resulta más simple
cuando suponemos reemplazamiento.
En una muestra aleatoria simple cada observación tiene la distribución de
probabilidad de la población. Sea f(x) la distribución de la variable observada x y
sea la muestra formada por la variable n - dimensional:
X '  ( x1 ,......xn ) donde x1 representa el valor de x en el elemento i - ésimo. Si
todos los elementos tiene la misma distribución de probabilidad de la población,
entonces:
f1  f 2  ..... f n  f
Como además las observaciones son independientes, y f C es la distribución
conjunta de la muestra, se cumple la condición matemática de una muestra aleatoria
simple: f C ( x1 , x2 ...., xn )  f1 ( x1 )..... f n ( xn )  f ( x1 ).... f ( xn ) .
6.2.2. Muestreo estratificado
Cuando se dispone de información sobre la población, conviene tenerla en cuenta
cuando se selecciona la muestra. Un ejemplo clásico son las encuestas de opinión,
donde las personas son heterogéneas en razón de su sexo, edad, profesión, etc.
Interesa en estos casos que la muestra tenga una composición análoga a la
población, lo cual se consigue con un muestreo estratificado.
Se denomina muestreo estratificado aquel en que los elementos de la población
se dividen en clases o estratos. La muestra se toma asignando una cuota de
miembros a cada estrato y escogiendo los elementos por muestreo aleatorio simple
dentro del estrato.
Si hay k estratos de tamaños N1 ,......N k y tales que N  N1  .....  N k tomaremos
una muestra que garantice la presencia adecuada de cada estrato. Existen dos
criterios básicos para dividir el tamaño total de la muestra (n) entre los estratos (ni):

Proporcionalmente al tamaño relativo del estrato en la población, es decir:
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 20 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
N 
ni  n   i 
N 

Proporcionalmente a la variabilidad del estrato. Si conocemos la varianza
de la característica a estudiar en cada estrato, tomaremos el tamaño
muestran en cada uno proporcional a su variabilidad, de manera que los
estratos más variables estarán más representados. En concreto si
llamamos  i a la desviación típica del estrato i , se tomará:




  i Ni 
ni  n   k
 expresión que es igual a la anterior si la variabilidad es
   j N j 
 j 1

aproximadamente constante.
6.2.3. Muestreo por conglomerados
Existen casos en los que no se dispone de una lista con el número de elementos
de la población ni de los posibles estratos. En este caso los elementos de la
población se encuentran de forma natural agrupados por conglomerados, cuyo
número sí se conoce. Por ejemplo: la población se distribuye por provincias, los
habitantes de una ciudad en barrios, etc. Si podemos suponer que cada uno de
estos conglomerados es una muestra representativa de la población total respecto a
la variable que se estudia, podemos seleccionar alguno de estos conglomerados al
azar y analizar dentro de ellos, analizar todos sus elementos o una muestra
aleatoria simple. Este método se conoce como muestreo por conglomerados y tiene
la ventaja de simplificar la recogida de la información muestral. El inconveniente
reside en que si los conglomerados con heterogéneos entre sí, si sólo se analiza
alguno de ellos la muestra final no es representativa de la población.
La estratificación y el conglomerado son ideas opuestas: la estratificación
funciona tanto mejor cuanto mayores sean las diferencias entre los estratos y más
homogéneos sean éstos internamente, mientras los conglomerados funcionan si hay
muy pocas diferencias entre ellos y son muy heterogéneos internamente ya que
incluyen la variabilidad de la población dentro de cada uno.
6.2.4. Muestreo sistemático
El muestreo sistemático se aplica cuando los elementos de la población están
ordenados en listas. Supongamos que la población tiene tamaño N y se desea una
N
muestra de tamaño n , con k el entero más próximo a
. La muestra sistemática
n
se toma eligiendo al azar (con número aleatorios) un elemento entre los primeros k .
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 21 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
Sea n1 el orden del elegido, tomaremos a continuación los elementos n1  k ,
n1  2k , etc., a intervalos fijos de k hasta completar la muestra. Si el orden de los
elementos en la lista es al azar, este procedimiento es equivalente al muestro
aleatorio simple, aunque resulta más fácil de realizar sin errores. Pero si el orden es
tal que los elementos de la lista están ordenados de modo que los más próximos
tienden a ser más semejantes que los alejados el muestreo sistemático tiene a ser
más preciso que el aleatorio simple, ya que cubre de forma homogénea toda la
población.
6.3. Aplicaciones de técnicas de muestreo en la seguridad vial.
Cualquiera de las técnicas descritas puede ser aplicada en el ámbito de la
seguridad vial. En esta sección se presentan algunos ejemplos de los estudios más
recientes realizados por y para la DGT y que están basados en selecciones de
muestras en virtud de las limitaciones que impone un estudio que se extienda a la
población.
6.3.1. Construcción del indicador de velocidad de flujo libre.
En los últimos 3 años la DGT ha puesto en marcha un proyecto de obtención de
medidas de velocidad de flujo libre (VFL) en la red española de carreteras, para la
construcción de los indicadores de seguridad que solicita el Observatorio Europeo
de Seguridad vial (ERSO) a los países miembros de la UE.
El ERSO es el resultado del proyecto europeo SafetyNet desarrollado entre los
años 2005 a 2008 y en el que se sentaron las bases de creación de este organismo,
además de las condiciones en las que los distintos indicadores de funcionamiento de
la seguridad (Safety Performance Indicators: SPI) propuestos deben obtenerse para
asegurar la homogeneidad de la información que se pretende comparar entre
países.
Entre los cometidos del ERSO está la vigilancia y seguimiento de los indicadores
de los países europeos y entre los cuales se encuentra el SPI de velocidad de flujo
libre.
En España, el SPI-VFL se construye a partir de las observaciones tomadas en
100 puntos escogidos con un muestreo estratificado. Como se ha dicho antes, el
objetivo de la estratificación puede ser la reducción de la varianza de las
estimaciones y/o la estimación de la distribución de la velocidad de flujo libre en
cada estrato. Es importante tener esto en cuenta a la hora de hacer inferencia, ya
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 22 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
que no se deben mezclar poblaciones si no tiene sentido desde el punto de vista de
la seguridad vial.
Por razones de reducción de varianza y estudio por separado de la distribución en
cada estrato, se consideró la población formada por los conductores españoles que
circulan por distintos tipos de carretera. Los tipos de vías considerados, tanto bajo la
titularidad del Estado como de las Comunidades Autónomas son:
Autopista (AP).
Autovía (AV).
Vía convencional o carreteras nacionales límite 100 y
Vías convencionales de límite 90 km/h
Por lo que la muestra se ha obtenido con un criterio doble de estratificación: por
tipo de vía con los datos de tráfico y por regiones con datos de población.
Los SPI-VFL se han determinado para 3 tipos de vehículos: ligeros, pesados y
motos en diferentes franjas horarias, fuera de períodos punta o de alteraciones de
tráfico por eventos especiales. Los tipos de vehículos se han establecido por un
criterio de longitud.
6.3.2. Barómetro de opinión sobre seguridad vial.
En el Barómetro, se pretende recoger mediante encuestas la percepción y opinión
de los españoles en relación a diferentes aspectos de la seguridad vial, como:






Los hábitos y conductas de conducción
El grado de peligrosidad que se percibe en las conductas de conducción
El grado de sensibilización en relación a los accidentes de tráfico
La valoración de las medidas para la mejora de la seguridad vial
La percepción de las campañas de comunicación y medios de información
La valoración de la administración en relación a las políticas de seguridad
vial
Para ello se han realizado entrevistas telefónicas asistidas por ordenador a través
del sistema CATI (ComputerAssistedTelephoneInterview), a la muestra estratificada
con las siguientes características:






Ámbito geográfico:España
Universo: ciudadanos de 16 o más años empadronados en España
Número de entrevistas: 4.400
Margen de error: ±1,65%, para un nivel de confianza del 95% y p=q=0,5
Diseño de la muestra: Muestra estratificada por comunidad autónoma
mediante afijación no proporcional.
Dentro de cada comunidad autónoma, la muestra se ha distribuido
proporcionalmente por dimensión de municipio y provincia.
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 23 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014


En cada comunidad, la selección de los individuos se ha realizado por
cuotas cruzadas de sexo y edad de acuerdo a la distribución real de la
población.
Finalmente, los resultados se han ponderado de acuerdo al peso real de
cada comunidad autónoma
6.3.3. Otras aplicaciones
En el ámbito de seguridad vial, las técnicas de muestreo se han utilizado en otras
campañas que lleva a cabo la DGT cada año: por ejemplo la de medición de uso de
cinturón y casco…...
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 24 de 25
Temario General de la ESTT - OEP 2014
Parte:1 Movilidad Segura
Elaborado en 2014
ANEXO I: BIBLIOGRAFÍA.

Martín-Pliego López, “Introducción a estadística económica y empresarial”.
Ed. Thomson.

López Cachero, “Fundamentos y métodos de la Estadística” Ed. Pirámide.

Harvey (1.989), “Forecasting, Structural Time Series Models and the Kalman
Filter. Cambridge University Press.

Box y Jenkins. “Time Series Analysis, Forecasting and Control” (1.970).

Wagenaar (1.983),

Aparicio et al. (2011), Aparicio, F, Arenas, B., Mira., J., y Paez, J. (2010). The

endurance of the effects of the Penalty Points System in Spain three years

after. Main influencing factors . Accident Analysis and Prevention

Fridstrom y otros (1.991),

Arenas, B., Aparicio, F., y González, C., y Gómez, A. (2009). The influence
of heavy goods vehicle traffic on accidents on different types of Spanish
interurban roads, Accident Analysis and Prevention, 41 (1). 15 - 24. ISSN
0001-4575

Hiselius (2004)

Peña, D. Series temporales.

Peña, D. (2005). Fundamentos de estadística. Alianza Editorial.

Harvey, A., y Durbin, J., (1986). The effects of seat belt legislation on British
road casualties. A case study in structural time series (with discussion),
Journal of the Royal Statistical Society, A, pp.140,187-227

García-Ferrer, A., de Juan., A. y Poncela, P., (2006), Forecasting traffic
accidents using dissagregated data. International Journal of Forecasting, 22,
pp. 203-222

García-Ferrer, A., de Juan., A. y Poncela, P., (2007). The relationship
between road traffic accidents and real economic activity in Spain: common
cycles and health issues, Heath Economics, 16, pp. 603-626.

Bijleveld, F., Commandeur, J., Koopman, S.J. y Van Monfort, K., (2010),
Multivariate non-linear time series modelling of exposure and risk in road
safety research, Applied Statistics, 59, p1, pp 145-161

Bijleveld, F., Commandeur, Gould, P, y J., Koopman, S.J. (2008), Modelbased measurement of risk in time series with applications, Journal of the
Royal Statistical Society, Series A., 171,265-277

DGT. Barómetro de opinion sobre seguridad vial. Noviembre de 2008.

DGT. Construcción del indicador de velocidad de flujo libre. Años 2009-2010.

DGT. Mediciones de uso de cinturón y casco.
Autores:
Juan Francisco Morales Sierra
Blanca Arenas Ramírez
Tema 18. Página 25 de 25