Materia de estudio
Resumen del tema con citas literales de la normativa oficial. Lee los apuntes y luego pon a prueba lo que has aprendido en el test.
El Tema 39 sobre estadística aplicada a la investigación social es un tema instrumental que aparece en las oposiciones de Policía Nacional - Escala Básica para acreditar que el aspirante maneja conceptos metodológicos y cuantitativos básicos. Las preguntas de examen suelen centrarse en definiciones precisas, tipos de variables, medidas estadísticas y fases del proceso de investigación. Dominar este tema permite responder correctamente preguntas que, por su aparente sencillez, generan muchos errores por confusión terminológica.
Marco normativo y fuentes de referencia
Este tema no se ancla en una ley orgánica concreta, sino en tres fuentes de referencia metodológica y estadística:
- Anuario Estadístico del Ministerio del Interior: publicación oficial periódica que recoge datos cuantitativos sobre criminalidad, seguridad ciudadana y actividad policial en España. Es la fuente estadística de referencia para la Policía Nacional.
- Estadística básica aplicada: conjunto de conceptos y técnicas cuantitativas de uso general en ciencias sociales.
- Metodología de investigación social: marco teórico y procedimental para el diseño y ejecución de estudios sobre fenómenos sociales, incluidos los de naturaleza policial y criminológica.
Estructura del tema
El tema se articula en torno a cuatro grandes bloques:
- Conceptos fundamentales de estadística
- Tipos de variables y escalas de medición
- Medidas estadísticas descriptivas
- Fases y técnicas de la investigación social
Conceptos clave
Estadística: definición y ramas
La estadística es la disciplina que se ocupa de la recopilación, organización, análisis e interpretación de datos numéricos para extraer conclusiones sobre un conjunto de elementos.
Se divide en dos grandes ramas:
- Estadística descriptiva: describe y resume los datos de una muestra o población mediante tablas, gráficos y medidas numéricas. No permite generalizar más allá de los datos observados.
- Estadística inferencial: a partir de los datos de una muestra, extrae conclusiones (inferencias) sobre la población de la que procede dicha muestra. Implica siempre un margen de error.
Población y muestra
- Población (o universo): conjunto total de elementos sobre los que se quiere obtener información.
- Muestra: subconjunto representativo de la población, seleccionado para ser estudiado.
- Unidad estadística: cada uno de los elementos individuales que componen la población o la muestra.
- Censo: estudio que abarca a toda la población, sin muestreo.
Variable estadística
Una variable es cualquier característica que puede tomar distintos valores en los elementos estudiados.
Clasificación principal:
- Variables cualitativas (o categóricas): expresan una cualidad o atributo. No son numéricas.
- Nominales: sin orden entre categorías (ej. sexo, nacionalidad).
- Ordinales: con orden entre categorías, pero sin distancia cuantificable (ej. nivel de satisfacción: bajo, medio, alto).
- Variables cuantitativas: expresan una cantidad numérica.
- Discretas: solo toman valores enteros o contables (ej. número de detenciones).
- Continuas: pueden tomar cualquier valor dentro de un intervalo (ej. peso, temperatura).
Escalas de medición
Las cuatro escalas de medición, de menor a mayor precisión, son:
- Nominal: clasifica sin orden (ej. tipo de delito).
- Ordinal: clasifica con orden, sin distancias iguales entre categorías.
- De intervalo: distancias iguales entre valores, pero sin cero absoluto (ej. temperatura en grados Celsius).
- De razón (o proporción): distancias iguales y cero absoluto real (ej. número de infracciones, edad en años).
Frecuencias
- Frecuencia absoluta (fi): número de veces que aparece un valor en los datos.
- Frecuencia relativa (hi): cociente entre la frecuencia absoluta y el total de datos. Se expresa en tanto por uno o en porcentaje.
- Frecuencia acumulada: suma de las frecuencias de todos los valores hasta el valor considerado.
Medidas estadísticas descriptivas
Medidas de tendencia central
Indican el valor en torno al cual se agrupan los datos:
- Media aritmética: suma de todos los valores dividida entre el número de datos. Es la más utilizada, pero muy sensible a valores extremos (atípicos).
- Mediana: valor que ocupa la posición central cuando los datos están ordenados. Divide la distribución en dos mitades iguales. Más robusta que la media ante valores atípicos.
- Moda: valor que aparece con mayor frecuencia. Una distribución puede ser unimodal, bimodal o multimodal. Es la única medida aplicable a variables nominales.
Medidas de dispersión
Indican cuánto se separan los datos entre sí o respecto a la media:
- Rango (o recorrido): diferencia entre el valor máximo y el mínimo. Es la medida de dispersión más sencilla.
- Varianza: media de los cuadrados de las desviaciones respecto a la media. Al elevar al cuadrado, las unidades quedan elevadas al cuadrado también.
- Desviación típica (o estándar): raíz cuadrada de la varianza. Está expresada en las mismas unidades que los datos originales y es la medida de dispersión más utilizada.
- Coeficiente de variación: cociente entre la desviación típica y la media. Permite comparar la dispersión de distribuciones con distintas unidades o distintas medias.
Cuartiles y percentiles
- Cuartiles: dividen la distribución ordenada en cuatro partes iguales (Q1, Q2, Q3). Q2 coincide con la mediana.
- Percentiles: dividen la distribución en cien partes iguales.
- Rango intercuartílico: diferencia entre Q3 y Q1. Mide la dispersión del 50 % central de los datos.
Fases de la investigación social
El proceso de investigación social sigue una secuencia lógica:
- Planteamiento del problema: delimitación del objeto de estudio y formulación de la pregunta de investigación.
- Revisión bibliográfica: análisis de estudios previos sobre el tema.
- Formulación de hipótesis: proposición provisional y verificable que relaciona variables.
- Diseño metodológico: elección del método (cuantitativo, cualitativo o mixto) y de las técnicas de recogida de datos.
- Recogida de datos: aplicación de las técnicas seleccionadas (encuesta, observación, entrevista, análisis documental).
- Análisis e interpretación de datos: tratamiento estadístico y extracción de conclusiones.
- Elaboración del informe: presentación ordenada de los resultados.
Técnicas de recogida de datos más habituales
- Encuesta: cuestionario aplicado a una muestra. Puede ser autoadministrada o asistida.
- Entrevista: conversación estructurada, semiestructurada o no estructurada con el sujeto de estudio.
- Observación: registro sistemático de comportamientos o fenómenos. Puede ser participante o no participante.
- Análisis documental: estudio de fuentes secundarias (registros, estadísticas oficiales, informes).
Datos numéricos y plazos que más se preguntan
- La media es la medida de tendencia central más afectada por los valores extremos.
- La moda es la única medida de tendencia central aplicable a variables nominales.
- La mediana es preferible a la media cuando hay valores atípicos.
- La desviación típica es la raíz cuadrada de la varianza.
- El Q2 (segundo cuartil) equivale a la mediana.
- El rango intercuartílico = Q3 − Q1.
- Las escalas de medición van de menor a mayor precisión: nominal → ordinal → intervalo → razón.
- Solo en la escala de razón existe un cero absoluto real.
Errores típicos del opositor
- Confundir estadística descriptiva con inferencial: la descriptiva solo describe los datos disponibles; la inferencial generaliza a la población.
- Confundir frecuencia relativa con frecuencia absoluta: la relativa es siempre un valor entre 0 y 1 (o un porcentaje).
- Creer que la media siempre es la mejor medida central: no lo es cuando hay valores atípicos; en ese caso, la mediana es más adecuada.
- Confundir varianza y desviación típica: la varianza está en unidades al cuadrado; la desviación típica, en las mismas unidades que los datos.
- Aplicar la moda como si fuera exclusiva de variables cuantitativas: también se aplica a variables cualitativas, y es la única medida central válida para variables nominales.
- Confundir variable discreta con variable cualitativa ordinal: una variable discreta es cuantitativa (cuenta unidades enteras); una ordinal es cualitativa con orden.
Trucos mnemotécnicos
- “Media Moda Mediana” → las tres M: para recordar las tres medidas de tendencia central.
- “NOIR” (Nominal, Ordinal, Intervalo, Razón): orden ascendente de las escalas de medición.
- “La varianza tiene cuadrado, la desviación lo ha quitado”: para recordar que la desviación típica es la raíz cuadrada de la varianza.
- “Q2 = Mediana”: el segundo cuartil siempre coincide con la mediana; si el examen pregunta cuál de los cuartiles es la mediana, la respuesta es siempre Q2.
- “Moda para Nominales, Mediana para Atípicos, Media para todo lo demás”: regla práctica para elegir la medida central adecuada según el contexto.
- “Inferencial → Inferir → Generalizar”: la estadística inferencial generaliza desde la muestra a la población; la descriptiva, no.