Steven Pinker y la diferencia de normales

Mientras leía la última entrada en el blog de Alejandro Gaviria, la verdad no me concentré tanto en su contenido sino en un hecho pequeño que menciona: el posible nombramiento de Larry Summers como secretario del tesoro de Barack Obama, posición semejante a la del ministro de hacienda en Colombia.

Larry Summers ha sido sumamente polémico y tal vez discuta sobre eso en mi otro blog. Quizás la polémica más famosa de su parte surgió cuando era presidente de la Universidad de Harvard hace tres años. Summers dijo que el porcentaje pequeño de mujeres en las facultades de ciencias podría deberse a diferencias cognitivas de nacimiento entre hombres y mujeres. Obviamente, se despertó un furor periodístico alrededor de la noticia y en medio del debate suscitado surgió uno científico entre dos renombrados psicólogos de Harvard: Steven Pinker y Elizabeth Spelke (puede encontrar el contenido completo del debate aquí). Aunque yo tiendo a estar más de acuerdo con la posición de Pinker y no mucho con la de Spelke, quiero señalar un error conceptual en el que cayó Pinker cuando intentó usar la distribución normal para darle solidez a su argumento. Según el debate citado, Pinker dijo lo siguiente en su intervención:

En ninguna parte las mujeres están cercanas a la ausencia, ni siquiera en el campo en el cual tienen más baja representación. Las explicaciones para las diferencias por sexo deben ser también estadísticas. Y he aquí un referente para toda la discusión:

Estas son dos distribuciones gaussianas o normales […]. En el eje X se tiene la habilidad que busca medirse. En el eje Y está la proporción de personas que tiene esta habilidad. La sobreposición de las curvas es lo que usted obtiene cuando compara cualquier medida en la que los sexos difieran. En este ejemplo, si decimos que esta es la curva de los hombres y esta la de las mujeres, las medias pueden ser diferentes, pero en cualquier nivel particular hay miembros representantes de los dos géneros.

[…] Hay algunos corolarios importantes al tener la sobreposición de dos distribuciones normales. Una es que la distribución normal cae de acuerdo a la exponencial negativa del cuadrado de la distancia de la media. Esto quiere decir que aun cuando exista solo una pequeña diferencia en las medias de dos distribuciones, entre más extremo sea el valor, mayor será la disparidad que habrá entre las dos clases de individuos con tal valor. Esto es, la razón se hace más extrema entre más se acerque a las colas. Si ponemos una lupa en la cola de la distribución, vemos que aun cuando las distribuciones se sobreponen en la parte abultada de las curvas, cuando se va hacia los extremos la diferencia entre las dos curvas se hace cada vez mayor.

Por ejemplo, es obvio que las distribuciones de hombres altos y mujeres altas se sobreponen: no pasa que todos los hombres sean más altos que todas las mujeres. Pero mientras que en 1.75 metros hay 30 hombres por cada mujer, en 1.8 metros hay dos mil hombres por cada mujer. Ahora, las diferencias por sexo en la cognición no tienden a ser tan extremas, pero el fenómeno estadístico es el mismo [traducción mía, énfasis en el original].

Adicioné como enlaces en el texto citado las diapositivas que utilizó Pinker para mayor claridad. Y mi punto es muy sencillo: precisamente por el decaimiento de la función de densidad normal cuando va para infinito, el argumento de Pinker no es muy bueno. Si usted vio cálculo alguna vez recordará que

si \lim_{x\rightarrow\infty}f(x)=0 y \lim_{x\rightarrow\infty}g(x)=0 entonces \lim_{x\rightarrow\infty}f(x)+g(x)=0.

Luego la disparidad a la que hace referencia el psicólogo no es tal cuando el valor de la característica aumenta. Ni siquiera tiene por qué ser cierto eso en la práctica pues, tomando el mismo ejemplo de la estatura de Pinker, es completamente posible (y no carece de sentido) que en los valores más altos también comenzará a decrecer el número de hombres por mujer. De hecho, según unos resultados rápidos en google, la mujer más alta del mundo mide 2.36 metros y el hombre más alto del mundo mide también 2.36 metros. Entonces, la razón es de 1 a 1 entre hombres y mujeres con estatura de 2.36 metros o superior. En la práctica eso hecha completamente por el piso el ejemplo de Pinker.

De todas maneras en términos estrictamente matemáticos es muy claro que la  diferencia entre las dos distribuciones tiende a evaporarse cuando los valores se hacen extremos… precisamente porque la normal va para cero cuando la característica medida va para infinito. La diapositiva de la lupa no se tiene necesariamente, de hecho es muy claro ahí el error de Pinker. No tiene nada de cierto que las diferencias se acentúen más en los extremos que cerca a la media; es más, esa diferencia tiende a decrecer suavemente, vea la gráfica de las dos normales usada por Pinker:

pinker_page_15

Dada la discusión, vamos a suponer que la curva morada representa la proproción de estatura de los hombres y la verde la de las mujeres. Sea c el punto donde las dos gráficas se cruzan.  El área entre las dos curvas de ahí para adelante representa la diferencia entre las dos distribuciones. Claramente, si se toma un punto que esté más a la derecha de c, llamemos d a ese punto, entonces la diferencia entre las dos curvas será menor de ahí para adelante simplemente porque estoy dejando por fuera toda el área entre los puntos c y d. Luego, como las dos curvas son continuas y suaves, eso prueba que la diferencia entre las dos distribuciones decrece y, por el resultado mencionado de límites, va para cero.

Una palabra final: estoy usando el hecho de que las dos distribuciones tienen la misma varianza.  Si la varianza de la curva verde fuera mayor que la morada entonces el argumento cambiaría en algún punto (porque las curvas se volverían a cruzar); pero Pinker más adelante argumenta que hay mayor varianza en los hombres que en las mujeres, luego pasa que la curva morada se ensancha más mientras que la verde sigue igual. En ese caso sigue siendo válida mi argumentación.

Responder

Por favor, inicia sesión con uno de estos métodos para publicar tu comentario:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s