Cómo generar una función del mismo orden y otros pensamientos sobre la revisión de pares

La academia tiene cosas curiosas. Por ejemplo uno de los tesoros guardados en más alta estima por la ciencia moderna es la identidad secreta de los pares que evalúan los artículos que los otras personas escriben. Lo de la identidad secreta puede hacerlos sonar a emocionantes súper héroes pero para los autores de artículos neófitos, como yo, sus comentarios suelen ser casi otro problema de investigación que ameritaría una tesis aparte. Mi comentario va a que, por más secreto que sea el proceso, dada la naturaleza de mi investigación, tengo un grupo bien cerrado de personas (tres) que, creo, pudieron ser los posibles referees de uno de mis papers.

No sé cómo tomarán las correcciones los autores senior de artículos científicos, pero en mi caso cada comentario de los referees en uno solo de mis papers es como si fuera una estocada y me alborota la gastritis. Al comienzo no fue así, creí que podía resolver sus cuatro correcciones principales fácilmente (las otras, que hubo más, eran de estilo y typos); pero con el correr de los días, al ver que no entiendo sus apreciaciones y cuando las entiendo no sé cómo solucionarlas, mi percepción se está convirtiendo rápidamente en que la corrección no es cosa sencilla. O tal vez sí y me estoy dejando abrumar.

La verdad a mí jamás se me habrían ocurrido esas correcciones que me hicieron así que de veras agradezco que me las hayan hecho evidentes. Pero duele un poco en el ego por varias razones que no mencionaré. Una amiga, quien tiende a ver las cosas siempre por el lado positivo, me planteó una idea diferente para solucionar parte de mi dilema interno de sentirme minúsculo: «Míralo por el otro lado —me dijo—: existen pocas personas en el mundo que pueden corregir lo que tú haces». Esa percepción es interesante porque me resuelve en mucho el golpe al ego (y lo acepto, ese me dolió bastante)… la cosa es que el ego arreglado no me soluciona el problema matemático, lo que necesito resolver para ver mi artículo publicado :-/.

En fin, con base en eso quiero aquí mostrar un argumento muy simple de dos funciones del mismo orden: Sean g(x)=\frac{x-1-\log x}{x} y f(x)=\frac{(x-1)^2}{2}. El referee dice que las dos funciones son del mismo orden cuando x\rightarrow1, cosa que es fácilmente verificable, como procederé a mostrar. Decir que las dos funciones son del mismo orden cerca de 1 es decir \lim_{x\rightarrow1}g(x)/f(x)=K, donde K es una constante diferente de 0. La razón es que si K se va para infinito en el límite entonces g crece más rápido que f y si K va para cero en el límite entonces f crece más rápido que g. Entonces, por definición de las dos funciones, tenemos que

\lim_{x\rightarrow1}g(x)/f(x)=\lim_{x\rightarrow1}\frac{2(x-1-\log x)}{x(x-1)^2}.

Ahora, llámeme superficial pero, como numerador y denominador van para 0 cuando x va para 1, la herramienta que yo uso para determinar este tipo de afirmaciones es la nunca bien ponderada pero siempre útil regla de L’Hopital, de la cual obtenemos:

\lim_{x\rightarrow1}g(x)/f(x)=\lim_{x\rightarrow1}g'(x)/f'(x)=\lim_{x\rightarrow1}\frac{2(1-1/x)}{(x-1)^2+2x(x-1)}.

Y esa última igualdad se puede re-escribir menos feo así:

\lim_{x\rightarrow1}\frac{2(x-1)}{x(x-1)^2+2x^2(x-1)}.

Luego, podemos volver a aplicar L’Hopital:

\lim_{x\rightarrow1}\frac{2}{(x-1)^2+2x(x-1)+4x(x-1)+2x^2}.

Y al final el límite es 2/2=1. La pregunta que me surge —la que inspira esta entrada— es cómo el señor referee encontró f(x) (sobre todo porque la encontró de tal manera que perjudica lo que quiero hacer con g(x)). Una vez tengo f(x) mostrar que las dos son del mismo orden cerca de 1 es fácil, pero ¿cómo encontrar f(x) originalmente? No lo he intentado pero la idea de «delvolverse» usando integración me suena un poco muy esotérica, la verdad.

Idealizaciones en el infinito

Esta entrada no tiene nada que ver con hipótesis del continuo ni nada de esas cosas. Tan apasionante como pueda resultar su estudio, no es el tema que me interesa tocar en este momento. El objetivo es más mundano, más terreno: un intento de responder a una pregunta que me han hecho varias veces: ¿Cuál es la idea de trabajar con sistemas infinitos de objetos matemáticos? Objetos matemáticos aquí no tiene un significado claro, pueden ser dimensiones, funciones o cualquier otro concepto matemático o al menos matematizable.

La pregunta parece natural. De hecho, en la estadística son muy conocidos los métodos que permiten la reducción en las dimensiones de la información para hacer más manejable su estudio; tal es el caso del análisis de componentes principales. Así las cosas, ¿cuál es la intención de los matemáticos cuando quieren trabajar con sistemas infinitos?

Pues la primera respuesta es el interés puramente teórico. Tomemos el ejemplo de la cantidad de dimensiones. Suponga que usted sabe que cierto modelo, teorema o resultado en movimiento de partículas, por decir algún área, se cumple en dimensiones 1 y 2. La pregunta sobre cómo extender el resultado al caso de dimensiones mayores es absolutamente natural. Como dice Grimmett en su conocido libro Percolation (una de las frases que aparecen a la derecha de este blog): «Los matemáticos tienen considerable talento en el arte de la generalización». Las aplicaciones quizás vengan después, pero realmente esa no tiende a ser una preocupación del teórico. Mi orientador me dijo alguna vez de manera muy graciosa que el matemático que investiga pensando en las aplicaciones es como quien se pone a pensar en la sobrepoblación mundial durante su noche de bodas.

La segunda razón la voy a trascribir de unas notas excelentes de Hans-Otto Georgii et al sobre mecánica estadística tituladas The random geometry of equilibrium phases (p. 11):

As all systems in nature are finite, one may wonder why we consider here systems with infinitely many constituents. The answer is that sharp results for bulk quantities can only be obtained when we make the idealization to an infinite system. The thermodynamic limit eliminates finite size effects (which are always present but which are not always relevant for certain phenomena) and it is only in the thermodynamic limit of inifinite volume that we can get a clean and precise picture of realistic phenomena such as phase transitions or phase coexistence. This is a consequence of the general probabilistic principle of large numbers. In this sense, infinite systems serve as an idealized approximation to very large finite systems.

Aunque Georgii hace alusión al límite termodinámico, pues está hablando de mecánica estadística, la idea se puede extrapolar en general a toda la matemática: Cuando los sistemas finitos son muy grandes, es mejor tratarlos como si fueran infinitos porque las respuestas van a ser muy aproximadas a la realidad y mucho más fáciles de obtener (por los teoremas límite en el caso de la probabilidad) que estudiar cada uno de los elementos en el sistema finito. Precisamente cuando se está trabajando con sistemas finitos grandes hay dos situaciones: Primero, puede ser que los recursos computacionales sean insuficientes para la labor (créalo o no, la computación sigue bastante colgada para algunas aplicaciones interesantes, tema sobre el cual podría escribir una entrada posterior). Pero aun si no son insuficientes, las aproximaciones por teorema central del límite y por las leyes de los grandes números —en el caso de la probabilidad— son tan exactas que mal vale la pena el esfuerzo y el gasto de evaluar cada elemento del sistema por separado.

En resumen y para terminar, encuentro dos razones principales: la primera, absolutamente válida para el matemático, es el interés natural en generalizar los resultados o encontrar propiedades en «el inifinito»; tal es el caso de las dimensiones (vea por ejemplo tres artículos de Matthew Penrose aquí, aquí y aquí, todos relacionados con «grandes dimensiones»). Y la segunda razón, de interés para la ciencia, es porque tales resultados suelen ser excelentes aproximaciones de los grandes sistemas finitos en estudio, como en la mecánica estadística que tan bien explica Georgii.

Martes 20 de octubre en radio

Mañana martes 20 de octubre, 2:00 pm (-5 GMT), estoy invitado a la emisora de la Universidad Santo Tomás en su programa de estadística. La idea es hablar sobre mi experiencia como estudiante en el exterior. Un buen amigo del pregrado, Francisco Rincón, quien también acaba de llegar al país tras haber realizado una maestría en estadística espacial en la Universidad de Glasgow, es el otro invitado al programa. Si quiere oírlo, puede hacerlo a través del enlace provisto. La invitación es de Andrés Gutiérrez, profesor de estadística de la Santo Tomás, el blogger más popular de estadística en Colombia y quizás en toda América Latina.

Enseñar cálculo con base en probabilidad y otras cositas

Ricardo Pachón, un viejo amigo y colega, me mandó este enlace de los famosos videos TED para que lo comentara (si no conoce la página, lo invito a que aproveche el enlace y vea varios de sus videos que suelen ser muy buenos). En este en particular, Arthur Benjamin, conocido por sus habilidades matemágicas, propone una forma diferente de enseñar cálculo: hacerlo con base en los cursos de probabilidad y estadística. Benjamin se deshace en elogios con estas dos áreas y propone que, por su utilidad y lo divertido que resulta enseñarlas, sería correcto enseñar cálculo con base en ellas.

A mí realmente me parece una buena idea. Aporta una solución al problema de la enseñanza del cálculo y la verdad, más importante que los métodos es el concepto. Lo importante , considero yo, es desarrollar conceptos que den  estructura mental. Igual, sean o no matemáticos, difícilmente los estudiantes se van a encontrar en su vida con una integral por partes que después deba solucionarse con identidades trigonométricas y después con sustitución. Insisto, lo importante es el concepto y después de explicarlo, sus aplicaciones en probabilidad y estadística harán más sencillo entender su uso.

Ahora, note la diferencia entre la postura de Benjamin y la columna de Klaus Ziegler la semana pasada en El Espectador: Ziegler, palabras más palabras menos, se considera de una élite intelectualmente privilegiada que consiguió entender bien el cálculo cuando lo vio en la universidad (no lo dice pero a toda hora parece darlo a entender en su columna). Su única sugerencia es usar recursos computacionales para explicar ciertas cosas (cosa buena pero no suficiente) y dejar los «aspectos más abstractos y complejos [para] ofrecerse solo en cursos exclusivos destinados específicamente a los estudiantes más talentosos». ¡Hagáme el favor la exclusión!

Respecto a eso, me gustaría recordarle al lector una antigua entrada que escribí en este mismo blog llamada Más nalga que cerebro. Por mi experiencia, pero sobre todo por estudios realizados (como este y este), sé que lo importante no es la genialidad sino la dedicación. Es más, el mismísimo Terry Tao, con toda su innegable genialidad, así lo sostiene (véanse esta, esta, esta y esta entradas de su blog, por ejemplo). Tao no es solo su genialidad, de hecho él es grande por su disciplina. Es impresionante seguir su blog y ver que, con sus colaboradores, publica a veces más de un artículo por semana. El solo hecho de sentarse a escribir esos papers muestra el talante de su dedicación (yo llevo casi dos meses intentando completar dos artículos de mi tesis y no he terminado ni siquiera el primero). Citaba en esa entrada también los casos de Newton y Einstein, quienes se hicieron grandes no por su genialidad sino por su dedicación. No es cuestión de talento, es cuestión de disciplina, señor Ziegler, debiera ser menos soberbio.

Por último, volviendo a las habilidades matemágicas de Benjamin, quisiera anotar que los colombianos tenemos a un matemático mucho más rápido que él, Jaime García, quien es reconocido como el calculista más rápido del mundo y tiene varios records Guinness. Hace poco tiempo, cuando García volvió a aparecer en los periódicos del país, se desató alguna controversia maluca entre varios de mis contactos de facebook. Estaban ellos ofendidos porque se le llamara matemático por hacer cálculos mentales. Consideraban que no lo era puesto que no desarrollaba matemáticas nuevas. Lo segundo es eminentemente falso: él desarrolla efectivísimos algoritmos (¡crea matemáticas!) que le ayudan a almacenar datos en su mente más rápido que una computadora. Pero aun si no lo fuera, ¿está la matemática restringida a la investigación? La respuesta, claro, es un rotundísimo NO. ¡Gran matemático es García! Ya quisiera yo tener sus habilidades.

Inscripciones al posgrado en probabilidad y estadística del IME-USP

A continuación publico el siguiente correo (en portugués) que envió internamente el profesor Fabio Machado, probabilista del IME y coordinador del posgrado en estadística del Instituto:

Caríssimos(as),

Estão abertas as inscrições para o Mestrado e Doutorado em Estatística e Probabilidade no Instituto de Matemática e Estatística da USP na cidade de São Paulo. Este programa de pós-graduação está avaliado com nota máxima (nota 7) pela CAPES, fazendo parte do sistema de financiamento do CAPES-PROEX.

No momento estamos em condições de aceitar 12 alunos de doutorado e 25 alunos de mestrado, para os quais ofereceremos pelo menos 20 bolsas de estudos.

Candidatos ao mestrado devem inscrever-se ate 15 de setembro, enquanto que candidatos para o doutorado devem fazer suas inscrições ate 15 de novembro de 2009.

As decisões sobre aceitação/bolsa para o doutorado são tomadas já no mes de dezembro de 2009. As de mestrado serão em função do exame de admissão aplicado no inicio do mes de fevereiro de 2010.

Em 2009 foram defendidas 29 dissertações de mestrado e 21 teses de doutorado. A lista encontra-se no link apresentado abaixo.

Garantimos uma estrutura curricular ampla, com disciplinas de teoria de Probabilidade e Estatística e um conjunto de disciplinas específicas (teóricas e aplicadas) que abrangem áreas relacionadas as linhas de pesquisa desenvolvidas pelo corpo de pesquisadores do departamento. São oferecidas cerca de 12 disciplinas por semestre além de 2 disciplinas no Programa de Verão. Parte fundamental na preparação para os novos desafios, nossa pós-graduação conta com uma programação intensa de conferências e seminários organizados pelos grupos de pesquisa do Departamento de Estatística.

As agências de financiamento à pesquisa —Fapesp, Capes e CNPq— normalmente cobrem a demanda de bolsas por estudantes com ótimo desempenho que ingressam a cada ano. É crescente o número de estudantes de pós-graduação que fazem estágio em excelentes universidades do exterior.

Mais informações podem ser obtidas no endereço

http://www.ime.usp.br/posgraduacao.php/

Atenciosamente

Prof. Dr. Fábio Machado
Coordenador do programa de pós-graduação em Estatística
Departamento de Estatística – USP

Muy interesante. Muchas becas (bolsas) para un programa de excelente calidad.

De falsos positivos y errores de tipo I

En Colombia están tristemente de moda los llamados falsos positivos por los hechos de todos conocidos: la fuerza pública acribilla inocentes (usualmente del campesinado o las clases bajas) para hacerlos pasar por guerrilleros muertos en combate. Dada la repercusión que esta triste noticia ha tenido en el país, se me ocurrió usarla para explicar parte del razonamiento estadístico moderno mezclado con algo de realidad interna en Colombia (esta entrada podría pertenecer por igual a mis dos blogs).

La idea detrás del nombre dado a ese horror político es la siguiente: La fuerza pública tiene dos opciones cuando se encuentra con una persona: la cataloga inocente o la cataloga como delincuente (guerrillero, en el ejemplo). Más aun, por el principio de la presunción de inocencia se asume inicialmente que la persona es un ciudadano inocente, un ciudadano de bien. La otra hipótesis es que el personaje en custión es un guerrillero.

La estadística funciona bajo el mismo razonamiento. Se toma una hipótesis que parece natural de base y se le llama por esa razón hipótesis nula; en el ejemplo, la inocencia del ciudadano. La otra opción, la hipótesis alternativa, es la opuesta; lo opuesto a ser un ciudadano de bien es ser un delicuente (guerrillero, en el caso que nos ocupa). Las hipótesis nula y alternativa usualmente se notan H_0 y H_1, respectivamente.

Entonces hay cuatro posibilidades a la hora de inferir, dos correctas y dos incorrectas: Las dos correctas son 1) no rechazar la hipótesis nula cuando ella es cierta y 2) rechazar la hipótesis nula (aceptando la alternativa) cuando ella es falsa. Las dos posibilidades inferenciales erradas son: 1) rechazar la hipótesis nula cuando ella es cierta y 2) No rechazar la hipótesis nula cuando ella es falsa. En estadística la primera posibilidad errada se llama usualmente error de tipo I, y la segunda posibilidad errada se llama error de tipo II. En contextos más generales al error de tipo I se le llama falso positivo y al error de tipo II se le llama falso negativo.

La anterior explicación nos lleva de vuelta a nuestro ejemplo. Empecemos por el falso negativo: suponga que el militar está ante un guerrillero y lo deja libre creyendo que es inocente, entonces ahí incurrió en un falso negativo o un error de tipo II. Volviendo a la parte tristemente célebre, si la persona es inocente entonces H_0 es verdadera, luego inferir que es guerrillero es un falso positivo o un error de tipo I.

La situación con los horrores cometidos por el ejército colombiano entonces es completamente diferente a los falsos positivos. No se le puede llamar así a la barbarie que ellos perpetraron (y quiero pensar que es pasado) cuando mataron, por ejemplo, a los once jóvenes de Soacha (un pueblo pobre en el centro de Colombia) para hacerlos pasar por guerrilleros en Norte de Santander (un departamento al nororiente del país).

La razón por la cual es un despropósito llamar falsos positivos a las atrocidades del ejército de Colombia con los civiles es doble. La primera y más importante porque intenta esconder con argumentos pseudo-eruditos una rampante violación masiva de los derechos humanos, pasándole por encima a lo que hubiera podido quedar de dignidad de las víctimas y de sus familiares.

La otra razón, más concerniente con los argumentos lógicos que se pretenden en este blog es la siguiente: el falso positivo se da cuando se infiere la realidad de manera errada. Pero aquí el ejército (y quién sabe si algunos del gobierno) en vez de cometer un falso positivo —el error honesto, aunque cruel, de haber confundido a los jóvenes inocentes con guerrilleros— lo que cometió fue una serie asesinatos e intentó inducirlos a la población colombiana como un falso positivo: es decir, quiso hacerles creer a los colombianos que los jóvenes de Soacha eran guerrilleros cuando no lo eran.

No, NO, ¡NO! No hay falso positivo del ejército: los jóvenes eran inocentes y el ejército lo sabía, no hay error en su inferencia (sabían que la hipótesis nula era cierta y aun así la rechazaron). Por eso es vil homicido. Sin adornos. El falso positivo no sería del ejército, que sabía la verdad desde el principio; el falso positivo sería de la opinión pública que, inducida por el ejército, se quedaría con la versión de que esos jóvenes inocentes eran guerrilleros. Por eso, calificar los actos del ejército como falsos positivos es como decir que en Colombia no hay desplazados por la violencia sino solo migración interna… ¿le suena?

Empecé a hacer esta entrada ya hace un par de meses pero la tenía parada porque estaba dedicado a la sustentación de mi tesis. Pero la indignación es igualmente vigente cuando hoy termino estas líneas. Es increíble que se quiera cambiar el nombre de las cosas, que se quiera engañar, que se busque minimizar con una palabra. No hubo falso positivo del ejército, ellos sabían que esos jóvenes no eran guerrilleros. Si ellos sabían, lo que cometieron fue una aberración gigante que está completamente por fuera del análisis lógico en el que se pretende enmarcar. Una aberración que merece ser castigada como lo que es y con las más altas penas.