Probabilidad y ciencia

Matemáticas (probabilidad), ciencia y educación

El abstract de mi research statement

Después de que mi abstract pasó por una referee no tan anónimo y más bien regañetas porque no especifico claramente las cosas, decidí añadir al menos unos enlaces a los conceptos usados. Por supuesto, esta entrada es por pura diversión.

After one whole week writing my research statement and having completed no more than one single page, I decided to erase almost everything (read it in measure-theoretic terms, of course) to give it a new better order —thus, the appearance of “better” proves that writing cannot be understood neither as absolute convergence (i.e., the final meaning changes if you change the order in the sequence of letters or words… a thing for which you don’t have to be a mathematician to acknowledge it :-/) nor as permutation-invariant (¿?).  On the other hand, deadline limits seem to reveal a phase transition in the sense of having an exponential decay to 0 and I am starting to conjecture that the end of my teaching statement diverges.

16/11/2009 Publicado por Daniel Andrés Díaz Pachón | Diversión | | Aún no hay comentarios

Idealizaciones en el infinito

Esta entrada no tiene nada que ver con hipótesis del continuo ni nada de esas cosas. Tan apasionante como pueda resultar su estudio, no es el tema que me interesa tocar en este momento. El objetivo es más mundano, más terreno: un intento de responder a una pregunta que me han hecho varias veces: ¿Cuál es la idea de trabajar con sistemas infinitos de objetos matemáticos? Objetos matemáticos aquí no tiene un significado claro, pueden ser dimensiones, funciones o cualquier otro concepto matemático o al menos matematizable.

La pregunta parece natural. De hecho, en la estadística son muy conocidos los métodos que permiten la reducción en las dimensiones de la información para hacer más manejable su estudio; tal es el caso del análisis de componentes principales. Así las cosas, ¿cuál es la intención de los matemáticos cuando quieren trabajar con sistemas infinitos?

Pues la primera respuesta es el interés puramente teórico. Tomemos el ejemplo de la cantidad de dimensiones. Suponga que usted sabe que cierto modelo, teorema o resultado en movimiento de partículas, por decir algún área, se cumple en dimensiones 1 y 2. La pregunta sobre cómo extender el resultado al caso de dimensiones mayores es absolutamente natural. Como dice Grimmett en su conocido libro Percolation (una de las frases que aparecen a la derecha de este blog): «Los matemáticos tienen considerable talento en el arte de la generalización». Las aplicaciones quizás vengan después, pero realmente esa no tiende a ser una preocupación del teórico. Mi orientador me dijo alguna vez de manera muy graciosa que el matemático que investiga pensando en las aplicaciones es como quien se pone a pensar en la sobrepoblación mundial durante su noche de bodas.

La segunda razón la voy a trascribir de unas notas excelentes de Hans-Otto Georgii et al sobre mecánica estadística tituladas The random geometry of equilibrium phases (p. 11):

As all systems in nature are finite, one may wonder why we consider here systems with infinitely many constituents. The answer is that sharp results for bulk quantities can only be obtained when we make the idealization to an infinite system. The thermodynamic limit eliminates finite size effects (which are always present but which are not always relevant for certain phenomena) and it is only in the thermodynamic limit of inifinite volume that we can get a clean and precise picture of realistic phenomena such as phase transitions or phase coexistence. This is a consequence of the general probabilistic principle of large numbers. In this sense, infinite systems serve as an idealized approximation to very large finite systems.

Aunque Georgii hace alusión al límite termodinámico, pues está hablando de mecánica estadística, la idea se puede extrapolar en general a toda la matemática: Cuando los sistemas finitos son muy grandes, es mejor tratarlos como si fueran infinitos porque las respuestas van a ser muy aproximadas a la realidad y mucho más fácil de obtener (por los teoremas límite en el caso de la probabilidad) que estudiar cada uno de los elementos en el sistema finito. Precisamente cuando se está trabajando con sistemas finitos grandes hay dos situaciones: Primero, puede ser que los recursos computacionales sean insuficientes para la labor (créalo o no, la computación sigue bastante colgada para algunas aplicaciones interesantes, tema sobre el cual podría escribir una entrada posterior). Pero aun si no son insuficientes, las aproximaciones por teorema central del límite y por las leyes de los grandes números —en el caso de la probabilidad— son tan exactas que mal vale la pena el esfuerzo y el gasto de evaluar cada elemento del sistema por separado.

En resumen y para terminar, encuentro dos razones principales: la primera, absolutamente válida para el matemático, es el interés natural en generalizar los resultados o encontrar propiedades en «el inifinito»; tal es el caso de las dimensiones (vea por ejemplo tres artículos de Matthew Penrose aquí, aquí y aquí, todos relacionados con «grandes dimensiones»). Y la segunda razón, de interés para la ciencia, es porque tales resultados suelen ser excelentes aproximaciones de los grandes sistemas finitos en estudio, como en la mecánica estadística que tan bien explica Georgii.

10/11/2009 Publicado por Daniel Andrés Díaz Pachón | Matemáticas | | 1 comentario

Martes 20 de octubre en radio

Mañana martes 20 de octubre, 2:00 pm (-5 GMT), estoy invitado a la emisora de la Universidad Santo Tomás en su programa de estadística. La idea es hablar sobre mi experiencia como estudiante en el exterior. Un buen amigo del pregrado, Francisco Rincón, quien también acaba de llegar al país tras haber realizado una maestría en estadística espacial en la Universidad de Glasgow, es el otro invitado al programa. Si quiere oírlo, puede hacerlo a través del enlace provisto. La invitación es de Andrés Gutiérrez, profesor de estadística de la Santo Tomás, el blogger más popular de estadística en Colombia y quizás en toda América Latina.

19/10/2009 Publicado por Daniel Andrés Díaz Pachón | Estadística | , | 3 comentarios

Enseñar cálculo con base en probabilidad y otras cositas

Ricardo Pachón, un viejo amigo y colega, me mandó este enlace de los famosos videos TED para que lo comentara (si no conoce la página, lo invito a que aproveche el enlace y vea varios de sus videos que suelen ser muy buenos). En este en particular, Arthur Benjamin, conocido por sus habilidades matemágicas, propone una forma diferente de enseñar cálculo: hacerlo con base en los cursos de probabilidad y estadística. Benjamin se deshace en elogios con estas dos áreas y propone que, por su utilidad y lo divertido que resulta enseñarlas, sería correcto enseñar cálculo con base en ellas.

A mí realmente me parece una buena idea. Aporta una solución al problema de la enseñanza del cálculo y la verdad, más importante que los métodos es el concepto. Lo importante , considero yo, es desarrollar conceptos que den  estructura mental. Igual, sean o no matemáticos, difícilmente los estudiantes se van a encontrar en su vida con una integral por partes que después deba solucionarse con identidades trigonométricas y después con sustitución. Insisto, lo importante es el concepto y después de explicarlo, sus aplicaciones en probabilidad y estadística harán más sencillo entender su uso.

Ahora, note la diferencia entre la postura de Benjamin y la columna de Klaus Ziegler la semana pasada en El Espectador: Ziegler, palabras más palabras menos, se considera de una élite intelectualmente privilegiada que consiguió entender bien el cálculo cuando lo vio en la universidad (no lo dice pero a toda hora parece darlo a entender en su columna). Su única sugerencia es usar recursos computacionales para explicar ciertas cosas (cosa buena pero no suficiente) y dejar los «aspectos más abstractos y complejos [para] ofrecerse solo en cursos exclusivos destinados específicamente a los estudiantes más talentosos». ¡Hagáme el favor la exclusión!

Respecto a eso, me gustaría recordarle al lector una antigua entrada que escribí en este mismo blog llamada Más nalga que cerebro. Por mi experiencia, pero sobre todo por estudios realizados (como este y este), sé que lo importante no es la genialidad sino la dedicación. Es más, el mismísimo Terry Tao, con toda su innegable genialidad, así lo sostiene (véanse esta, esta, esta y esta entradas de su blog, por ejemplo). Tao no es solo su genialidad, de hecho él es grande por su disciplina. Es impresionante seguir su blog y ver que, con sus colaboradores, publica a veces más de un artículo por semana. El solo hecho de sentarse a escribir esos papers muestra el talante de su dedicación (yo llevo casi dos meses intentando completar dos artículos de mi tesis y no he terminado ni siquiera el primero). Citaba en esa entrada también los casos de Newton y Einstein, quienes se hicieron grandes no por su genialidad sino por su dedicación. No es cuestión de talento, es cuestión de disciplina, señor Ziegler, debiera ser menos soberbio.

Por último, volviendo a las habilidades matemágicas de Benjamin, quisiera anotar que los colombianos tenemos a un matemático mucho más rápido que él, Jaime García, quien es reconocido como el calculista más rápido del mundo y tiene varios records Guinness. Hace poco tiempo, cuando García volvió a aparecer en los periódicos del país, se desató alguna controversia maluca entre varios de mis contactos de facebook. Estaban ellos ofendidos porque se le llamara matemático por hacer cálculos mentales. Consideraban que no lo era puesto que no desarrollaba matemáticas nuevas. Lo segundo es eminentemente falso: él desarrolla efectivísimos algoritmos (¡crea matemáticas!) que le ayudan a almacenar datos en su mente más rápido que una computadora. Pero aun si no lo fuera, ¿está la matemática restringida a la investigación? La respuesta, claro, es un rotundísimo NO. ¡Gran matemático es García! Ya quisiera yo tener sus habilidades.

15/09/2009 Publicado por Daniel Andrés Díaz Pachón | Uncategorized | | 1 comentario

Inscripciones al posgrado en probabilidad y estadística del IME-USP

A continuación publico el siguiente correo (en portugués) que envió internamente el profesor Fabio Machado, probabilista del IME y coordinador del posgrado en estadística del Instituto:

Caríssimos(as),

Estão abertas as inscrições para o Mestrado e Doutorado em Estatística e Probabilidade no Instituto de Matemática e Estatística da USP na cidade de São Paulo. Este programa de pós-graduação está avaliado com nota máxima (nota 7) pela CAPES, fazendo parte do sistema de financiamento do CAPES-PROEX.

No momento estamos em condições de aceitar 12 alunos de doutorado e 25 alunos de mestrado, para os quais ofereceremos pelo menos 20 bolsas de estudos.

Candidatos ao mestrado devem inscrever-se ate 15 de setembro, enquanto que candidatos para o doutorado devem fazer suas inscrições ate 15 de novembro de 2009.

As decisões sobre aceitação/bolsa para o doutorado são tomadas já no mes de dezembro de 2009. As de mestrado serão em função do exame de admissão aplicado no inicio do mes de fevereiro de 2010.

Em 2009 foram defendidas 29 dissertações de mestrado e 21 teses de doutorado. A lista encontra-se no link apresentado abaixo.

Garantimos uma estrutura curricular ampla, com disciplinas de teoria de Probabilidade e Estatística e um conjunto de disciplinas específicas (teóricas e aplicadas) que abrangem áreas relacionadas as linhas de pesquisa desenvolvidas pelo corpo de pesquisadores do departamento. São oferecidas cerca de 12 disciplinas por semestre além de 2 disciplinas no Programa de Verão. Parte fundamental na preparação para os novos desafios, nossa pós-graduação conta com uma programação intensa de conferências e seminários organizados pelos grupos de pesquisa do Departamento de Estatística.

As agências de financiamento à pesquisa —Fapesp, Capes e CNPq— normalmente cobrem a demanda de bolsas por estudantes com ótimo desempenho que ingressam a cada ano. É crescente o número de estudantes de pós-graduação que fazem estágio em excelentes universidades do exterior.

Mais informações podem ser obtidas no endereço

http://www.ime.usp.br/posgraduacao.php/

Atenciosamente

Prof. Dr. Fábio Machado
Coordenador do programa de pós-graduação em Estatística
Departamento de Estatística – USP

Muy interesante. Muchas becas (bolsas) para un programa de excelente calidad.

18/08/2009 Publicado por Daniel Andrés Díaz Pachón | Uncategorized | | Aún no hay comentarios

Imre Csiszár y sus notas en teoría de información

Imre Csiszár tiene un tutorial excelente de teoría de información en el enlace proporcionado. Vale la pena estudiarlo, Csiszár es uno de los especialistas más reconocidos del mundo en el área.

15/08/2009 Publicado por Daniel Andrés Díaz Pachón | Matemáticas | | Aún no hay comentarios

De falsos positivos y errores de tipo I

En Colombia están tristemente de moda los llamados falsos positivos por los hechos de todos conocidos: la fuerza pública acribilla inocentes (usualmente del campesinado o las clases bajas) para hacerlos pasar por guerrilleros muertos en combate. Dada la repercusión que esta triste noticia ha tenido en el país, se me ocurrió usarla para explicar parte del razonamiento estadística moderno mezclado con algo de realidad interna en Colombia (esta entrada podría pertenecer por igual a mis dos blogs).

La idea detrás del nombre dado a ese horror político es la siguiente: La fuerza pública tiene dos opciones cuando se encuentra con una persona: la cataloga inocente o la cataloga como delincuente (guerrillero en el caso que nos ocupa). Más aun, por el principio de la presunción de inocencia se asume inicialmente que la persona es un ciudadano inocente, un ciudadano de bien. La otra hipótesis es que el personaje en custión es un guerrillero.

La estadística funciona bajo el mismo razonamiento. Se toma una hipótesis que parece la natural de base y se le llama por esa razón hipótesis nula; en el ejemplo, la inocencia del ciudadano. La otra opción, la hipótesis alternativa, es la opuesta; en el ejemplo, lo opuesto a ser un ciudadano de bien es ser un delicuente (guerrillero en el caso que nos ocupa). Las hipótesis nula y alternativa usualmente se notan H_0 y H_1, respectivamente.

Entonces hay cuatro posibilidades a la hora de inferir, dos correctas y dos incorrectas: Las dos correctas son 1) no rechazar la hipótesis nula cuando ella es cierta y 2) rechazar la hipótesis nula (aceptando la alternativa) cuando ella es falsa. Las dos posibilidades inferenciales erradas son: 1) rechazar la hipótesis nula cuando ella es cierta y 2) No rechazar la hipótesis nula cuando ella es falsa. En estadística la primera posibilidad errada se llama usualmente error de tipo I, y la segunda posibilidad errada se llama error de tipo II. En contextos más generales al error de tipo I se le llama falso positivo y al error de tipo II se le llama falso negativo.

La anterior explicación nos lleva de vuelta a nuestro ejemplo. Empecemos por el falso negativo: suponga que el militar está ante un guerrillero y lo deja libre creyendo que es inocente, entonces ahí incurrió en un falso negativo o un error de tipo II. Volviendo a la parte tristemente célebre: si la persona es inocente entonces H_0 es verdadera, luego inferir que es guerrillero es un falso positivo o un error de tipo I.

La situación con los horrores cometidos por el ejército colombiano entonces es completamente diferente a los falsos positivos. No se le puede llamar así a la barbarie que ellos perpetraron (y quiero pensar que es pasado) cuando mataron, por ejemplo, a los once jóvenes de Soacha (un pueblo pobre en el centro de Colombia) para hacerlos pasar por guerrilleros en Norte de Santander (un departamento al nororiente del país).

La razón por la cual es un despropósito llamar falsos positivos a las atrocidades del ejército de Colombia con los civiles es doble. La primera y más importante porque intenta esconder con argumentos pseudo-eruditos una rampante violación masiva de los derechos humanos, pasándole por encima a lo que hubiera podido quedar de dignidad de las víctimas y de sus familiares.

La otra razón más concerniente con los argumentos lógicos que se pretenden en este blog es la siguiente: el falso positivo se da cuando se infiere la realidad de manera errada. Pero quí el ejército (y quién sabe si algunos del gobierno), en vez de cometer un falso positivo lo que cometieron fueron asesinatos e intentaron inducir un falso positivo en la población colombiana: hacerles creer a los colombianos que los jóvenes de Soacha eran guerrilleros cuando no lo eran.

No, NO, ¡NO! No hay falso positivo del ejército: los jóvenes eran inocentes y el ejército lo sabía, no hay error en su inferencia (no rechazaron la hipótesis nula cuando era cierta). Por eso es vil homicido. Sin adornos. El falso positivo ocurriría cuando el ejército vendiera su versión a la opinión pública de que esos jóvenes eran guerrilleros y la versión pública comprara esa versión. Por eso, calificar los actos del ejército como falsos positivos es como decir que en Colombia no hay desplazados por la violencia sino solo migración interna… ¿le suena?

Empecé a hacer esta entrada ya hace un par de meses pero la tenía parada porque estaba dedicado a la sustentación de mi tesis. Pero la indignación es igualmente vigente cuando hoy termino estas líneas. Es increíble que se quiera cambiar el nombre de las cosas, que se quiera engañar, que se busque minimizar con una palabra. No hubo falso positivo del ejército, ellos sabían que esos jóvenes no eran guerrilleros. Si ellos sabían, lo que cometieron fue una aberración gigante que está completamente por fuera del análisis lógico en el que se pretende enmarcar. Una aberración que merece ser castigada como lo que es y con las más altas penas.

09/08/2009 Publicado por Daniel Andrés Díaz Pachón | Estadística | , | 2 comentarios

Las conferencias de Richard Feynman

He estado ocupadísimo con el final de mi doctorado: sustento mi tesis el próximo jueves. Seguro después de ese momento será más fácil escribir entradas con mayor regularidad y frecuencia. Pero por ahora me gustaría dejar aquí el enlace a las conferencias de Richard Feynman (foto). Son tan buenas que Bill Gates compró los derechos y las tiene disponibles en Internet para quien quiera verlas aquí. Disfrútenlas porque de verdad valen mucho la pena. Es más, recomiendo también la lectura de sus libros, realmente es excelente.

19/07/2009 Publicado por Daniel Andrés Díaz Pachón | Uncategorized | | Aún no hay comentarios

Las matemáticas de Portafolio

Yo no sé si pensar que el periódico de finanzas más importante de Colombia no sabe calcular un porcentaje (un error de buena fe) o, peor aun, que se equivoca de mala fe para engañar incautos y no dejar tan mal a la banca. La noticia tiene que ver con los horrorosos incrementos en los cobros de los servicios por uso de tarjetas crédito y débito en Colombia.

Alguien podría decirme que es un simple error de digitación o un pequeño error de cálculo, a todos nos ocurren. Pero no. Fueron muchos errores semejantes en el mismo artículo, lo cual conduce a descartar de plano el error de digitación. Véamoslos:

1. «Occidente subió 15 por ciento la tarifa para la reposición por deterioro de una tarjeta de crédito: de 8500 pesos pasó a 10000».

Entonces el incremento fue de 1500, pero 1500 / 8500 es un poco más de 0,1764. Luego el incremento es 17,64 %, no 15 % como dice la noticia.

2. «Por el mismo concepto, Colpatria pasó de 2700 pesos a cobrar 11480 pesos, un incremento de 76 por ciento».

Entonces el incremento es de 11480 – 2700 = 8780, luego el incremento es de 8780. Como 8780 / 2700 es un poco más que 3,25, el incremento fue 325 %. ¡Qué robo! Muchísimo más que el tal 76% declarado por el periódico que, de cualquier forma, ya es descarado.

3. «Un avance en efectivo por cajero en Bancolombia costaba hace ocho meses 3500 pesos, ahora vale 5000, un aumento de 30 por ciento».

Otra vez: el incremento fue de 1500. Como 1500 / 3500 = 0,428, el incremento es 42,8%… casi 50% más que lo declarado por Portafolio.

4. «Colpatria que debitaba 3200 pesos por un avance en cajeros de su propia red, ahora cobra 5000 pesos, 36 por ciento más».

Aquí el incremento es de 1800. Es decir, el incremento es 56,25%, no 36% como reza el artículo.

5. «De los más dramáticos por ese concepto está el aumento de la cuota de manejo de tarjeta débito de Citibank, cuyo valor estaba en 7000 pesos y pasó a ser de 16000 pesos; subió 56,25 por ciento».

Como 16000 – 7000 = 9000 y 9000 / 7000 es aproximadamente 1,285 el aumento corresponde al 128,5% más del doble de lo que enuncia el artículo y, otra vez, un completo robo.

En medio de los dos males, yo hasta preferiría pensar que fue un error de ignorancia y no de mala fe para proteger a los bancos si no fuera porque coincidencialmente, en el mismo artículo, a la hora de hablar de los descuentos que hizo uno de los bancos sí fueron más generosos. Dice la noticia:

«También bajó la reposición por pérdida de la tarjeta de crédito en el Banco Caja Social, cuyo costo el año pasado era de 17632 pesos y ahora es de 15080 pesos, es decir, 17 por ciento menos».

La cosa ahí es que 17 632 – 15 080 = 2 552, que es un poco menos del 14.5% de los 17 632 originales, no el supuesta 17% que pregona el periódico. Los bancos son un mal necesario y es obvio que algo deben ganar, pero es que como dice un tío mío: ¡Todo pa’dentro no se puede, hola!

07/06/2009 Publicado por Daniel Andrés Díaz Pachón | Matemáticas suaves | | 2 comentarios

Convocatoria al premio Aranda Ordaz

Hoy me llegó esta Convocatoria por el correo interno de la Universidad, quiero hacerla pública aquí:

PREMIO FRANCISCO ARANDA ORDAZ

La Sociedad Latino Americana de Probabilidad y Estadística Matemática promueve cada tres años el certamen de tesis de Doctorado Francisco Aranda-Ordaz, creado para honrar la memoria de un distinguido y joven colega mexicano, fallecido trágicamente en 1991.

De acuerdo al Reglamento para otorgar el Premio Francisco Aranda Ordaz, hacemos una cordial invitación a todos los interesados en participar, para que envíen sus tesis doctorales.

Pueden participar en él las tesis doctorales en Probabilidad o Estadística realizadas por estudiantes originarios de América Latina, sin tomar en cuenta la nacionalidad de la Universidad que haya expedido el título doctoral o estudiantes de cualquier nacionalidad con título en una universidad latinoamericana. A título de ejemplo, pueden tanto postular un latinoamericano doctorado en Europa como un europeo doctorado en América Latina.

La próxima versión del certamen incluirá las tesis defendidas a partir de Diciembre de 2006 hasta el 10 de mayo de 2009.

Deberán enviar para la evaluación:

· una copia de la tesis por correo electrónico.

· Copia del Acta de Presentación del Examen a partir del 1º. de diciembre de 2006 al 10 de mayo de 2009.

· Carta del asesor de la tesis en que está de acuerdo que se someta a concurso la tesis.

Las lenguas oficiales del certamen son: español, portugués, inglés y francés. Pueden considerarse excepcionalmente tesis redactadas en otras lenguas.

El Jurado designará la mejor tesis en Probabilidad y la mejor tesis en Estadística, y los dos colegas distinguidos presentarán una conferencia especial invitada en el XI CLAPEM (Congreso Latino Americano de Probabilidad y Estadística Matemática).

Los trabajos deben ser enviados por vía electrónica a José R. León R. Presidente del comité de la SLAPEM.

La fecha tope para la recepción de trabajos es el 30-06-2009.

Emails:

jose.leon@ciens.ucv.ve

chichileon_3@hotmail.com

22/05/2009 Publicado por Daniel Andrés Díaz Pachón | Estadística, Matemáticas | | Aún no hay comentarios