Leyendo un artículo en Minid en el que comenta que Mozilla incorpora un Filtro Bayesiano para filtrar el spam he recordado la impresionante labor de Thomas Bayes. Un matemático inglés que vivió desde 1702 hasta 1761, y desarrollo los fundamentos de la teoría probabilística a la cual hoy en día se le siguen obteniendo nuevas utilizadades.
Thomas Bayes presentó un ensayo sobre la teoría de la probabilidad y su famoso teorema a la Royal Society que se publicó en 1764. Tuvo un gran impacto en la época y de hecho Condorcet (Otro matemático) hizo descubrimientos parecidos sin conocer los textos de Bayes.
Pero realmente cuando más utilidad práctica se le está encontrando es en nuestros días de la era de la información. Sus herramientas matemáticas las usan los físicos con su mecánica cuántica, los telecos con sus señales, control de tráfico en redes etc. Y los informáticos lo usamos cada día sin darnos cuenta, cuando usamos google están actuando Bayes, cuando usamos nuestra cámara digital también actua Bayes, cuando usamos traductores automáticos, el diccionario de nuestro teléfono móvil, los filtros para el spam de nuestro lector de correo electrónico. En tareas de investigación se usa en visión artificial, sistemas expertos, reconocimiento de lenguaje natural etc.
Básicamente para hacer un filtro de spam lo que haríamos de forma directa sería mirar ciertas palabras que aparecen en los típicos correos basura, apuntarlas, y luego mirar si en cierto mail aparece o no la palabra. Esta técnica es un poco arriesgada porque eliminaría muchos mails que no fueran spam. Gracias a la probabilidad de Bayes, podemos utilizar probabilidades condicionadas, es decir podemos tener en cuenta también el contexto de una palabra. De esta forma un filtro hecho a lo «bestia» eliminaría todos los mails que tengan la palabra «sexo», esto podría cargarse algunos mails que no fueran de spam. Con un filtro Bayesiano tendríamos en cuenta el contexto por lo que vemos las cadenas en general, por ejemplo «mucho sexo gratis». Al ver esto el filtro bayesiano ve que la probabilidad de que un mail sea de spam conteniendo la palabra «gratis» condicionado a que esté la palabra «sexo» antes es muy alta y descartará el e-mail.
Otra ventaja de los filtros Bayesianos es que se pueden implementar como algoritmos incrementales. Esto quiere decir que va «aprendiendo» de nuestros gustos, va viendo que mails eliminamos como spam y cuales no para mejorar sus decisiones futuras.
¿No es increíble que Thomas Bayes se avanzara tanto a sus tiempos? ¿Que pensaría Bayes si le dijeramos que sus descubrimientos se están utilizando para eliminar correo basura?
Un matemático inglés que vivió desde 1702 hasta 1761 … presentó un ensayo sobre la teoría de la probabilidad y su famoso teorema a la Royal Society en 1764.
¿Tambien dejó escrito como resucitar? 😉
Si bueno, lo envió a la Royal Society y no se lo publicaron hasta 1764. Es decir que su vida no fue muy gloriosa. Gracias por el aviso, ahora la cambio.
Recien encuentro tu Weblog, muy interezante todo por aka, sigue asi 😛
A mi me parece una vida gloriosa, pues consiguió avanzar en lo que se propuso, aunque la gente lo apreciara tarde, como en muchas otras ocasiones.
Thomas Bayes es uno de los mejores cientificos, su inspiracion seguro fue divina. Ojala se le hubiese tomado mas en cuenta..
hola4
You may find it interesting to check some helpful info dedicated to… Thanks!!!
Hola Interesante lo referente a la teoria de bayes y su aplicacion a nuestra realidad, deberiamos de poner mas enfasis en sus tratados.
pretendia encontrar informacion de de su teorina no una introduccion de su vida
no se mucho de el pero como todos los genios estaban enfermos mentales.