Copyfight revisited

Enero 25th, 2006

Solo un rápido aviso para recordar que esta semana se celebra una nueva edición del Copyfight.

Horarios:

JUEVES 26 ENERO

LITERATURA Y CULTURA ESCRITA

17:00h José Luis de Vicente18:00h José Cervera

SOFTWARE Y CULTURA DIGITAL

19:00h Marta Peirano20:00h David Casacuberta

VIERNES 27 ENERO

MUSICA Y CULTURA POPULAR

17:00h Ignacio Escolar18:00h David Bravo

19:00 Mesa Redonda con todos los participantes, moderada por Oscar Abril Ascaso.

20:00 Presentación de la instalación “Crime Scene” a cargo del artista, Mogens Jakobsen.

Más información en Elastico.

Posted in Copyfight, Nota | No Comments »

Hoja de trucos para Ruby on Rails

Enero 10th, 2006

Una pequeña nota como recordatorio de una hoja de trucos para Ruby on Rails, donde encontraremos todas esas pequeñas cosillas que podemos necesitar cuando estamos programando con RoR.

Es un PDF con 14 hojas que irá bien tener imprimidas y al lado del teclado para poder hacer consultas rápidas.

Posted in Nota, RubyOnRails | 1 Comment »

Como portar programas a GP2X (I)

Enero 7th, 2006

El portar un programa, ya sea un juego, un emulador o cualquier otro tipo a la GP2X puede ser una tarea muy sencilla o muy complicada dependiendo de que queramos portar.

En primer lugar, siempre que queramos portar algo a esta consola es necesario que dispongamos del código fuente del programa principal. Si no es así, será imposible portarlo y deberíamos hacer una adaptación, es decir, reprogramarlo de nuevo.

Una de las características deseables del código original es que utilice la libreria SDL, ya que está preinstalada en el entorno de la GP2X y por tanto será mucho más sencillo de portar. Otra característica deseable es que el programa esté pensado para ejecutarse bajo Linux, ya que este es el sistema operativo que gobierna la consola. Estas dos características no son imprescindibles, pero si que nos facilitarán mucho la vida a la hora de trabajar.

Como programa de ejemplo vamos a trabajar con Cygne-SDL, un emulador de la consola Wonderswan que funciona con la librería SDL y que resulta muy sencillo de portar.

El primer paso es instalar el entorno de compilación para la GP2X. Este procedimiento está muy bien explicado en el wiki: Getting started with GP2X development, así que no voy a repetirlo aquí. Se trata, basicamente, de instalar los programas y las librerías que nos permitirán convertir el código fuente del programa en ficheros ejecutables por nuestra consola.

Una vez instalado el entorno de compilación, lo primero que debemos hacer es comprobar que está correctamente instalado y que podemos generar ejecutables que funcionen correctamente. Uno de los más sencillos es el fichero de ejemplo de SDL que muestra una imagen en la pantalla de la consola.

Si este ejemplo nos ha funcionado correctamente, ya estamos listos para empezar a portar programas a la GP2X.

Posted in Artículo, Programación | 1 Comment »

GP2X

Diciembre 28th, 2005

No hace mucho que adquirí una GP2X, una consola portátil que funciona bajo Linux, y he estado haciendo algunas pruebas de programación con ella.

Es realmente sencilla de programar, así que me decidí a hacer un port de NeoPop, un emulador de NeoGeo Pocket a la GP2X.

Podeis encontrar más información sobre los programas que vaya haciendo para la consola en la página destinada a ella: GP2X

Posted in General | No Comments »

Como leer los datos del fichero training.dat

Diciembre 1st, 2005

Una de las ventajas de los programas de código abierto es que permiten estudiar su código, sus algoritmos y los formatos de los ficheros que utilizan. Por ello, resulta bastante sencillo hacer un pequeño programa que interprete los datos del fichero training.dat, de forma que podremos ver los valores (igual que hacíamos con el Bayes Junk Tool) o tratarlos nosotros.

Si tenemos interés en las técnicas de detección de spam, este es un fichero interesante de analizar y permite realizar fácilmente pruebas de diferentes algoritmos de detección.

Read the rest of this entry »

Posted in Spam | No Comments »

Donde guarda Thunderbird los datos del spam: training.dat

Noviembre 29th, 2005

Para que Thunderbird pueda clasificar nuestros correos en spam y ham necesita tener una lista de tokens con sus probabilidades. Esta lista está inicialmente vacia y se crea entrenando a Thunderbird, es decir, diciendole cuales de nuestros mensajes son ham y cuales son spam. Habitualmente, con repetir este proceso con el correo que recibamos en tres o cuatro días el programa ya será capaz de clasificar con un alto grado de fiabilidad.

Esta lista de palabras se guarda en nuestro directorio de profile (en mi caso “c:\Documents and Settings\madelman\Datos de programa\Thunderbird\Profiles\default.ph9″) en el fichero training.dat. Este fichero no es directamente visible ni editable, pero podemos tratarlo gracias a Bayes Junk Tool, una herramienta en Java que permite realizar modificaciones del fichero.

Read the rest of this entry »

Posted in Spam | No Comments »

Algoritmo de detección de spam en Thunderbird

Noviembre 28th, 2005

En la nota anterior A plan for spam explicaba el algoritmo genérico que propuso Paul Graham para la detección de spam y comentaba que el de Thunderbird es una implementación ligeramente modificada de este. Veamos entonces como funciona.

El algoritmo está implementado en el fichero mozilla\mailnews\extensions\bayesian-spam-filter\src\nsBayesianFilter.cpp concretamente en la función classifyMessage. Para hacerlo más sencillo de entender lo pasaré a pseudo-código y lo simplificaré. En primer lugar debemos ver cuales son las variables que utiliza:

  • mGoodCount: número de mensajes ham clasificados
  • mBadCount: número de mensajes spam clasificados
  • mGoodTokens: tabla de hash de tokens ham con el número de veces que han aparecido
  • mBadTokens: tabla de hash de tokens spam con el número de veces que han aparecido

Read the rest of this entry »

Posted in Spam | No Comments »

A plan for spam: detectar spam con filtrado bayesiano

Noviembre 27th, 2005

Hace ya bastante tiempo que se proponen soluciones para la detección del spam, pero una de las que más repercusión ha tenido ha sido la propuesta de Paul Graham A plan for Spam. En ella propone utilizar métodos estadísticos para calcular la probabilidad de que un mensaje sea spam o no.

Para poder utilizar estos métodos, en primer lugar es necesario tener un conjunto de mensajes de ejemplo, tanto de spam como de correo ordinario (que él denomina ham, jamón, en contraposición a spam, que además de correo basura también es una carne en lata). Estos mensajes deberán ser trozeados en tokens, trozos de texto, habitualmente palabras. Esta partición del texto es muy importante, ya que dependiendo de como la hagamos el algoritmo funcionará mejor o peor.

Read the rest of this entry »

Posted in Spam | No Comments »

No se podrán bajar conciertos de Grateful Dead desde archive.org

Noviembre 27th, 2005

Me entero a través de BoingBoing que los conciertos que se ofrecían gratuítamente desde archive.org de Grateful Dead no se podrán seguir bajando, gracias a que la mujer de Jerry Garcia, el líder de los Grateful Dead lo ha prohibido.

Gran movimiento, si señor, teniendo en cuenta que la fama de los Grateful Dead fue creada en gran parte porque estos permitían a sus fans hacer copias de las grabaciones de los conciertos del grupo. La comunidad que se había formado alrededor de ellos (los deadheads) eran auténticos fanáticos (en el buen sentido de la palabra) del grupo y muchos de ellos dedicaban su vida a ir a conciertos de Grateful Dead, sobreviviendo mediante la venta de artesanía en las afueras del recinto donde hiceran el concierto.

Estos fans fueron los que hicieron que la fama del grupo creciera (vale, que fueran buenos músicos también influyó) y ahora se les quita la posibilidad de poder compartir esa música, que para muchos fue su vida.

A partir de ahora, solo se podrá escuchar los conciertos grabados desde el público en modo streaming, es decir, que no se puede grabar al disco duro (imaginemos, como ejemplo, una radio), mientras que los conciertos grabados directamente desde la mesa de mezclas no se podrán descargar ni escuchar.

Particularmente, no me habría bajado ninguno de los conciertos, ya que aunque me gusta Grateful Dead, tampoco soy un gran fan, pero me molesta que se quite esa oportunidad a muchos de sus fans que, probablemente gracias a esas descargas, se comprarían también los discos originales.

¡Gracias, señora avariciosa, por hacer del mundo un sítio un poco peor mientras usted se hincha los bolsillos con la música que hizo su marido!

Gracias, Jerry, por haber permitido que la gente comparta esa parte de la cultura que eran vuestras canciones.

Posted in Copyfight | No Comments »

Ejemplos de tipos de spam

Noviembre 24th, 2005

Comentaba que ultimamente la cantidad de spam no detectado por mi lector de correo es bastante alta y está creciendo. Para saber porque se está produciendo esto, voy a analizar primero las diferencias entre los mensajes de spam que son clasificados correctamente y los que no.

Una vez tengamos ejemplos de como es cada uno de los tipos de spam, estudiaremos el algoritmo de clasificación e intentaremos ver porque estos correos no se están clasificando correctamente.

Read the rest of this entry »

Posted in Artículo, Spam | 1 Comment »

« Previous Entries Next Entries »