Donde guarda Thunderbird los datos del spam: training.dat
Noviembre 29th, 2005Para que Thunderbird pueda clasificar nuestros correos en spam y ham necesita tener una lista de tokens con sus probabilidades. Esta lista está inicialmente vacia y se crea entrenando a Thunderbird, es decir, diciendole cuales de nuestros mensajes son ham y cuales son spam. Habitualmente, con repetir este proceso con el correo que recibamos en tres o cuatro dÃas el programa ya será capaz de clasificar con un alto grado de fiabilidad.
Esta lista de palabras se guarda en nuestro directorio de profile (en mi caso “c:\Documents and Settings\madelman\Datos de programa\Thunderbird\Profiles\default.ph9″) en el fichero training.dat. Este fichero no es directamente visible ni editable, pero podemos tratarlo gracias a Bayes Junk Tool, una herramienta en Java que permite realizar modificaciones del fichero.
Posted in Spam | No Comments »