White Paper: Algunos datos estadísticos sobre el spam

Os he preparado un white paper con algunos datos estadísticos sobre el spam. Copio y pego el abstract:

spam

Cuando se hace seguimiento y análisis del correo basura, suelen aparecer algunos datos colaterales, que habitualmente no son consignados en los documentos de investigación que se generan a raíz de los experimentos. El objetivo de este artículo es dar a conocer algunas de estas cifras reales, pero no citadas, sobre el spam. Los datos que contiene este documento derivan de analizar más de 10.000 mensajes de correo basura, y en su gran mayoría, son cifras poco significativas. En ningn caso deben tomarse estas cifras como definitivas, ni extensibles a cualquier receptor de correo. Son, simple y llanamente, mis cifras de spam, que quiero compartir con los interesados. Bajo ninguna circunstancia, pese a la apariencia de, se trata de un documento de investigación profunda sobre tendencias o características avanzadas sobre el correo no deseado. Este texto debe tomarse nicamente como una recopilación de datos de carácter anecdótico.

Un PDF pequeñito, de sólo 7 páginas, en el que, tras analizar más de 10.000 mensajes de spam, se plasman los resultados estadísticos que emanan en cuanto a datos generales, tamaños, número de remitentes, origen, agentes de usuario, franjas horarias … y otros datos curiosos sobre estos mensajes de correo no deseados :)

Descarga: Algunos datos estadísticos sobre el spam

Autor: Sergio Hernando

Sergio Hernando es una persona interesada en las tecnologías de la información, haciendo de éstas su campo laboral principal. Estos articulos fueron publicados desde 2004 hasta 2012.

7 opiniones en “White Paper: Algunos datos estadísticos sobre el spam”

  1. Habrá que considerar, además, la información que alguna de tus exnovias pueda haber dado respecto a tus dimensiones, rendimiento, etc… :-P

    Bromas aparte, Sergio, yo creo que como curiosidad este documento vale pero como estudio o estadística no. El spam que tú recibes estará fuertemente influenciado por tus hábitos, al igual que las estadísticas que recibe tu web no son representativos del tráfico de internet… Seguro que si yo hiciera algo similar a la vuelta de mis vacaciones el resultado sería diametralmente opuesto. (No creo, además, que mis exnovias tengan las mismas quejas que las tuyas… :-P)

    Además, cualquiera de nosotros ha observado otra cosa: la gran volubilidad que tiene el spam. De repente durante unos días te invaden los mensajes de Rolex falsos para que luego esos mensajes desaparezcan por completo para ser sustituidos por otra serie totalmente distinta… no se, se me antoja algo… demasiado complejo. Qué tontería: no se me antoja, lo es, sino Bill Gates habría acertado y ya habría desaparecido ;-)

  2. Y como veo, todo lo que te digo lo dejas ya aclarado en el recuadro que acompaña al post… lo siento compañero pero he saltado al documento directamente y sin previo aviso. Prometo flagelarme esta noche con uno de esos extensores que me han mandado desde Nigeria…

  3. No pasa nada hombre :)

    Son sólo eso, datos estadísticos. De todos modos, spam hay de dos tipos: genérico y segmentado.

    El segmentado es muy particular y muy orientado según el receptor y sus hábitos. El genérico tiene patrones muy similares en la gran mayoría de los casos.

    En fin, son sólo eso, algunas estadísticas curiosas. Espero te gusten :)

    Saludos,

  4. Puestos a saciar mi curiosidad me asaltan un par de preguntas:

    ¿qué ofecían los mensajes con firma PGP?
    ¿qué porcentaje de mensajes evadió los filtros de Thunderbird?

  5. Jose María,

    Los mensajes PGP eran dos. Uno era de un remitente legítimo que me reenvió una muestra y la firmó, y la otra es un mensaje erróneo, vacío, que además está firmado con una clave pública desconocida.

    Sobre el filtro propio de Thunderbird no puedo darte datos. El spam cazado en este «estudio» es spam marcado por Spamassassin, Thunderbird sólo movía los mensajes con el flag X-Spam-Flag en YES a la carpeta de correo basura. Lo que sí puedo decirte es que de esos 10000 y pico mensajes, sólo 37, bastante elaborados, huyeron de las garras del asesino y tuvieron que ser marcados manualmente. También hay 12 mensajes que fueron marcados bajo mi criterio, es decir, mensajes de comunicación comercial consentida en su día y que a día de hoy, no deseo en la bandeja de entrada :)

    Salu2 ;)

Comentarios cerrados.