Como lo habia prometido en el post anterior, he decidido compartir con ustedes mi pequeña investigacion de como vulnerar/romper/saltarse el Captcha que tiene el Servicio Electoral en su sitio web.

UPDATE: Ahora el captcha consiste en solo 3 numeros… Shame on Them !


Primero que nada, tenemos que obtener la imagen del captcha. Luego la ‘limpiaremos’ con el ImageMagick con el siguiente comando:

user@computer:$ convert test1.jpeg -resize 600×280 -crop 450×120+90+75 -despeckle -despeckle -despeckle -despeckle -despeckle -edge 30 test1.jpg

Con lo que obtenemos la siguiente conversion:

Captcha Original

Captcha Original

Captcha Nuevo

Captcha Nuevo

Luego crearemos el directorio ‘db’ en donde estamos trabajando y entrenaremos a GOCR para que aprenda a reconocer las imagenes que le iremos dando con la siguiente linea:

user@computer:$ gocr -d 800 -C 0123456789 -m 256 -m 130 test1.jpg
Entrenando a GOCR

Entrenando a GOCR

[ el '#' es el caracter actual a escribir, el '0' son otros caracteres reconocidos, ',' son otras partes de la imagen que no tienen mayor importancia ]

La idea es repetir este proceso un buen numero de veces (10 o 20), y luego podemos probarlo con una nueva imagen:

user@computer:$ gocr -a 30 -d 800 -C 0123456789 -m 256 -m 2 test666.jpg

Mas detalles pueden conseguirlo en ‘man gocr’, pero para los flojos les dejo los parametros utilizados:

  • -a 30 <= Porcentaje de incertidumbre para aceptar un caracter
  • -d 800 <= Tamaño minimo de un caracter, para eliminar el ruido
  • -C 0123456789 <= Caracteres a reconocer
  • -m 256 <= Modo de aprendizaje
  • -m 130 <= Aprender
  • -m 2 <= Reconocer

Obviamente todo esto no tendria sentido sin hacer un pequeño script en perl/python/php (todos empiezan con P!) para iniciar sesion, recuperar el captcha, leerlo, postearlo y obtener los datos uno a uno desde el servidor. Obviamente como a nadie le interesa que el admin del servidor sepa quienes somos, nos conectamos utilizando Tor.

Sitios de Interes: