<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Felipe Barriga Richards &#187; OCR</title>
	<atom:link href="http://blog.felipebarriga.cl/tag/ocr/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.felipebarriga.cl</link>
	<description>Blog personal de Felipe Barriga Richards</description>
	<lastBuildDate>Sat, 17 Jul 2010 23:52:35 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
		<item>
		<title>Bypass a Captcha de Servel.cl</title>
		<link>http://blog.felipebarriga.cl/seguridad/bypass-a-captcha-de-servel-cl/</link>
		<comments>http://blog.felipebarriga.cl/seguridad/bypass-a-captcha-de-servel-cl/#comments</comments>
		<pubDate>Fri, 06 Nov 2009 21:20:27 +0000</pubDate>
		<dc:creator>fbarriga</dc:creator>
				<category><![CDATA[Privacidad]]></category>
		<category><![CDATA[Seguridad]]></category>
		<category><![CDATA[Captcha]]></category>
		<category><![CDATA[OCR]]></category>
		<category><![CDATA[Servel]]></category>

		<guid isPermaLink="false">http://blog.felipebarriga.cl/?p=114</guid>
		<description><![CDATA[Como lo habia prometido en el post anterior, he decidido compartir con ustedes mi pequeña investigacion de como vulnerar/romper/saltarse el Captcha que tiene el Servicio Electoral en su sitio web. UPDATE: Ahora el captcha consiste en solo 3 numeros&#8230; Shame on Them ! Primero que nada, tenemos que obtener la imagen del captcha. Luego la [...]]]></description>
			<content:encoded><![CDATA[<p>Como lo habia prometido en el <a href="../?p=107">post anterior</a>, he decidido compartir con ustedes mi pequeña investigacion de como vulnerar/romper/saltarse el <a href="http://es.wikipedia.org/wiki/CAPTCHA">Captcha</a> que tiene el <a href="http://www.servel.cl">Servicio Electoral</a> en su sitio web.</p>
<p><strong>UPDATE: Ahora el captcha consiste en solo 3 numeros&#8230; Shame on Them !<br />
</strong><br />
<span id="more-114"></span><br />
Primero que nada, tenemos que obtener la imagen del captcha. Luego la ‘limpiaremos’ con el <a href="http://www.imagemagick.org/">ImageMagick</a> con el siguiente comando:</p>

<div class="wp-terminal">user@computer:$ convert test1.jpeg -resize 600×280 -crop 450×120+90+75 -despeckle -despeckle -despeckle -despeckle -despeckle -edge 30 test1.jpg<br/></div>

<p>Con lo que obtenemos la siguiente conversion:</p>
<table width="100%">
<tr>
<td>
<div id="attachment_115" class="wp-caption aligncenter" style="width: 160px"><a href="http://blog.felipebarriga.cl/wp-content/uploads/2009/11/2.jpeg" rel="lightbox[114]"><img src="http://blog.felipebarriga.cl/wp-content/uploads/2009/11/2.jpeg" alt="Captcha Original" title="Captcha Original" width="150" height="70" class="size-full wp-image-115" /></a><p class="wp-caption-text">Captcha Original</p></div>
</td>
<td>
<div id="attachment_116" class="wp-caption aligncenter" style="width: 160px"><a href="http://blog.felipebarriga.cl/wp-content/uploads/2009/11/2.jpg" rel="lightbox[114]"><img src="http://blog.felipebarriga.cl/wp-content/uploads/2009/11/2-150x120.jpg" alt="Captcha Nuevo" title="Captcha Nuevo" width="150" height="120" class="size-thumbnail wp-image-116" /></a><p class="wp-caption-text">Captcha Nuevo</p></div>
</td>
</tr>
</table>
<p>Luego crearemos el directorio ‘db’ en donde estamos trabajando y entrenaremos a <a href="http://www-e.uni-magdeburg.de/jschulen/ocr/">GOCR</a> para que aprenda a reconocer las imagenes que le iremos dando con la siguiente linea:</p>

<div class="wp-terminal">user@computer:$ gocr -d 800 -C 0123456789 -m 256 -m 130 test1.jpg<br/></div>

<div id="attachment_117" class="wp-caption aligncenter" style="width: 279px"><a href="http://blog.felipebarriga.cl/wp-content/uploads/2009/11/trainning_gocr.jpg" rel="lightbox[114]"><img class="size-medium wp-image-117" title="Entrenando a GOCR" src="http://blog.felipebarriga.cl/wp-content/uploads/2009/11/trainning_gocr-269x300.jpg" alt="Entrenando a GOCR" width="269" height="300" /></a><p class="wp-caption-text">Entrenando a GOCR</p></div>
<p>[ el '#' es el caracter actual a escribir, el '0' son otros caracteres reconocidos, ',' son otras partes de la imagen que no tienen mayor importancia ]</p>
<p>La idea es repetir este proceso un buen numero de veces (10 o 20), y luego podemos probarlo con una nueva imagen:</p>

<div class="wp-terminal">user@computer:$ gocr -a 30 -d 800 -C 0123456789 -m 256 -m 2 test666.jpg<br/></div>

<p>Mas detalles pueden conseguirlo en ‘man gocr’, pero para los flojos les dejo los parametros utilizados:</p>
<ul>
<li>-a 30 &lt;= Porcentaje de incertidumbre para aceptar un caracter</li>
<li>-d 800 &lt;= Tamaño minimo de un caracter, para eliminar el ruido</li>
<li>-C 0123456789 &lt;= Caracteres a reconocer</li>
<li>-m 256 &lt;= Modo de aprendizaje</li>
<li>-m 130 &lt;= Aprender</li>
<li>-m 2 &lt;= Reconocer</li>
</ul>
<p>Obviamente todo esto no tendria sentido sin hacer un pequeño script en perl/python/php (todos empiezan con P!) para iniciar sesion, recuperar el captcha, leerlo, postearlo y obtener los datos uno a uno desde el servidor. Obviamente como a nadie le interesa que el admin del servidor sepa quienes somos, nos conectamos utilizando <a href="http://www.torproject.org/index.html.es">Tor</a>.</p>
<p><strong>Sitios de Interes:</strong></p>
<ul>
<li><a href="http://airdump.net/breaking-captcha/">http://airdump.net/breaking-captcha/</a></li>
<li><a href="http://www.sinfocol.org/2008/08/de-captchas-y-otros-demonios/">http://www.sinfocol.org/2008/08/de-captchas-y-otros-demonios/</a></li>
<li><a href="http://www.imagemagick.org/script/command-line-processing.php">http://www.imagemagick.org/script/command-line-processing.php</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://blog.felipebarriga.cl/seguridad/bypass-a-captcha-de-servel-cl/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
	</channel>
</rss>
