AvivaGiles: ¿Para que sirve reCaptcha?

Supongo que, tal como me sucede con mucha frecuencia, día a día se topan en Internet con cartelitos como estos, en donde hay que completar un formulario que que una web se asegure de que uno es una persona y no un script o bot programado:

Marcar la línea entre seres humanos y compus es el objetivo de los sistemas de captcha, que en la mayor parte del tiempo resultan MUY molestos. Sin embargo, gracias a este artículo de alt-tab, ahora descubrí que en algunos casos también sirven para ayudar a digitalizar textos.

El asunto es así: en reCaptcha tenemos que descifrar dos palabas, una de control y otra que el sistema no conoce. ¿De dónde salió esta última palabra? De textos escanneados con partes ilegibles por problemas de impresión o conservación de textos.

Miren, por ejemplo, esta página de un viejísimo New York Times:

Google la escanea para digitalizarla pero el OCR sólo reconoce algunas palabras:

Las que no, son enviadas a la API de reCaptcha para que los humanos que llenan formularios escriban “lo que les parece que dice”:

Cuando mil personas escriban “DOUGLAS,” (con coma), reCaptcha entenderá que es la decisión correcta y completa el scanneado.

Un lindo ejemplo de inteligencia colectiva que utiliza un poquito de esfuerzo de cada uno para lograr tener más información del pasado disponible en la web.

Comparte este post

15 comments

Agrega el Tuyo
  1. Phil 10 agosto, 2011 at 01:27

    Yo pensé que era otra cosa, porque el otro día iba distraído en el tránsito y un taxista me mandó a la recapcha de mi madre…….¿o habré entendido mal?

  2. Maxi 10 agosto, 2011 at 12:09

    En 4chan hay hace tiempo hay una campaña para poner bien la primer palabra de control y en la segunda poner simplemente nigger. Un poco racista la campaña.

  3. agustin 11 agosto, 2011 at 00:58

    o no es logico o no entendi del todo..
    nos dan palabras decifrar, teniendo solo una opcion correcta para que nos den el ok para seguir haciendo lo que queriamos hacer
    y ademas nos usan para decifrar cosas q la computadora no puede decifrar
    entonces como nos pueden corregir? si supuestamente no saben lo que dice

  4. agustin 11 agosto, 2011 at 01:01

    retiro lo dicho
    fui a la fuente y entendi
    perdon por ocupar espacio en los comentarios (?)

Post a new comment