reCaptcha Captcha Google OCR dexifrar descobrir text humans

A tots, alguna vegada -i cada cop més- l’ordinador ens ha demanat que confirmem que no siguem un robot a través de captcha o reCaptcha.

Omplir correctament aquesta informació és clau pel bon funcionament d’Internet, ja la xarxa està plena de robots (programes automatitzats) que es dediquen a interactuar constantment amb tot el que estigui en xarxa, ja sigui o bé, per indexar continguts (com un cercador), o bé amb intencionalitat maliciosa (com omplir d’spam una pàgina, aconseguir arribar als servidors d’una empresa per deixar-hi algun virus, saturar una web, esbiaixar dades sobre el trànsit a la web, etc… ). La pregunta és: com ho fan els robots per reconèixer i entendre la informació que troben a Internet? Doncs, mitjançant programes de reconeixement de caràcters (OCR). Per evitar que els robots, a través de processos automatitzats, poguessin realitzar segons quines accions, es va crear als anys 2000 els captcha “Completely Automated Public Turing test to tell Computers and Humans Apart”, que en un primer moment van donar lloc a aquelles paraules deformades i allargades tan d’aquella època… La idea dels captcha es basa en la idea que va plantejar Alan Turing per poder distingir si un procés l’executa una persona o una màquina, fent preguntes que només pot respondre un humà. I un text que no té forma de text -teòricament- una màquina no l’hauria de saber interpretar.

Un pas més enllà, els reCaptchas

Per sofisticar-ho encara més, van arribar a agafar text mal escanejat o que formava part d’una fotografia poc definida o un paper tacat, etc. Qualsevol element que dificultés la feina als OCR, creant així els reCaptcha.

Als reCaptchas hi apareixen dues paraules i l’usuari ha d’escriure correctament les dues. La gràcia del programa és que el reCaptcha només en coneix una, aquesta la fa servir per reconèixer si l’usuari és un humà o un robot, i l’altra només serveix per emmagatzemar-la. Aquesta paraula emmagatzemada anirà apareixent a diversos usuaris, i si tots coincideixen en la resposta, el programa l’acabarà acceptant com a vàlida, obtenint així una paraula més traduïda.

Per què va interessar a Google el reCaptcha?

Google va adquirir fa uns anys l’empresa reCaptcha. La finalitat estratègica d’aquesta acció és més rebuscada del que aparentment sembla.

recaptcha google text reconeixement OCR

La digitalització de documents que, com hem comentat, es realitza mitjançant programes OCR, no sempre és precisa. Per aquest motiu moltes vegades es requereixen treballadors que digitalitzin manualment el contingut d’un document. La impressionant visió estratègica de Google fou: utilitzar els usuaris d’Internet que estaven omplint els reCaptcha, i que interpretaven aquests continguts confusos fossin d’alguna manera “traductors” per Google, i així ajudar-los a millorar els algoritmes de reconeixement de text dels seus OCR per nodrir el seu ambiciós projecte “Google Books” i tenir, alhora més paraules traduïdes. Actualment, i curiosament, molts dels reCaptchas que estem “resolent” són imatges de números del que semblen cases. És possible que amb els reCaptachas estiguem ajudant Google Street View i Google Maps a fer el seu mapa encara més acurat.