venerdì 11 gennaio 2013

Tutte le vie del captcha (Aggiornato)

I captcha sono quelle scritte colorate o distorte spesso su sfondi confusi che è necessario ricopiare in una casella di testo per poter inviare messaggi, registrarsi a siti web, scaricare file e tanto altro ancora. 
Lo scopo di queste strane scritte, a cui tutti ormai siamo abituati, è quello di assicurarsi che ad effettuare le operazioni su un sito web sia realmente un essere umano e non qualche programma automatico malevolo il cui scopo è causare problemi o creare confusione.

Se inizialmente questi sistemi hanno funzionato in molti si sono messi subito all'opera per riuscire a scardinarli.

Un reCaptcha, a parola di controllo è riconoscibile
Il sistema più famoso ed utilizzato è senza dubbio ReCaptcha il sistema libero e gratuito offerto da Google che ha anche una seconda finalità. Questo sistema infatti visualizza due parole, ma solo una delle due è la parola di controllo, l'altra è una parola che arriva dal progetto di digitalizzazione dei libri Google Book e che non è stato possibile riconoscerla in automatico dall'OCR. Così facendo oltre a difendere il proprio sito si aiuta a portare in formato digitale una quantità di libri che esistono solo in formato cartaceo e che con il tempo potrebbero andare persi.

Ultimamente il sistema ReCaptcha sembra venga applicato anche alle immagini raccolte da Google Street View. Non è infrequente trovarsi a dover decifrare pezzi di foto in cui sono visualizzati dei numeri che ricordano dei numeri civici.


Come detto in molti si son dati da fare per trovare il modo di sorpassare questi controlli ed i servizi di captcha si son dovuti adeguare per renderli sempre più sicuri. Rendere più difficile la lettura di una scritta da parte di un programma ha però aumentato i problemi di lettura anche per le persone e così spesso risulta complicato passare questi controlli. In molti hanno aggiunto anche il captcha sonoro che tra fruscii e disturbi vari pronuncia lettere e numeri che devono essere riportati nella casella di testo per poter proseguire.

Il susseguirsi di miglioramenti da un lato e dall'altro ha portato allo stato attuale in cui la maggior parte dei captcha testuali è risolvibile in modo automatico e si stanno quindi pensando a delle alternative.

Captcha basati su domande ti tipo grafico.
Ad esempio vengono presentate diverse forme geometriche e viene chiesto di cliccare su una di queste  oppure come nell'immagine sono presenti vari cerchi e viene chiesto di cliccare su quello aperto






Captcha basati su domande matematiche espresse in forma testuale.
Viene presentato un calcolo matematico scritto a parole in modo che un programma automatico non sia in grado di capire cosa viene richiesto


Captcha basati sul riconoscimento di immagini.
Viene mostrata un'immagine e viene chiesto che cos'è rappresentato, o come in questo caso vengono visualizzati diversi oggetti e si chiede di sceglierne uno in base ad una domanda posta in linguaggio naturale.

Quale degli oggetti visualizzati non è un animale?






Captcha basati su domande generiche.
Vengono poste semplici domande di cultura generale del tipo: "Qual'è la capitale della Spagna?", "Quale degli oggetti nell'elenco è il più grande?", "Quale di questi è più freddo?"

Le domande possono essere sia a risposta multipla che a risposta aperta ed essere poste sia in formato testuale che attraverso un'immagine come nell'esempio a lato.






Captcha basati sulla pubblicità.
Oggi un particolare tipo di captcha ha attirato la mia attenzione. Nel classico riquadro mi è stato proposto il logo della Acura (una marca di automobili) e mi è stato chiesto di inserire una qualunque parola che descrivesse la marca, in questo caso ho scritto car ed ha funzionato.

Le cose che mi hanno incuriosito sono state due, la prima è stata la difficoltà intrinseca di un captcha di questo tipo in quanto è necessario riconoscere il logo, sapere che è della Acura (che non è tra le marche più conosciute), sapere di cosa tratta questa marca e trovare una parola relativa al marchio (ho scritto car, ma se avessi scritto wheel o engine o turbo?).
La seconda è stata la presenza di un marchio commerciale all'interno di un captcha.

Ho quindi deciso di approfondire e sono andato a visitare il sito del fornitore del servizio scoprendo che hanno inventato un ingegnoso sistema in grado di unire la pubblicità ed i captcha.

In pratica offrono ai siti web un sistema di captcha gratuito e ad elevata complessità, ma basando le domande su campagne di marketing.

Così viene visualizzato un banner pubblicitario e per proseguire dovremo ricopiare lo slogan o rispondere a delle domande riguardo l'azienda in questione.





 
O ancora durante la risoluzione del captcha da parte dell'utente viene riprodotto un video pubblicitario e magari con la risposta proprio all'interno del video. 






Non so se si tratta della rivoluzione dei captcha, ma di sicuro è una piccola rivoluzione delle pubblicità perché non avremo più a che fare con dei riquadri in mezzo alla pagina che facilmente ignorabili o eliminabili con appositi strumenti. In questo modo pubblicità sarà il centro della nostra attenzione in quanto conterrà la chiave per poter proseguire con ciò che vogliamo fare.

Aggiornamento 17/07/2013

Girovagando come al solito su Internet mi sono imbattuto in alcune divertenti prese in giro del classico captcha.

CRAPCHA: Nonostante la ricercata assonanza con la parola inglese "crap" si tratta di una sigla che sta per "Completely Ridiculous And Phony Captcha that Hassles for Amusement". Sfruttando una grafica simile a ReCaptch, propone simboli, disegni e lettere assolutamente impossibili da risolvere eliminando così qualunque possibilità di riconoscere gli umani dai software. (A lato la demo funzionante)

AntiCaptcha: Si basa sulla semplice considerazione che solo un bot potrebbe essere così stupido da inserire tutti questi caratteri quando gli viene chiesto di farlo.





Il captcha definitivo: Un captcha che prende in giro i vari metodi decisamente noiosi e complicati utilizzati da siti tipo Rapidshare per invogliare gli utenti a pagare per il servizio. Il quesito è formulato in maniera semplice, ma la risposta potrebbe non esserlo: "Non sei un utente premium? Per favore risolva l'ipotesi di Riemann per poter scaricare il file"

Nessun commento:

Posta un commento