Vuodatuksen varmistus muistaakseni ainakin joskus oli yksinkertainen numerolitania
Vuodatuksen varmistus muistaakseni ainakin joskus oli yksinkertainen numerolitania, sellaiset on nykyisin melkein yhtä helppo koneen lukea kuin ihmisen. Muitakin keinoja noiden murtamiseen on.
Google on virittänyt alkujaan skannatun tekstin oikoluvussa hyödyntämänsä reCAPTCHAn näyttämään nyt skannattujen sanojen lisäksi noita Street View’n katuosoitenumeroita. Idea on joka tapauksessa sama: näytetään kaksi tunnistettavaa kohdetta, joista toisen merkityksen Google tietää jo, toista ei. Söherö, jonka merkityksen Google jo tietää, on se varsinainen varmiste, eli vain sitä verrataan käyttäjän syötteeseen.
Käyttäjän toisesta söheröstä tekemän tulkinnan syöte lisätään vain Googlen tietokantaan sellaisenaan (yhdessä muiden käyttäjien samasta söheröstä tekemän tulkinnan kanssa sitä käytetään osoitenumeron tai skannatun tekstin kyseisen kohdan koneellisen tulkinnan apuna). Siksi varmistuksesta pääsee läpi, vaikka syöttäisikin toisen söherön kohdalle ihan mitä tahansa, kunhan se toinen on oikein, ja tämä oikein mennyt sattuu olemaan varmiste.
Järjestelmä perustuu siihen, että käyttäjä ei periaatteessa tiedä kumpi söheröistä on varmiste, ja joutuu siksi antamaan parhaan arvauksensa molemmista päästäkseen läpi. Ainakin minun näppituntumani kuitenkin on, että jos toinen söheröistä on ilmiselvästi toista hankalampi, niin se on se, jonka tilalle saa syöttää mitä hyvänsä, ja selkeämpi söherö on varmiste.