Een spamfilter dat moet voorkomen dat spamberichten op websites verschijnen redt oude boeken en manuscripten van de ondergang. De meeste CAPTCHA's (Completely Automated Turing Test To Tell Computers and Humans Apart) laten de gebruiker een code invoeren, iets wat voor geautomatiseerde bots lastig te doen is. Veel consumenten vinden de CAPTCHA's vervelend, omdat de codes vaak moeilijk te lezen zijn. Een onderzoeksteam uit Pittsburgh heeft nu een manier gevonden om CAPTCHA's vriendelijker voor gebruikers te maken, en de input tevens zinnig te gebruiken.
Het team houdt zich bezig met het digitaliseren van oude boeken en manuscripten, en gebruikt Optical Character Recognition (OCR) software om de gescande afbeeldingen in tekst om te zetten. De OCR software kan echter één op de tien woorden vanwege de slechte kwaliteit van het document niet lezen.
De enige betrouwbare manier om ze te decoderen is een mens ze te laten lezen, een gigantische taak, omdat er maandelijks duizenden pagina's worden verwerkt. Om dit probleem op te lossen gebruikt men de woorden die de OCR software niet kan lezen als CAPTCHA's. De reCAPTCHAs laten twee woorden zien, waarvan er één bekend is. Geeft de gebruiker de juiste omschrijving van dit woord, dan gaan de onderzoekers ervan uit dat dit ook het voor onbekende, tweede woord geldt. Om ervoor te zorgen dat mensen het systeem niet kunnen vervuilen laat men de onbekende woorden door meerdere mensen beoordelen.
Deze posting is gelocked. Reageren is niet meer mogelijk.