terça-feira, 18 de setembro de 2007

reCAPTCHA, enfim.

Eu (e todo humano que se preza) sempre odiei o tal Captcha. Principalmente pelo fato de a maioria dos captchas serem absolutamente ilegíveis (pra quem não sabe, captcha é aquele trequinho cheio de numeros e letras que a pessoa tem q digitar pra acessar algum formulario ou enviar coisas pela internet).

Mas tem um projeto que é bem interessante: o reCaptcha. Ele funciona da seguinte maneira: Os criadores do projeto estão ajudando a digitalizar um monte de livros, pro Internet Archive. O problema é que os OCR's dos scanners não são perfeitos. Daí eles tiveram a seguinte idéia: colocar duas palavras no captcha.

A primeira é uma palavra que o scanner conseguiu reconhecer, e a segunda é uma palavra estranha ou desconhecida (em 90% das vezes, mal reconhecida pelo scanner). Daí pedem pro usuário digitar as duas. Se ele digitou a primeira corretamente, são grandes as chances de a segunda também estar certa. Então eles descobrem qual é a palavra estranha e adicionam ela à digitalização do livro.

Legal né?

Aqui tá o site do reCaptcha, pra darem uma olhada: reCaptcha

Té mais o/

Nenhum comentário: