Ir al contenido principal

Si aún no sabes cómo funcionan los captcha, puede que te sorprenda saber que buena parte de ellos están basados en el trabajo gratis.

cómo funcionan los captcha
cómo funcionan los captcha

El problema de los bots en Internet es casi tan viejo como la propia red; de manera ideal, todos los usuarios que nos encontramos en Internet deberían ser personas reales, pero lamentablemente una buena cantidad de ellos son bots, programados para todo tipo de tareas como publicar spam.
Cualquiera que tenga o haya tenido una página web alguna vez, ha sufrido un problema de bots. En Omicrono también lo sufrimos, aunque al menos ya existen tecnologías lo suficientemente avanzadas como para bloquear el acceso a estos usuarios falsos. Durante muchos años, una de estas tecnologías fueron los captchas.

En busca de la solución contra los bots spammers

CAPTCHA viene de “Completely Automated Public Turing test to tell Computers and Humans Apart”, “Test de Turing complétamente automatizado para distinguir entre ordenadores y humanos”. El nombre lo dice todo, ¿verdad?
Fue creado a principios de los 2000 por el equipo dirigido por Luis von Ahn, cuando el problema de los bots empezó a resultar más evidente. El concepto básico de los Captcha es modificar una imagen con palabras, letras o números de tal manera que un programa OCR (de reconocimiento de caracteres) no sea capaz de distinguirlos, pero sí una persona normal.
captcha 2
captcha 2
Así empezó una loca carrera entre los spammers y la industria por ver quién terminaba encima. Captcha no era un sistema perfecto, claro, como se demostró cuando los spammers empezaron a contratar a cientos de personas por cantidades irrisorias, principalmente en China, únicamente para resolver Captchas uno detrás de otro.
Pero funcionaba lo suficientemente bien como para dejar fuera a muchos bots, al menos. Pero a von Ahn no se le escapó la ironía de que tantísimas personas estuviesen descifrando palabras que no tenían ningún significado ni propósito, y se propuso arreglar esto.

Cómo funcionan los captcha

Así nació reCAPTCHA, un nuevo proyecto basado en la misma idea, pero con una base diferente. En vez de aplicar filtros y estirar las letras dispuestas aleatoriamente, reCAPTCHA obtenía las palabras de una enorme base de datos de páginas escaneadas con algún tipo de problema, como por ejemplo, fallos de impresión, palabras impresas hace tanto tiempo que habían perdido la tinta, palabras escritas en papel roto o mojado, o palabras raras que no estaban en ninguna base de datos.
Los programas OCR lo pasan muy mal en todos esos casos, pero los seres humanos podemos distinguir las palabras con un poco de esfuerzo y con algo de contexto, así que el plan era hacer que los propios usuarios resolviesen estos problemas y así completar el escaneo del libro, periódico o panfleto.
captcha 4
captcha 4
Si te fijas, reCAPTCHA siempre muestra dos palabras, una de las dos tiene un significado conocido en la base de datos, y la otra no ha podido ser reconocida por el software OCR. Cuando rellenamos un reCAPTCHA, en realidad el sistema sólo comprueba que hemos escrito bien una palabra, la que sabe cuál es.
En el caso de la palabra desconocida, guarda lo que hemos escrito, y una vez que suficiente gente ha escrito lo mismo, guarda el nuevo significado en la base de datos. Por lo tanto, en la práctica sólo tenemos que escribir una de las dos palabras que vemos para pasar el test, pero para eso tendríamos que saber cuál de las dos es la palabra desconocida para el sistema (aunque en algunos casos es fácil de ver).

Trabajo gratis por Internet

¿Qué idea más loca, emplear a los propios usuarios para que hagan tu trabajo de manera gratuita, verdad? Pues curiosamente hubo mucha gente interesada en la tecnología, empezando por el periódico The New York Times, con su base de datos de periódicos viejos que no era capaz de consultar porque los ordenadores no eran capaces de leerlos.
captcha 3
captcha 3
Poco después el proyecto reCAPTCHA llamó la atención de Google, y el resto es historia. El gigante de Internet tenía gigantesca tarea por delante, escanear y digitalizar todos los libros que existen para el mayor catálogo online de la red, Google Books.
La compañía se había encontrado con el mismo problema, tenía acceso a una gran cantidad de material pero no tenía manera de descifrar automáticamente los papeles doblados, las tintas desaparecidas y las manchas de café. Así que reCAPTCHA fue una de las compras más claras de su historia.
Así fue como toda Internet ayudó a Google a digitalizar libros, de manera gratuita, y ofreciendo un servicio contra bots al mismo momento. Eso hasta hace dos años, cuando quedó claro que los spammers habían conseguido la tecnología y la potencia necesaria para pasarse estos test sin problemas.

noCAPTCHA, ¿el captcha del futuro?

nocaptcha-1
Entonces nació noCAPTCHA, una nueva versión que ya no pide introducir palabras, sino que se basa en detalles como nuestra navegación, nuestras cookies y nuestro comportamiento; basándose en esos datos,Google puede llegar a la conclusión de que somos usuarios verídicos, y sólo tendremos que pulsar en una casilla para demostrar que no somos un bot.
Pero si Google considera que somos sospechosos, puede presentarnos un desafío; inicialmente era de palabras como las de reCAPTCHA, pero últimamente está presentando desafíos basados en encontrar objetos en una fotografía como señales de tráfico. Estos desafíos no son casualidad, teniendo en cuenta que Google está trabajando en IAs que sean capaces de analizar y encontrar objetos en fotografías.
Esa es la historia de los captchas. Un método para evitar el spam que no es perfecto ni mucho menos, pero que ha conseguido limpiar al menos un poco nuestras conversaciones.

Comentarios

Entradas populares de este blog

Mirador del Cerro del Obispado, Monterrey, Nuevo Leon

Imagen por:  https://www.flickr.com/photos/victor_hugo_lc/ En la cúspide del Cerro del Obispado en la ciudad de Monterrey, se encuentra la Bandera Monumental más grande de México.  Imagen por:  https://www.flickr.com/photos/victor_hugo_lc/ Abierto el 24 de febrero de 2005 para celebrar el día de la Bandera de México. Con un asta que pesa 120 toneladas y mide 100.6 metros de alto; una bandera que mide 50 x 28.6 metros y pesa 230 kilogramos (el doble que cualquier otra bandera monumental del país), el Mirador del Obispado es llamativo tanto para turistas como para los locales.  Imagen por:  https://www.flickr.com/photos/victor_hugo_lc/ Algunos días de importancia nacional como el Día de la Bandera, el Día de la Independencia (Septiembre 16) y el Día del Ejército y la Fuerza Aérea; son conmemorados con honores que algunas veces incluyen espectáculos de luces, juegos pirotécnicos y presentaciones artísticas como danzas regionales, musicales y conciertos....

Escucha música de YouTube y SoundCloud directamente en Chrome con esta extensión

Si siempre has deseado un reproductor de música integrado en el navegador web de tu ordenador, no te pierdas esta extensión para Chrome. Un simple Mensaje de texto puede Bloquear tu iPhone Chrome  es uno de los navegadores web más utilizados a nivel mundial, Google ha sabido posicionarlo y mejorarlo para convertirlo en una referencia. Hace unos días hablamos del sacrificio que ha supuesto mejorar su rendimiento a costa de consumir más y más recursos. Ahora, el equipo tras Chrome tiene una tarea pendiente: controlar y reducir ese consumo. Una parte de esos recursos van a parar a las queridas  extensiones . En la Chrome Web Store tenemos de todo tipo, más o menos útiles, como la que ya mencionamos  para ahorrar RAM  o la que os presentamos hoy:  SoundCloudify. Por su nombre ya os podéis hacer una idea de que tiene algo que ver con sonido. SoundCloudify es una extensión para Google Chrome que nos permite tener un  reproductor de mú...

Cámaras, radares y sensores láser: así es el coche autónomo de Uber

Durante mucho tiempo Uber ha ido adelantando sus planes de incorporar  coches autónomos  a su flota de transportes. Hoy, y sin previo aviso, nos muestra por primera vez cómo lucen, y básicamente se trata de un Ford Focus del año lleno de radares y sensores diferentes. La compañía ha estado probando su primer coche autónomo en la ciudad de Pittsburgh, en los Estados Unidos, haciéndolo circular y recolectar datos de las calles y autopistas, y en general perfeccionando su mapa de la ciudad en primer plano. Eso sí, Uber asegura que durante todo el recorrido estará presente un conductor humano para prevenir accidentes o cualquier percance durante las pruebas de este vehículo. El auto está equipado con varias cámaras de alta resolución para fotografiar todos los lugares por los que circula, además de sensores láser y un sistema de radares para determinar la posición del vehículo y cualquier obstáculo en su camino. Al igual que  Google con su coche autónomo , Uber est...