La columna del Sr. Wally: La ciencia del reconocimiento de Palabras

por Kevin Larson
traducido por Juan Jose (Wally)

Leo en Microsoft Research un paper sobre como las personas reconocen las palabras mientras estas leen...

Nota del editor:
Antes de comenzar, quisiera aclarar que esta traduccion es muy libre con respecto al paper original, no pretendo abrumarte con paginas y paginas sobre el tema, sino mas bien darte una idea del funcionamiento que tienen los humanos al leer, los diferentes modelos de reconocimiento y algun que otro dato mas. Por lo tanto te recomiendo que si podes, leas el paper original que va a estar muchisimo mas completo que este breve resumen.

Modelo 2 - Letras en Serie
Este modelo fue el que menos tiempo de vida tuvo; Fue presentado por Gough en 1972, el propuso este modelo porque era facil de entender y mucho mas comprobable que el modelo de Forma de Palabra. En esencia, reconocer una palabra en el lexico mental era analogo a mirar una palabra en el diccionario. Comenzas encontrando la primer letra, luego la segunda, y asi hasta que reconoces la palabra.

Este modelo es consistente con otras investigaciones indicando que las letras pueden ser reconocidas a una velocidad de 10-20ms por letra. Este estudio mostraba a los participantes sentencias de letras aleatorias por cortos periodos de tiempo, preguntando luego si una letra en particular se encontraba en la sentencia. Se encontro asi que si se les mostraba letras por un periodo de 10ms por letra, los participantes podian completar la tarea exitosamente. Por ejemplo, si la letra buscada se encontraba en la cuarta posicion y la sentencia se mostraba por solo 30ms, el participante no podia completar la tarea exitosamente, pero si se le presentaba por 40ms, el podia contestar correctamente. Gough noto que una velocidad de 10ms por letra era consistente con una velocidad de lectura de 300 palabras por minuto.

El modelo de reconocimiento serial por letras es capaz, tambien, de predecir exitosamente que las palabras mas cortas van a ser reconocidas mas rapidamente que las palabras mas grandes. Es un buen hallazgo saber el reconocimiento toma mas tiempo en una palabra de 5 letras que en una de 4, y que una palabra de 6 letras tarda mas en ser reconocida que una de 5 letras. Este modelo predice que esto sucedera, mientras que el modelo de Forma de Palabra no realiza tal prediccion. De hecho el modelo de Forma de Palabra indicaria que las palabras mas largas con patrones mas unicos para ser reconocidos facilmente, tarden menos que palabras mas chicas.

Este modelo falla porque no puede explicar el Efecto de Superioridad de la Palabra, este efecto muestra que los lectores pueden identificar mas facilmente letras en un contexto que por separado, mientras que el modelo serial esperaria que una letra en la tercera posicion de una palabra, tarde tres veces mas que una letra por separado.

Modelo 3 - Letras en Paralelo
El modelo mas aceptado actualmente por los psicologos es el de Reconocimiento paralelo de letras. Este modelo dice que las letras dentro de una palabra son reconocidas simultaneamente, y que la informacion de las letras se utiliza para reconocer las palabras. Esta area de investigacion es muy activa y hay muchos modelos especificos que caen dentro de esta categoria, solamente vamos a discutir una de las formulaciones.

La figura muestra una activacion generica usando el modelo de reconocimiento paralelo de letras. En este ejemplo, el lesctor esta viendo la palabra WORK. Cada una de las letras estimulo es procesada simultaneamente. El primer paso es reconocer las caracteristicas de cada letra, sus lineas horizontales, diagonales y sus curvas. El detalle de este nivel no es critico para lo que nos proponemos. Estas caracteristicas son enviadas al nivel de deteccion de letras, donde cada una de las letras son reconocidas de manera simultanea. Este nivel envia la activacion de la palabra al nivel de deteccion de palabras. La W en la primera posicion del detector envia la activacion a todas las palabras que tienen W en la primer posicion (WORD y WORK, por ejemplo). La O en la segunda posicion del detector envia activacion a todas las palabras con O en la segunda posicion (FORK, WORD y WORK). Mientras que FORK y WORD tienen activacion de tres de las cuatro letras, WORK tiene las cuatro letras activadas, y por lo tanto es la palabra reconocida.

Reconocimiento Paralelo de Letras

Mucha de la evidencia para el reconocimiento paralelo de letras viene de la literatura sobre movimientos de ojos. Se ha aprendido mucho sobre como leemos con el advenimiento de las computadores y la facilidad de realizar un seguimiento de ojos. Tenemos la habilidad de realizar cambios en el texto en tiempo real, mienstras la gente lo lee, lo cual permitio obtener mas conocimientos en el proceso de lectura que antes eran impensables.

Se sabe hace mas de 100 años que cuando leemos, nuestros ojos no se mueven suavemente a traves de la pagina, sino que hacen saltos discretos de palabra a palabra. Cuando fijamos la vista en una palabra por un periodo de tiempo, usualmente entre 200 y 250 ms, inmediatamente realizando un movimiento balistico hacia otra palabra. Estos movimientos usualmente toman entre 20 y 35ms, realizando movimientos hacia adelante de a 7 o 8 letras, pero el 15% de estos son regresivos (se realizan hacia atras). La mayoria de los lectores no se dan cuenta de la frecuencia de estos movimientos regresivos mientras leen. El posicionamiento de la mirada no es aleatorio, nunca ocurren entre palabras y usualmente ocurren justo a la izquierda de la mitad de una palabra. Tampoco todas las palabras son tomadas en cuenta, las palabras cortas y en particular las palabras funcionales son salteadas frecuentemente.

A continuacion se puede ver el diagrama de fijación de puntos de un lector típico.

Durante la fijacion, hay un limite a la cantidad de informacion que se puede reconocer. El fovea, asi llamado el centro del foco de nuestra vista, solo puede ver de tres a cuatro letras hacia la izquierda y derecha del centro de fijacion, a una distancia de lectura normal. La exactitud visual baja notablemente en la parafovea, que se extiende tan lejos como 15 o 20 letras hacia los lados del centro de fijacion.

Los estudios sobre movimiento de ojos que voy a discutir en breve, indican que hay tres zonas de identificacion visual. Los lectores recolectan informacion de todas las zonas durante el tiempo de fijacion. La zona mas cercana al punto de fijacion es donde se realiza el reconocimiento de la palabra. Esta zona es suficientemente grande como para capturar la palabra siendo fijada, y usualmente incluye las palabras de funcion, mas pequeñas, que estan directamente a la derecha del punto de fijacion.

La siguiente zona se extiende unas pocas letras mas alla de la zona de fijacion de la palabra, y en esta el lector recolecta informacion preliminar sobre las letras de la zona. La zona final se extiende hasta 15 letras mas alla del punto de fijacion. La informacion recibida a esta distancia se utiliza para identificar el largo de las palabras subsiguientes y para identificar la mejor locacion para el proximo punto de fijacion. Por ejemplo, en la figura, el punto de fijacion es la s en Roadside. El lector es capaz de reconocer la palabra Roadside, un poco de informacion de las primeras legras de joggers, asi como la informacion completa sobre el largo de joggers. Una fijacion interesante en la figura es la palabra sweat. En esta fijacion, ambas palabras sweat y pain son lo suficientemente cortas como para ser reconocidas completamente, mientras que se obtiene un poco de informacion sobre la palabra and. Como and es una palabra de funcion muy frecuente, la poca informacion obtenida mientras se fija la vista en sweat es suficiente para saltear la palabra and completamente. El largo de las palabras alcanza hasta angry, la cual se convierte en el nuevo punto de fijacion.

Links:
Documento original (en ingles) en Microsoft Research

La columna del Sr. Wally

2006/12/18

La ciencia del reconocimiento de Palabras - Parte 2