2006/12/15

La ciencia del reconocimiento de Palabras - Parte 1

por Kevin Larson
traducido por Juan José (Wally)

Leo en Microsoft Research un paper sobre como las personas reconocen las palabras mientras estas leen...


Nota del editor:
Antes de comenzar, quisiera aclarar que esta traducción es muy libre con respecto al paper original, no pretendo abrumarte con paginas y paginas sobre el tema, sino mas bien darte una idea del funcionamiento que tienen los humanos al leer, los diferentes modelos de reconocimiento y algún que otro dato mas. Por lo tanto te recomiendo que si podes, leas el paper original que va a estar muchisimo mas completo que este breve resumen.

Introducción
Hay evidencias de que usamos las letras dentro de una palabra para reconocer a estas. Muchos conocedores del tema insisten en que las palabras son reconocidas por el dibujo que genera la forma de la palabra. Algunos usan el termino "bouma" como sinónimo de "forma de la palabra". Este termino aparece en el libro Space Between Words: The Origins of Silent Reading de 1997 de Paul Saenger. En este libro aprendes que reconocemos las palabras por su forma y que la Psicología moderna llaman a esta imagen, la "Forma Bouma"

Vamos a empezar describiendo las tres principales categorías de los modelos de reconocimiento de palabras: El modelo "Forma de Palabra", y los modos Serial y Paralelos de reconocimiento de letras.

Modelo 1 - Forma de la Palabra
El modelo de reconocimiento de palabras que dice que estas son reconocidas como unidades completas es el modelo mas antiguo de la literatura psicológica y seguramente es incluso mas antiguo que esta misma. La idea principal es que los humanos vemos las palabras como patrones completos en lugar de la suma de sus letras. Algunos dicen que la información usada para reconocer una palabra, es el patrón de caracteres neutrales, ascendentes y descendentes. Otros nos indican que hay que usar el la forma creada por el contorno de la palabra. Los patrones de palabras son reconocibles por nosotros como una imagen debido a que vimos esos mismos patrones muchas veces antes. James Cattel (1886) fue el primer psicólogo en proponer esto como un modelo de reconocimiento de palabras.

Reconocimiento de palabras usando un patrón de caracteres neutrales, ascendentes y descendentes.


Reconocimiento de palabras usando un patrón de contorno.

El estudio de Cattel fue replicado en 1969 por Reicher, el cual presento conjuntos de letras (la mitad de las veces palabras reales, la otra mitad, no) por cortos periodos. Los sujetos de prueba fueron interrogados si una o dos letras estaban dentro de la palabra, por ejemplo D o K. Reicher encontró que los sujetos eran mas precisos reconociendo D cuando estaba en el contexto de WORD que en el contexto de ORWD. Esto apoya el modelo de Forma de Palabra porque la palabra permite al sujeto reconocer rápidamente una forma familiar. Una vez que la forma fue reconocida, el sujeto puede deducir la presencia de la palabra correcta mucho tiempo después de leída.

El segundo experimento clave que apoya el modelo es que el texto en minúsculas se lee mas rápido que en mayúsculas. Woodworth (1938) fue el primero en reportar este hallazgo en su libro Experimental Psychology, los cuales fueron confirmados por Smith (1969) y Fisher(1975). Los participantes fueron requeridos de leer pasajes de texto comparables, la mitad en minúsculas y la mitad en mayusculas, En cada esturio, los participantes leyeron confiablemente mas rápido con texto en minúsculas, con un 5 a 10% de diferencia en velocidad. Esto apoya al modelo porque el texto en minúsculas permite patrones de caracteres únicos, en cambio, cuando el texto es presentado totalmente en mayúsculas, todas las letras tienen el mismo tamaño y por ende son mas dificiles de leer.

La tercera clave de evidencia experimental que apoya al modelo nos llega a través de los patrones de errores de palabras que surgen al corregir texto. En este caso, los sujetos son requeridos de leer minuciosamente pasajes de texto para su comprension y al mismo tiempo marcar cualquier falta de ortografía que encontraran. El párrafo estaba diseñado cuidadosamente para tener un igual numero de dos tipos de faltas: aquellas consistentes con la forma de la palabra y aquellas que eran inconsistentes con la forma. Una falta de ortografía consistente con la forma de la palabra, es una que contiene los mismos patrones de caracteres neutrales, ascendentes y descendentes. Si tanto es una palabra correcta, tanfo seria un ejemplo de una falta consistente con la forma de la palabra, y tanro seria un ejemplo de una falta no consistente. El modelo predeciria que formas consistentes deberían ser detectadas en menor porcentaje que aquellas con diferencias en la forma de la palabra ya que estas son menos detectables si tienen la misma forma. Haber & Schindler (1981) y Monk & Hulme (1983) encontraron que las faltas de ortografías consistentes con la forma eran detectadas un 50% menos que aquellas con diferencias en la forma.

La cuarta evidencia que apoya al modelo es la dificultad de la lectura de texto con mayúsculas y minúsculas alternadas. El modelo de Forma de Palabra predice que esto es difícil porque da un patrón de caracteres neutrales, ascendentes y descendentes que difiere de los existentes en una palabra que naturalmente esta en minúsculas. La variación de mayúsculas y minúsculas demostró ser mas difícil de leer que solo minúsculas o solo mayúsculas en una variedad de estudios realizados.



Para no alargar mas de la cuenta este tema, lo voy a separar por partes, en breve viene la segunda parte con mas metodos muy interesantes!


Links:
Documento original (en ingles) en Microsoft Research