lunes, 19 de marzo de 2007

La Importancia del Módulo de Atención

Existen una gran cantidad de problemas para los cuales la información recibida por el sistema o agente virtual es más de la necesaria.
Existen una gran cantidad de problemas para los cuales la información recibida por sistema o agente virtual es más de la necesaria. Lo que es más, al momento de aplicar algoritmos de aprendizaje es extremadamente necesario eliminar la información irrelevante para determinada lección y observar aquello que realmente contribuirá al aprendizaje de la tarea objetivo. Por lo general se evita este punto entrenando a los sistemas tan sólo con la información que será relevante para aquello que se desea que aprenda, eliminando el ruido.


Esta omisión de la información superflua se aplica desde a las redes neuronales que son diseñadas para alguna actividad muy específica, como a los sistemas reconocedores de voz para los cuales se asume que el individuo se encuentra cerca del micrófono y se ignora el fondo, aún cuando los seres humanos podríamos estar ignorando a la persona que está cerca de nosotros y enfocarnos en escuchar la conversación de alguien más (A lo cual se le conoce comúnmente como “entrometernos en la conversación de alguien más” cosa que, aunque es una falta de educación, la podemos hacer).


Sin embargo, para una máquina de propósito general, con capacidades de aprender de la experiencia, como se desearía que hiciera un robot de servicio doméstico, hacer este tipo de asunciones no sólo es inútil, sino que además limita definitivamente la capacidad de aprendizaje y evolución del agente.


Pensando concretamente en el caso de dicho robot, éste estaría sometido constantemente a la recepción de una gran cantidad de información: toda aquella que pueda percibir a través de sus sensores: imágenes, sonidos, en fin, todo aquello para lo cual se le haya dotado de la capacidad de percibir. Al igual que los seres humanos, este robot se vería en la necesidad de seleccionar solamente aquella información que le resultara relevante. Si se deseara enseñarle algo, debería tomar solamente aquellas señales que están relacionadas con aquello que debe aprender. Si debe repetir cierta actividad con regularidad, se esperaría que no debiera realizar ya toda la planeación desde el principio sino que el algoritmo debería poder ser seguido con mayor naturalidad, enfocándose más bien, a detectar cuando las condiciones cambian para poder improvisar el comportamiento más adecuado dependiendo de las nuevas circunstancias.


Los seres humanos enfocamos nuestra atención dependiendo de varios factores: la novedad, aquello que nos puede ser de utilidad para alcanzar determinada meta o por interés emocional.


La atención que pongamos en cada cosa determinará la cantidad de memoria de trabajo que se le asigne a un sentido o a otro, si nos concentraremos más en recordad una secuencia en el tiempo o en el espacio o si dejaremos algo intermedio entre ambos, nos indicará si debemos fijarnos en patrones sucesivos o separados por ciertos intervalos, cuya longitud puede ser determinada dinámicamente y puede no ser fija. El tipo de patrones que podríamos necesitar detectar para comprender la lógica de algo podría ser como en la secuencia siguiente:


1 2 2 4 8 3 16 32 64 4 128 256 512 1024 5


En la que la lógica subyacente es:


1 2 2 4 8 3 16 32 64 4 128 256 512 1024 5


Donde he resaltado la separación entre las dos secuencias cambiando el color de una de ellas (añadiendo una diferencia que puede ser fácilmente detectada por el sentido de la vista). Igualmente podría resaltarse esta diferencia si la secuencias fuesen leídas por dos personas diferentes, en cuyo caso, el sentido del oído percibiría la diferencia. Es curioso notar cómo, en este último caso, sería necesario mantener en mente las secuencias durante más tiempo para poder resolver la forma en que son generadas, mientras que, con visión, percibimos toda la información en paralelo, está en el papel y por tanto resulta más sencillo sacar conclusiones.


Sin embargo, aún antes de establecer diferencias visuales o auditivas entre las dos secuencias, nuestro cerebro podría haber encontrado el patrón que separa ambas secuencias.


En cualquier caso, separar las secuencias está estrechamente vinculado con la capacidad que tengamos para atender separadamente a los elementos de una y de otra: llegar a darnos cuenta de que, mientras algunos números incrementan su magnitud rápidamente, otros parecen regresar “rompiendo” este patrón de crecimiento. Seguidamente enfocamos nuestra atención en aquellos miembros cuyo comportamiento difiere del de sus vecinos, con esta acción en la que los observaremos a todos ellos juntos (aún cuando espacialmente sigan estando separados) podremos darnos cuenta de que existe una relación entre todos ellos y es que se trata de números consecutivos.




En este sencillo ejemplo podemos ver cómo, la alternancia entre los elementos en los cuales se pone atención casi simultáneamente, nos permite realizar nuevas agrupaciones de acuerdo a sus similitudes. De este modo, observamos que los seres humanos tendemos a agrupar aquellas cosas que encontramos similares debido a que existe un patrón recurrente y predecible entre los elementos, pero que solamente podemos encontrar esta forma de agrupación si tenemos a todos los elementos, juntos, en nuestra memoria de trabajo y esto resulta mucho más sencillo cuando la información se encuentra en el mundo exterior y podemos percibirla en paralelo (visión), que cuando debemos registrarla en nuestra memoria de trabajo y recordar para analizar.

No hay comentarios: