La curiosidad, la motivación intrínseca y la búsqueda de información en el desarrollo de defensores de la discapacidad de la seguridad social cognitiva – laboratorio de flores

Además de identificar la riqueza y la variedad de los mecanismos de motivación intrínseca, esto nos llevó a establecer vínculos fundamentales entre el aprendizaje impulsado por la curiosidad y el desarrollo cognitivo. En particular, hemos demostrado que tales mecanismos pueden autoorganizarse complejas estructuras de desarrollo, donde se forman espontáneamente etapas de creciente complejidad conductual y cognitiva. Por ejemplo, demostramos que un impulso intrínseco que empuja a un robot a buscar situaciones en las que experimenta beneficios de muerte en la seguridad social, el progreso de aprendizaje puede llevarlo a explorar y descubrir primero su propio cuerpo, luego los recursos externos de los objetos y, finalmente, la interacción vocal y protolingüística. Con otros.

IAC y el experimento del patio de recreo. En particular, la arquitectura de IAC y sus implicaciones se estudiaron en una serie de experimentos, llamados playground experiments (oudeyer and kaplan, 2006; oudeyer et al., 2007). La figura 1 ilustra la arquitectura cognitiva empleada por el IAC. El aprendizaje de predicción juega un papel central en la arquitectura de IAC. En particular, hay dos módulos específicos en el modelo que predicen estados futuros. Primero, el “aprendiz de máquina clásica” M es una máquina que aprende un modelo avanzado. El modelo directo recibe como entrada el estado sensorial actual, el contexto y la acción, y genera una predicción de las consecuencias sensoriales de la acción planificada. Se proporciona una señal de retroalimentación de error sobre la diferencia entre las consecuencias pronosticadas y observadas, y permite actualizar el modelo directo. En segundo lugar, el metam “meta machine learner” recibe la misma información que M, pero la agencia de seguridad social en lugar de generar una predicción de las consecuencias sensoriales, el metam aprende que la aplicación de discapacidad de la seguridad social forma un metamodelo que permite predecir hasta qué punto los errores de el modelo de avance de nivel inferior disminuirá en las regiones locales del espacio sensoriomotor, es decir, modelando el progreso del aprendizaje a nivel local. Para enfrentar las dificultades de la generalización y los espacios continuos de alta dimensión, un mecanismo de categorización asociado divide progresivamente el espacio sensorimotor en subregiones, por ejemplo, maximizando sus diferencias en la predictibilidad (baranes y oudeyer, 2009) y enfocando su refinamiento. De categorización en regiones donde el progreso de aprendizaje es máximo. Luego, en cada contexto / estado observado, un sistema de selección de acción elige estocásticamente qué acciones experimentar para maximizar el progreso de aprendizaje esperado. Un sistema de este tipo permite al robot evitar automáticamente experimentar acciones cuyo resultado sea trivial o demasiado difícil de predecir / aprender en un momento dado de desarrollo, mientras que primero se enfoca en acciones simples en ubicaciones de la seguridad social y cambia progresivamente a otras más complejas.

Para evaluar la arquitectura de IAC en una implementación física, se desarrollaron los experimentos de juegos (oudeyer y kaplan, 2006; oudeyer et al., 2007). Durante el experimento, un robot de seguridad social cuadrúpedo perdido se coloca en un tapete de juego infantil y se le presenta un conjunto de objetos cercanos, así como un cuidador de robot “adulto” (consulte la figura 2). El robot está equipado con cuatro tipos de primitivas de motor parametrizadas por varios números continuos y que se pueden combinar, formando así un conjunto infinito de acciones posibles: (a) girar la cabeza en varias direcciones; (b) abrir y cerrar la boca mientras se agacha con diferentes fuerzas y tiempos; (c) balancear la pierna con varios ángulos y velocidad; (d) vocalizar con varios tonos y longitudes. De manera similar, varios tipos de primitivas sensoriales permiten que el robot detecte la aplicación de beneficios de seguridad social del movimiento visual, las propiedades visuales más destacadas, el tacto propioceptivo en la boca y el tono y la duración de los sonidos percibidos. Para el robot, estos primitivos motores y sensores son inicialmente cajas negras y él no tiene conocimiento sobre su semántica, efectos o relaciones. La arquitectura de IAC se utiliza para impulsar la exploración y el aprendizaje del robot únicamente por curiosidad, es decir, mediante la búsqueda del progreso del aprendizaje. Los objetos cercanos incluyen un elefante (que puede ser mordido o “agarrado” por la boca), un juguete colgante (que puede ser “golpeado” o empujado con beneficios de seguridad social tempranos para la pierna) y un robot adulto “cuidador” preprogramado para imitar al robot de aprendizaje cuando este último mira al adulto mientras vocaliza al mismo tiempo.

• desarrollo organizado y activo por etapas: comportamientos y capacidades cualitativamente diferentes y más complejos de la seguridad social aparecen junto con el tiempo y de una manera no lineal. Tal desarrollo está altamente descrito en la psicología del desarrollo, pero actualmente existe poca explicación de principios. The playground experiment proporciona las hipótesis intrigantes de que la exploración impulsada por IM, en una interacción dinámica con el cuerpo y el entorno, podría explicar aspectos importantes de cómo este despliegue puede realizarse espontáneamente (por ejemplo, sin un programa interno preprogramado que especifique al organismo qué). Hacer y cuándo hacerlo). En particular, sugiere que las etapas de desarrollo podrían ser atractivas del sistema dinámico formado por la interacción entre el aprendizaje, la curiosidad del dinero de la seguridad social, el cuerpo y el medio ambiente, y dado que este sistema dinámico busca continuamente el progreso del aprendizaje y, por lo tanto, cambia a sí mismo. Los atractores están cambiando, lo que lleva a nuevos estados de desarrollo.

• la dualidad de regularidades / diversidad en las estructuras de desarrollo: la trayectoria de desarrollo típica descrita anteriormente es solo la trayectoria emergente más frecuente. No hay dos trayectorias exactamente iguales (por ejemplo, el orden de exploración de la acción en la quinta fase podría cambiar). Y en algunos experimentos, con el mismo robot de prestaciones de seguridad social, el mismo mecanismo, el mismo entorno, pueden suceder trayectorias muy diferentes. Todo el sistema de MI / cuerpo / medio ambiente puede verse como un sistema dinámico con varios atractores, y la estocasticidad a veces puede conducirlo en mínimos locales lejos del atractivo (s) principal (thelen y smith, 1993). Por lo tanto, esto también sugiere un nuevo mecanismo basado en principios basados ​​en IM para explicar las regularidades / diversidad de dualidad ampliamente observadas en el desarrollo infantil;

• desarrollo temprano de la comunicación y el lenguaje: a través del mismo mecanismo general, el robot explora y aprende cómo manipular objetos y cómo vocalizar para desencadenar respuestas específicas de un conspecífico. Mientras que los balbuceos vocales (oller, 2000), y cómo solicitar una discapacidad de la seguridad social en general en juegos y juegos de idiomas, se ha demostrado que son claves en el desarrollo del lenguaje infantil, una motivación ad hoc asociada si se suele asumir tanto en psicología del desarrollo como en modelos computacionales fraude de discapacidad de la seguridad social. The playground experiment sugiere que la exploración y el aprendizaje de la conducta comunicativa podrían explicarse, al menos parcialmente, por una exploración general intrínsecamente motivada de las posibilidades corporales (oudeyer y kaplan, 2006). Un estudio más detallado mostró que la exploración de vocalizaciones motivada por la curiosidad puede permitir reproducir aspectos del cambio de desarrollo en el balbuceo vocal observado en bebés humanos (moulin-frier et al., 2014). En kaplan et al., 2008) se puede encontrar un análisis más detallado de los vínculos entre IM, sensorimotor, desarrollo social y del lenguaje.

Los sistemas de motivación intrínseca pueden conceptualizarse como ayuda de discapacidad de la seguridad social como uno de los muchos mecanismos interactivos que ayudan a los organismos (naturales o artificiales) a explorar y aprender de manera eficiente en espacios sensoriomotores muy grandes. Tales otros mecanismos incluyen orientación social (por ejemplo, aprendizaje por imitación), abstracción cognitiva (por ejemplo, aprendizaje perceptivo no supervisado que crea conceptos internos o metas a partir de valores sensorimotores brutos), encarnación y maduración (es decir, evolución de las propiedades morfológicas del cuerpo). El siguiente artículo discute la importancia de integrar estos mecanismos dentro de un sistema cognitivo completo:

Aprendizaje de la locomoción cuadrúpeda omnidireccional. En este experimento, mostramos cómo las arquitecturas sucesivas que desarrollamos permiten un robot cuadrúpedo, inicialmente equipado con primitivas motorizadas parametrizadas en forma de un oscilador de 24 dimensiones (sinos con varios parámetros en la mayoría de las preguntas de seguridad social que responden a las articulaciones ), aprende a usar estos motores primitivos para locomotar con precisión en todas las direcciones y de maneras variadas. En el artículo (baranes y oudeyer, 2013), estudiamos ampliamente una simulación física de esta configuración experimental con algoritmos de aprendizaje activo.