Kismet (robot) - Kismet (robot)

Kismet ahora reside en el Museo MIT en Cambridge, Massachusetts , Estados Unidos.

Kismet es una cabeza de robot fabricada en la década de 1990 en el Instituto de Tecnología de Massachusetts por la Dra. Cynthia Breazeal como un experimento en computación afectiva ; una máquina que puede reconocer y simular emociones . El nombre Kismet proviene de una palabra turca que significa "destino" o, a veces, "suerte".

Diseño y construcción de hardware

Para que Kismet interactúe adecuadamente con los seres humanos, contiene dispositivos de entrada que le otorgan habilidades auditivas , visuales y propiocepción . Kismet simula la emoción a través de diversas expresiones faciales, vocalizaciones y movimientos. Las expresiones faciales se crean mediante los movimientos de las orejas, las cejas, los párpados, los labios, la mandíbula y la cabeza. El costo de los materiales físicos se estimó en 25 000 dólares estadounidenses.

Además del equipo mencionado anteriormente, hay cuatro Motorola 68332 , nueve PC de 400 MHz y otro PC de 500 MHz.

Sistema de software

El sistema de software de inteligencia social de Kismet, o sistema nervioso sintético (SNS), fue diseñado con modelos humanos de comportamiento inteligente en mente. Contiene seis subsistemas de la siguiente manera.

Sistema de extracción de características de bajo nivel

Este sistema procesa información visual y auditiva sin procesar de cámaras y micrófonos. El sistema de visión de Kismet puede realizar detección de ojos, detección de movimiento y, aunque controvertido, detección de color de piel. Cada vez que Kismet mueve la cabeza, desactiva momentáneamente su sistema de detección de movimiento para evitar detectar el movimiento automático. También utiliza sus cámaras estéreo para estimar la distancia de un objeto en su campo visual, por ejemplo, para detectar amenazas: objetos grandes y cercanos con mucho movimiento.

El sistema de audio de Kismet está principalmente sintonizado para identificar el afecto en el habla dirigida a un bebé . En particular, puede detectar cinco tipos diferentes de habla afectiva: aprobación, prohibición, atención, comodidad y neutral. El clasificador de intenciones afectivas se creó de la siguiente manera. Las características de bajo nivel, como la media del tono y la variación de energía (volumen), se extrajeron de muestras de voz grabada. Las clases de intención afectiva se modelaron luego como un modelo de mezcla gaussiana y se entrenaron con estas muestras utilizando el algoritmo de maximización de expectativas . La clasificación se realiza con múltiples etapas, primero clasificando un enunciado en uno de dos grupos generales (por ejemplo, calmante / neutral versus prohibición / atención / aprobación) y luego haciendo una clasificación más detallada. Esta arquitectura mejoró significativamente el rendimiento para clases difíciles de distinguir, como aprobación ("Eres un robot inteligente") versus atención ("Hola Kismet, aquí").

Sistema de motivación

La Dra. Breazeal imagina sus relaciones con el robot como "algo así como una interacción entre un bebé y un cuidador, donde yo soy el cuidador esencialmente y el robot es como un bebé". La descripción general establece la relación humano-robot dentro de un marco de aprendizaje, con el Dr. Breazeal proporcionando el andamiaje para el desarrollo de Kismet. Ofrece una demostración de las capacidades de Kismet, narradas como expresiones faciales emotivas que comunican el 'estado motivacional' del robot, Dr. Brazeal: "Esta es ira (risa) ira extrema, disgusto, excitación, miedo, esta es felicidad, esta es interés, éste es tristeza, sorpresa, éste está cansado y éste es dormir ".

En un momento dado, Kismet solo puede estar en un estado emocional a la vez. Sin embargo, Breazeal afirma que Kismet no es consciente, por lo que no tiene sentimientos.

Sistema motor

Kismet habla un protolenguaje con una variedad de fonemas, similar al balbuceo del bebé. Utiliza el sintetizador de voz DECtalk y cambia el tono, el tiempo, la articulación, etc. para expresar diversas emociones. La entonación se usa para variar entre preguntas y expresiones similares a declaraciones. La sincronización de labios era importante para el realismo, y los desarrolladores utilizaron una estrategia de animación: "la simplicidad es el secreto para una animación de labios exitosa". Por lo tanto, no intentaron imitar perfectamente los movimientos de los labios, sino que "crearon una mano visual corta que pasa sin ser desafiada por el espectador".

Ver también

Referencias

enlaces externos