Centro de Investigación Lingüística en UT Austin - Linguistics Research Center at UT Austin

El Centro de Investigación Lingüística (LRC) de la Universidad de Texas es un centro de investigación y desarrollo de lingüística computacional . Fue dirigido por el Prof. Winfred Lehmann hasta su muerte en 2007, y posteriormente por el Dr. Jonathan Slocum. Desde su fundación, prácticamente todos los proyectos del LRC han involucrado el procesamiento de textos en lenguaje natural con la ayuda de computadoras. Las principales actividades del Centro en la actualidad se centran en las lenguas indoeuropeas y comprenden el estudio histórico, la lexicografía y la enseñanza basada en la web ; los miembros del personal participan en varios proyectos independientes pero a menudo complementarios en estos campos utilizando una variedad de software, casi todo desarrollado internamente.

Historia

El LRC fue fundado por Winfred Lehmann en 1961. En sus inicios, los esfuerzos de investigación en el LRC se concentraron en la traducción automática (MT), la traducción de textos de un lenguaje humano a otro con la ayuda de computadoras, muy desarrollada hoy en día en el campo de la industria del lenguaje, financiado por la USAF y otros patrocinadores. El LRC se concentró en la traducción del alemán al inglés, aunque se depositó una copia del Russian Master Dictionary en el LRC después del informe de ALPAC . Después de una pausa general ca. 1975-78, la nueva financiación llevó al desarrollo por Jonathan Slocum y otros de un nuevo sistema con el mismo nombre (el sistema METAL MT ), pero con nuevos conjuntos de herramientas para lingüistas y un éxito mucho mayor, lo que resultó en la entrega de un prototipo de producción. luego, más tarde, un sistema comercial de MT completo. La I + D de MT continuó en el LRC, con financiación de varios patrocinadores, hasta bien entrada la década de 1990.

Desde sus primeros años hasta el presente, el LRC ha montado una serie de proyectos más pequeños que han dado como resultado la publicación de trabajos importantes relacionados con las lenguas indoeuropeas y / o su antepasado común, el protoindoeuropeo. El sello distintivo de este trabajo ha sido el uso de computadoras para transcribir textos y prepararlos para su publicación. Un ejemplo destacado del uso de computadoras por parte del CRA para preparar textos para su publicación impresa es el libro de Winfred P. Lehmann, A Gothic Etymological Dictionary (Leiden: Brill, 1986). La versión final lista para imprimir se produjo con la ayuda de una impresora láser (nueva tecnología exótica, en aquellos días) utilizando, para los distintos idiomas incluidos en las entradas, aproximadamente 500 caracteres especiales, muchos de ellos diseñados en el Centro. Este fue el primer diccionario etimológico importante para las lenguas indoeuropeas que se produjo con la ayuda de computadoras.

Los proyectos actuales del LRC se han concentrado en transcribir los primeros textos indoeuropeos, desarrollar lecciones de idiomas basadas en ellos y publicar en la web estos y otros materiales relacionados con el estudio de las lenguas indoeuropeas, de su ancestro común protoindoeuropeo y de la lingüística histórica en general.

Alumni