Keyword spotting en idiomas sin datos de entrenamiento
2014, Universidad de Buenos Aires, 2014Citas: 2
Agregar PDF Importar citas Importar citas SCRAPME Plots Conexiones
Autor(es)
Pablo Brusco
Abstract
Existe una ONG llamada Farm Radio International que se encarga de recolectar y fomentar programas radiales africanos en distintos idiomas que hablen de cómo cultivar, cosechar, trabajar en granjas/campos, etc. En esta organización enfrentan un problema, el contenido que recolectan no está indexado ni clasificado por temas, y si alguien necesita identificar un programa en el que se habló de un aspecto en particular, no tienen manera de buscar en este contenido más que escuchando programas enteros. De aquı surge la idea de poder ofrecer a un oyente la posibilidad de escuchar grabaciones de radio que contengan un tema en particular. Por ejemplo, para el caso de las plagas de langostas en campos de tomate, en aquellos programas que contengan las palabras claves (indistintamente llamadas keywords de aquı en adelante)“langostas”,“tomate”,“plaga”, se podrá escuchar momentos relevantes en los cuales se mencionan estas palabras. Por lo tanto, se necesitarıa desarrollar un sistema que, dado un conjunto de keywords; un corpus de programas de radio grabados directo del estudio radial sin transcripciones asociadas; y entrenadores–personas que estén dispuestas a grabar o marcar en audio existente cada keyword las veces que el sistema necesite–, devuelva las ocurrencias de estas keywords en los programas para que puedan ser indexados y ofrecidos al oyente por teléfono.Este sistema no permitirá búsquedas de keywords dichas por el usuario directamente, sino que se les ofrecerá una serie de temas posibles que estarán previamente asociados a ciertas keywords ya disponibles gracias al trabajo de los …