Ik weet niet waar u Tilburg van kent maar vanaf 15 februari 2019 zal de stad voor NOTaS de boeken ingaan als de plek waar we een zeer succesvolle themabijeenkomst rond het thema “TST en kunstmatige intelligentie” hebben gehad. Zo’n 30 personen wisten het Dante-gebouw op de Tilburgse Universiteitscampus te vinden voor een programma dat ditmaal geheel in het Engels werd gehouden zoals onderstaande agenda al laat zien:
NOTaS-meeting at Tilburg University (TiCC) | ||
Locatie | Dante-gebouw, Warandelaan2, kamer D353 | |
Theme | HLT and Artificial Intelligence |
{slider=Program}
9:30 | Welcome with coffee | |
10.00 | Brief introduction (NOTaS-board) | Fabrice Nauze |
10:05 | Automatic text generation and its applications | Emiel Krahmer (DCC) |
10:35 | Neural representations of form and meaning in spoken language | Grzegorz Chrupala (CSAI) |
11:00 | Coffee Break | |
11:30 | An overview of Flow.ai: the conversational AI toolkit | Sander Wubben (Flow.ai) |
12:00 | Transforming educational publishing with language technology | Mark Breuker & Roland Groen (Edia) |
12:30 | Final discussion: HLT & Artifical Intelligence | Fabrice Nauze |
12:45 | Lunch | Esplanade |
13:30 | Farewell |
U ziet: een programma dat was opgesplitst in twee presentaties van academische snit en twee vanuit het bedrijfsleven.
{/slider}
Natural Language Generation
De aanwezigen zaten twee rijen dik rond de conferentietafel van zaal D353 toen Fabrice Nauze, voorzitter van NOTaS, en tevens voorzitter van deze bijeenkomst, ons welkom heette en het woord gaf aan de Tilburgse hoogleraar Emiel Krahmer. Deze gaf een bijzonder boeiend overzicht van het werk dat in Tilburg geschiedt op het gebied van NLG (Natural Language Generation). Dat varieert van het genereren van sportberichten uit voetbaluitslagen (Automated Newsroom), tot het voorzichtig formuleren van gepersonaliseerde berichten over bijwerkingen van behandelingen van kanker.
Een interessante voorbeeld was het maken van verslagen van een voetbalwedstrijd. De flexibiliteit van de software maakt het mogelijk om van dezelfde wedstrijd drie verschillende verslagen te maken:
- Een voor fans van de winnende partij (terechte overwinning, mooie doelpunten, etc.)
- Een voor fans van de verliezende partij (onterechte overwinning, mazzel doelpunten, etc.)
- Een neutraal verslag voor de overige lezers
Daarnaast liet hij zien hoe robot Nao (NOTaS-deelnemers welbekend) in het L2tor-project is ingezet om kinderen woorden te leren door middel van ondersteuning door gebaren. Zo onthielden kinderen het woord voor "aap" beter wanneer Nao gelijktijdig ook de typische bewegingen van een aap probeerde na te doen. Helaas verdween dit effect bij woorden die niet met specifieke gebaren geassocieerd werden. Interessant en voer voor meer onderzoek.
Grounded Speech Perception
Het volgende praatje was van Grzegorz Chrupała over “grounded speech perception”. Deep Learning-technieken worden gebruikt om plaatjes aan spraakuitingen te koppelen, zonder vooraf ingegeven kennis van fonemen of morfemen. De uitkomsten waren interessant en lieten trends zien die ook bij kinderen worden waargenomen wanneer ze taal aan betekenis leren koppelen en vice versa.
Je moet hierbij denken aan het volgende: een jong kind ziet een plaatje (bv een vogel op een tak) terwijl een ouder zegt: "kijk een vogel op een tak". Het kind is nog te jong om echt te begrijpen wat een vogel of een tak is. Toch zal het kind een verband proberen te leggen tussen de gesproken uiting en het bekeken plaatje. De vraag van Grzegorz is: kan ik dat met AI nabootsen?
Daarna was het pauze werd en werd het heel druk in het gangetje naast de zaal maar wel heel leuk om daar ook nog andere Tilburgse collega’s tegen het lijf te lopen.
En het was interessant om de koffie van de catering met die uit het fraaie apparaat op de gang aan een smaakvergelijking te onderwerpen.
Conversational AI toolkit
Op vloeiende wijze leidde de voorzitter terug naar de zaal voor een presentatie over het bedrijf flow.ai van mede-oprichter Sander Wubbe. Het bedrijf is een spin-off van de Tilburgse universiteit en heeft een fraai platform in de markt gezet om chatbots op te ontwikkelen. Zoals we inmiddels wel meer zien richt de chatbot zich niet enkel op geschreven conversaties maar ook op gesproken input. Zo is het vrij eenvoudig om de met Flow.ai gemaakte dialogen te koppelen aan de praatpalen van Google en Amazon zoals talloze Nederlandse bedrijven al hebben gedaan.
Sander, die zelf in Tilburg is gepromoveerd, liet dit zien aan de hand van een voorbeeld waarbij ondersteunende technologie (NLG) wordt ingezet om meerdere varianten van eenzelfde vraag te genereren. Daarna volgde nog een breed palet van use cases bij verschillende klanten zoals Samsung voor de bediening van allerlei apparaten, de sleep challenge van Interpolis en recommender systemen voor films.
Transforming educational publishing
Ten slotte was het de beurt aan Mark Breuker van Edia. Hij begon met de stelling dat veel educatieve uitgevers geen idee hebben van het materiaal dat ze zelf al in huis hebben. Als ze dan beginnen met een nieuw boek, dan beginnen ze volledig opnieuw terwijl dat eigenlijk niet nodig is. Het onderverdelen van het tekstmateriaal in kleinere brokken en het automatisch classificeren ervan, maakt het dan makkelijker om je eigen materiaal te vinden en opnieuw te gebruiken.
Ook maakte Mark duidelijk hoe moeilijk het voor uitgevers is om een goede inschatting te maken van het niveau van Engels teksten volgens de indeling van het Europese Referentiekader (ERK, of in het Engels CEFR) en hoe AI kan helpen om dit uniformer te doen. Interessante vragen of uniformere classificatie ook een betere classificatie oplevert gingen hij en zijn rechterhand Roland Groen bepaald niet uit de weg waardoor een heel interessante discussie volgde over het nut en de kracht van AI die de grenzen van dit specifieke onderwerp op een welhaast filosofisch plan bracht.
Lunch
Daarover konden we nog napraten op een uitstekend verzorgde lunch in de Esplanade, waar ondergetekende zich met enkele medewerkers van ReadSpeaker onderhield over de vraag of Google en Amazon niet ook de TTS/spraaksynthese-markt gaan overnemen. Het antwoord was een overtuigend nee, maar dat is misschien een mooi onderwerp voor een volgende bijeenkomst.
Henk van den Heuvel