Ben je enthousiast over de enorme nieuwe mogelijkheden bij het toepassen van AI op natuurlijke taalverwerking?
Wil je voor de Europese Unie werken en ons helpen taalbarrières voor miljoenen mensen te slechten?
Heb je al relevante expertise op het gebied van AI / NLP / ML?
Het eTranslation NLP-project van de Europese Commissie (https://language-tools.ec.europa.eu/) biedt je momenteel een opwindende kans met impact en doelgerichtheid. Meer details vind je in de functieomschrijving.
Let op: De functie staat open voor elke nationaliteit en elk ervaringsniveau (met minimaal vijf jaar relevante universitaire studie). Het salaris is in overeenstemming met de ervaring. De functie wordt vervuld door een IT-bedrijf en niet rechtstreeks door de Europese Commissie. Werken op afstand is mogelijk binnen het wettelijke kader (details moeten met de werkgever worden overeengekomen). De functie staat open tot ze vervuld is.
Contactpersonen:
Michael Jellinghaus (
Andreas Eisele (
HET TEAM
Wij zijn de sector die zich bezighoudt met automatische vertaling en andere vormen van natuurlijke taalverwerking (NLP), binnen de eenheid Informatietechnologie van het directoraat-generaal Vertaling (DGT) van de Europese Commissie, 's werelds grootste vertaaldienst. Wij bouwen en beheren de automatische vertaaldienst eTranslation, een vlaggenschipproject op het gebied van kunstmatige intelligentie voor de Europese instellingen dat ook beschikbaar is voor een breed scala aan externe gebruikers overal in Europa. eTranslation speelt een belangrijke rol als facilitator van meertaligheid in Europa, als een openbare dienst die meertalige communicatie in veel verschillende contexten mogelijk maakt, onder andere op online platforms zoals de website van de Conferentie over de toekomst van Europa of in moeilijke situaties zoals de toestroom van vluchtelingen in de context van de Oekraïense crisis.
Naast machinevertaling leveren we ook diensten voor andere vormen van natuurlijke taalverwerking, waaronder spraaktranscriptie, documentclassificatie, named entity recognition en anonimisering, en we blijven nieuwe NLP-diensten toevoegen. We gebruiken AI-technieken met deep learning-benaderingen en -tools om onze eigen modellen te trainen, met grote hoeveelheden interne en externe gegevens, of om open-source voorgetrainde modellen in te zetten. We werken in een cloudomgeving, in Azure, en gebruiken infrastructure-as-a-service (IaaS) en platform-as-a-service (PaaS) cloudservices om onze diensten te ontwikkelen en te leveren aan onze interne en externe gebruikers. We voeren ook speciale projecten uit waarbij supercomputers/HPC-resources worden gebruikt voor onderzoek en ontwikkeling met betrekking tot onze diensten.
DE JOB
- Verkenning van manieren om grote taalmodellen (LLM's) en andere soorten kunstmatige intelligentie (AI)-technologie te gebruiken om toepassingen voor natuurlijke taalverwerking (NLP) te bouwen;
- Ontwerp, implementatie en evaluatie van AI-gebaseerde NLP-toepassingen, met inbegrip van maar niet beperkt tot automatische vertaling (MT) engines;
- Definitie van criteria voor kwaliteitsevaluatie die van toepassing zijn op de datasets die worden gebruikt om NLP-toepassingen te bouwen, met betrekking tot zowel de opleidings- als de testdatasets.
- Toepassing van geavanceerde technieken voor gegevensanalyse en machinaal leren, met inbegrip van "deep learning" op basis van neurale modellen, op MT-gerelateerde taken, met inbegrip van maar niet beperkt tot domeinaanpassing;
- Ontwikkeling en onderhoud van methoden en software om bruikbare subsets van bestaande corpora te identificeren, waarbij de ongewenste delen worden uitgefilterd, met behulp van combinaties van machinaal leren met expliciete (symbolische) regels.
- Verwerving en beheer van gegevensbronnen die nuttig zijn om de prestaties en kwaliteit van MT's te verbeteren, zoals parallelle, vergelijkbare en eentalige corpora (inclusief gegevens die van het web worden gehaald of kunstmatige parallelle corpora via terugvertaling);
- Verwerving en beheer van gegevensbronnen voor de ontwikkeling van verbeterde pre- en post-processing tools (bijv. morfologische en syntactische analyse, herordening, herbeoordeling, kwaliteitsschatting);
- Verwerving en beheer van gegevensbronnen voor het bouwen of verbeteren van andere AI-gebaseerde NLP-toepassingen dan MT-engines;
- Adviseren van het ontwikkelteam over het integreren van deze aanvullende gegevensbronnen in een werkende oplossing op softwareniveau;
- Adviseren over kwaliteitsverbeteringen; beoordelen van de impact van wijzigingen aan de NLP-toepassingen op de uitvoerkwaliteit en andere prestatiecriteria;
- Deelname aan functionele werkgroepen en voortgangsvergaderingen;
- Deelname aan wetenschappelijke conferenties en workshops met betrekking tot Artificial Intelligence, Natural Language Processing, Machine Translation en onderliggende technologieën;
- Bijdragen aan en analyse van implementaties die zijn gemaakt om aan specifieke behoeften van klanten te voldoen, bijvoorbeeld door het creëren van domeinspecifieke MT-engines of specifieke algoritmen;
- Analyse van de voordelen en risico's van dergelijke veranderingen met betrekking tot de algemene kwaliteit van de eTranslation-dienst.
- Interactie met bedrijfsanalisten, klanten, gebruikers, projectleiders en ontwikkelaars.
DE VEREISTEN
- Een gevorderd universitair diploma in data-gedreven computationele linguïstiek, machinaal leren, kunstmatige intelligentie, datamining of statistische datamodellering, inclusief vertrouwdheid met data-gedreven technieken voor natuurlijke taalverwerking, zoals statistische / neurale MT, of gelijkwaardige ervaring
- Zeer goede kennis en werkervaring op het gebied van kunstmatige intelligentie of natuurlijke taalverwerking, grondige kennis van het opzetten en evalueren van NLP-software, met inbegrip van testmethodologieën en -instrumenten, zoals automatische kwaliteitsmetrieken (bv. BLEU-scores en soortgelijke voor MT) en menselijke evaluatie van de uitvoerkwaliteit
- Diepgaande kennis van en ervaring met programmeertalen die worden gebruikt voor tekstverwerking (bijv. Python)
- In staat zijn om prototypische oplossingen efficiënt en snel te implementeren en deze te evalueren op zeer grote hoeveelheden tekstgegevens
- In staat zijn om zakelijke en technische presentaties te geven
- Vermogen om hoge kwaliteitsnormen toe te passen
- Kunnen omgaan met snel veranderende technologieën die worden gebruikt in NLP, MT en machine learning
- Zeer goede communicatievaardigheden met technisch en niet-technisch publiek
- Vaardigheden op het gebied van analyse en probleemoplossing
- In staat zijn om duidelijke en gestructureerde technische documenten te schrijven
- Vermogen om deel te nemen aan technische vergaderingen en goede communicatieve vaardigheden
Vanwege het bijzondere karakter van een grote internationale organisatie als de Europese Commissie moeten kandidaten ook over de volgende niet-technische vaardigheden beschikken:
- Vermogen tot integratie in een internationale/multiculturele omgeving, snel zelf kunnen starten en ervaring met werken in teamverband;
- Vermogen om deel te nemen aan meertalige vergaderingen;
- Het vermogen om in een multiculturele omgeving te werken aan meerdere grote projecten;
- Uitstekende teamspeler
- Het vermogen om andere EU-talen dan Engels te begrijpen, spreken en schrijven is een voordeel;
- Een hoge mate van discretie en integriteit is vereist, aangezien de applicaties die in DGT R.3 worden beheerd en onderhouden persoonlijke en vertrouwelijke gegevens bevatten.