Stage ‘Data Science - Bouw een visuele documentvergelijker’

Standplaats: Apeldoorn
36 uur per week
Salaris:

Wil jij als stagiair ‘Data Science’ ervaring op doen, jezelf ontwikkelen en tevens bijdragen aan een duurzaam en energieneutraal Nederland? Duik in de wereld van Waterschap Vallei en Veluwe. Met ruim 650 medewerkers werken wij iedere dag aan veilige dijken, gezuiverd rioolwater en voldoende schoon water in sloten, beken en kanalen. Dat doen we voor 1,1 miljoen mensen die wonen in ons gebied verspreid over 37 gemeenten. Onze ambitie: in 2050 volledig circulair en klimaatpositief zijn. We zijn daarom regelmatig op zoek naar frisdenkers, gepassioneerde vakspecialisten, bedreven technici en bedrijfsvoeringprofessionals die graag hun bijdrage leveren in het realiseren van duurzame ambities.

Water verandert je wereld

Jij komt terecht in het DataLAB, een club uit het team van Transitie & Innovatie. Het DataLAB bestaat uit meerdere Data Engineers, een Data Scientist (jouw begeleider) en een PowerBI Specialist. Als team stimuleren wij Datagedreven Werken binnen de organisatie en ontwikkelen wij innovatieve producten die het werk van onze waterschap als geheel of onze collega’s verbeteren.

Wij willen een gebruiksvriendelijke tool ontwikkelen, waarmee medewerkers eenvoudig documenten kunnen vergelijken. Gebruikers uploaden simpelweg één brondocument en één of meerdere gerelateerde documenten, waarna de tool visueel en in een oogopslag kan laten zien welke doelstellingen, richtlijnen of uitgangspunten overlappen, aanvullen of tegenstrijdig zijn. 

Hoewel generatieve AI (zoals LLM’s) populair is voor documentanalyse, brengt het gebruik ervan grote uitdagingen met zich mee: antwoorden zijn niet altijd betrouwbaar en specifieke details kunnen verloren gaan in gegenereerde teksten. Daarom richt jij je op een visuele oplossing die exact laat zien waar verschillen en overeenkomsten te vinden zijn. Hiermee help jij medewerkers snel aan inzicht, betere besluitvorming en efficiëntere samenwerking. 

Het project kent twee kernfases.

Fase 1 Backend:

  • Model of methode om bron- en targetdocumenten te vergelijken.
  • Input: bron- en target documenten.
  • Output: relatie van segmenten in bron document naar relevante segmenten in target documenten.

Fase 2 Frontend:

  • Webapplicatie waarop de resultaten voor een vergelijking visueel worden getoond.

Voor beide fases houd je rekening met het evalueren van de uitkomsten. Hoe goed werkt het model? Hoe is de gebruikerservaring van de web app? Krijgen gebruikers daadwerkelijk meer inzicht?

Techstack
Je zal primair werken vanuit Python voor data verwerking, modelleren en deployment (Flask, FastAPI, Plotly Dash). Daarnaast kom je in aanraking met Azure voor deployment pipelines en webhosting.

Wat breng jij mee?

Het is een uitdagende stage met een praktisch product als uitkomst. Dit vraagt een probleemoplossende houding en een drive om te presteren en produceren. Het is vooral meters maken en het eind product hoeft dan ook niet perfect. Wij zijn op zoek naar een Minimal Viable Product.
Verder:
• volg je een opleiding in de richting van AI of Data Science;
• heb je ervaring in en vaardig met Python;
• ben je zelfstandig, analytisch, creatief, nieuwsgierig, en vooral een probleemoplosser;
• je bent gericht op resultaat.
We zoeken geen “developer” maar iemand die:
• snapt wat er vergeleken moet worden;
• weet hoe je dat met modellen aanpakt;
• en praktisch kan leveren.

Dit bieden wij jou

Je krijgt voldoende steun en begeleiding om het eindproduct te realiseren. Wij bieden dus vooral een leerervaring. Je krijgt een uitdaging om écht iets heel moois neer te zetten. Je krijgt veel vrijheid en veel verantwoordelijkheid, wat ook discipline en doorzettingsvermogen vraagt. Het is een wisselwerking. Jij krijgt de ruimte om jouw probleemoplossend vermogen de vrije loop te laten. Daarvoor verwachten we onafhankelijkheid vanuit jou. Je bent een zelfstarter. Maar, tegelijkertijd kun je ook rekenen op onze expertise en begeleiding. Je komt in een team met enthousiaste en gedreven medewerkers voor wie geen uitdaging te groot is. Problemen oplossen en resultaten behalen, daar staan wij voor! Jij ook?
Hiernaast hebben we flexibele werktijden en krijg je een stagevergoeding van 25% van het minimumloon op basis van een 36-urige werkweek  (deeltijders na rato). Je werkt vanuit ons hoofdkantoor in Apeldoorn maar hebt ook de gelegenheid om in overleg thuis te werken.

Contactpersoon

Data Scientist

Hoe ziet de sollicitatieprocedure eruit?

sollicitatie
1. Solliciteer
Leuke functie gevonden?
selectie_1
2. Selectie
Ben je geschikt?
tweede_gesprek_1
3. Kennismaking
We gaan wat dieper in op de materie
arbeidsvoorwaardengesprek
4. Contractvoorstel
Wat zijn de arbeidsvoorwaarden
in_dienst_1
5. In dienst
Ondertekening van het contract
Feedback button
Feedback button