Een buitenboordmotor voor schaatsonderzoek in Innovatielab Thialf

Data-steward versnelt analyse voor Sport Data Valley

Sportdata wordt in Nederland op verschillende plekken en op diverse manieren verzameld en opgeslagen. Om deze data uit sportonderzoek beter te ontsluiten heeft Sportinnovator enige jaren geleden al de Sport Data Valley opgericht. Het doel van dit platform is dat aangesloten organisaties makkelijker en sneller data kunnen delen, wat tot meer sportinnovaties en beter sportonderzoek moet leiden. Met de eerste Sport Data Valley-steward krijgt Innovatielab Thialf een expert erbij voor het sneller analyseren van schaatsdata.

De Sport Data Valley is een consortium van Universiteit van Leiden (penvoerder), UTwente, VU Amsterdam, HvA en TU Delft. Managing Director van Sport Data Valley Auke Damstra zegt dat de Sport Data Valley niet voor niets bij deze kennisinstellingen ligt. “Met de Sport Data Valley willen we een neutrale entiteit waarbij het niet gaat om het verkopen van de data maar waarbij we een brug willen slaan tussen onderzoek en de praktijk met data.”

Versnipperd

Dat is volgens Damstra nodig omdat er in Nederland nog veel kansen liggen om meer met data te doen blijven. Dit heeft een aantal oorzaken. "De data is versnipperd: er is heel veel data, maar verspreid opgeslagen. De zoektocht naar data kost tijd. Verder is data vaak niet toegankelijk doordat het in gesloten systemen is opgeslagen. Het derde punt is dat data niet goed is gestructureerd. Er is een groot gebrek aan standaarden voor data." Dat is precies waar de Sport Data Valley-steward een belangrijke rol in gaat spelen. "Als data niet gestructureerd is kun je er ook geen analyses mee doen. Het gaat dan bijvoorbeeld om het labelen en de juiste naamgeving zodat we over hetzelfde praten."

"Zelfs commerciële ploegen staan nu al meer open voor het delen van data. Er wordt meer samengewerkt dan je soms zou denken"

Auke Damstra (Managing director Sport Data Valley)

Data in eigen beheer

Aan het delen van data zitten veel facetten en privacy en concurrentiegevoeligheid spelen daarbij een grote rol. Dit zijn dan ook zaken waar Sport Data Valley extra aandacht voor heeft. "Wij willen een faciliteit bieden waarbij je je data niet hoeft te delen, maar waarbij je data in eigen beheer houdt en daar op analyses kunt doen. Zonder dat je je data aan een bedrijf geeft." Damstra merkt dat veel organisaties hun data wel willen delen als ze daar iets voor terugkrijgen. "Zelfs commerciële ploegen staan daar nu al meer open voor. Er wordt meer samengewerkt dan je soms zou denken."

Sport Data Valley 2.0

De Sport Data Valley zoals die nu op Sportinnovator.nl is te vinden noemt Damstra versie 1.0. "Dat is ook deels een sociaal netwerk voor sportinnovatoren. We zijn nu met zogenaamde data experience labs en data stewards bezig om daar data te analyseren en te structuren. Al die kennis willen we gebruiken om volgend jaar zomer een versie 2.0 op te leveren."

De eerste data-steward vanuit de Sport Data Valley, Stephan van der Zwaard, is sinds 1 november aan de slag gegaan bij Innovatielab Thialf. Labmanager Inge Stoter ziet nu al de voordelen van zijn expertise binnen het team. "Hij is gekoppeld aan het onderzoeksproject van Ruby Otter (docent/onderzoeker aan de Hanzehogeschool Groningen red.) over trainingsbelasting van schaatsers. Daarbij willen we vooral hartslag en snelheid gesynchroniseerd binnenhalen en terugkoppeling geven aan de coaches. Daar zit een heel team omheen en hij zorgt met aanvullende expertise dat de data op orde komt, waardoor het geautomatiseerd binnengehaald en gestructureerd wordt, zodat we de data makkelijk kunnen delen en analyseren."

Delen met andere sporten

Het is vanuit de Sport Data Valley gezien ook vooral zaak dat die verkregen data ook voor andere sporten is te gebruiken. "Trainingsprincipes zijn natuurlijk in meerdere sporten toepasbaar. Nu heb je het probleem dat ik mijn data heel anders heb georganiseerd dan bijvoorbeeld het wielrennen of het IRIS-project vanuit het roeien. Als we kennis willen overbrengen tussen verschillende sporten, dan is het heel efficiënt als we tenminste dezelfde datastructuur hebben. Op dat soort onderdelen ondersteunt de data-steward."

"Als we kennis willen overbrengen tussen verschillende sporten, dan is het heel efficiënt als we tenminste dezelfde datastructuur hebben"

Inge Stoter (Labmanager Innovatielab Thialf)

Extra expertise

De schaatswetenschappers die in Innovatielab Thialf onderzoek doen, hebben zo extra expertise bij het team op het gebied van dataverwerking. "Ze worden door de steward geassisteerd bij het sneller binnen halen van die data. Dat zijn veelal automatiseringsprocessen, waarbij de data stewards hun kennis van het programmeren van scripts inzetten. Daarmee geven ze zo’n versnelling aan het onderzoek. Ik zie de steward daarom ook als een soort buitenboordmotor met extra expertise om het onderzoek te versnellen."

Kleine stapjes

Innovatielab Thialf en Sport Data Valley zijn een samenwerking aangegaan voor twee jaar. Stoter: "Wij proberen ook voor hen de vragen uit de praktijk te halen. De ambitie is heel groot maar je moet met kleine stapjes beginnen. Die kleine stapjes proberen we zo concreet mogelijk te maken voor Sport Data Valley, zodat we stap voor stap verder kunnen komen."

Begin volgende jaar wordt vanuit Sport Data Valley een tweede Data Experience Lab, gericht op breedtesport, geopend in Amsterdam.

Meer informatie over Sport Data Valley is te vinden op www.sportdatavalley.nl