Wanneer er gesproken wordt over datagedreven werken komt ook de term informatiegedreven werken vaak voorbij. Deze termen betekenen niet hetzelfde. Datzelfde geldt voor data en informatie. Toch worden de termen vaak door elkaar gebruikt, logisch, omdat je vaak met beiden te maken hebt in het geval van een datagedreven organisatie.
Het verschil tussen data en informatie
Data zijn gegevens, bijvoorbeeld cijfers of ruwe tekst, die worden verzameld. Data is feitelijk en bevat dus geen enkele vorm van interpretatie. Wanneer je data structureert en interpreteert levert dat informatie op.
Wanneer je bijvoorbeeld voor een jaar lang elke week de prijs van een product in de supermarkt bijhoudt creëer je data. Wanneer je deze data interpreteert ontstaat er informatie en kom je er bijvoorbeeld achter dat het afgelopen jaar het product duurder is geworden.
Met data op zichzelf kunnen we dus niet zoveel. Maar data vormt wel het fundament van informatie.
Datagedreven versus informatiegedreven
Informatiegedreven werken is daarmee een smaller begrip dan datagedreven werken. Bij datagedreven werken begin je vanuit ruwe data informatie te halen om deze vervolgens te interpreteren. Hiermee heb je informatie gecreëerd om je beslissingen op te baseren.
Daarmee wordt ook het risico van informatiegedreven werken duidelijk. Informatiegedreven werken gebeurt bijvoorbeeld wanneer een besluitnemer een data dashboard gebruikt dat gemaakt is door een collega. De besluitnemer neemt zijn beslissingen op basis van de informatie in het dashboard en houdt zich niet bezig met de onderliggende data waarop de inzichten gebouwd zijn.
Hierdoor ontstaat het risico dat de besluitnemer verkeerde aannames doet. Vaak heeft de besluitnemer geen helder beeld bij welke aanpassingen aan de data zijn gedaan om er informatie uit te halen. Zo kan het zijn dat de collega dubbele datapunten of hele opvallende datapunten (‘outliers’) verwijderd heeft of een steekproef heeft genomen van de data. Hierdoor kan de informatie door de besluitnemer anders begrepen worden dan zou moeten.
Wanneer er informatiegedreven gewerkt wordt blijft het daarom altijd belangrijk om te weten hoe informatie tot stand is gekomen.
Het verwerken van data tot informatie
Data is dus benodigd om informatie te creëren. Dit klinkt eenvoudiger dan het is. Zoals hierboven omschreven kan data op meerdere manieren gestructureerd worden. Hierdoor kom je tot verschillende soorten informatie, welke op verschillende manieren geïnterpreteerd kunnen worden.
Cijfers over een periode van een maand zul je bijvoorbeeld niet met een periode van een jaar moeten vergelijken. Nu wijst dat voor zich, maar maanden worden wel vaak met elkaar vergeleken. Terwijl de ene maand langer is dan de andere maand. Daarnaast heeft bijvoorbeeld de ene maand soms meer werkdagen dan de andere maand, wat ook van invloed kan zijn op je data. Wanneer je de data van twee maanden vergelijkt om informatie te creëren vergelijk je eigenlijk twee ongelijke datasets. Dit hoeft geen probleem te zijn, een dergelijk verschil is acceptabel.
Lastiger wordt het al wanneer je tekstuele data gaat vergelijken. Bijvoorbeeld: is klantreview A positiever dan klantreview B? Wanneer de twee reviews enigszins vergelijkbaar zijn zullen mensen tot verschillende conclusies komen. Je kan reviews en het sentiment daarvan ook automatisch met een algoritme laten beoordelen. Maar ook in dit geval is het belangrijk te weten welke regels gebruikt worden om data te structureren en er informatie uit te halen. Bijvoorbeeld, worden de stopwoorden en leestekens uit de reviews gehaald of op welke manier wordt een review door het algoritme op sentiment beoordeeld. Door hier aandacht voor te hebben kan je naast het geven van de conclusie dat de klantreviews positiever geworden zijn hier ook een disclaimer bij geven.
Bij het verwerken van data tot informatie en het verstrekken daarvan aan anderen is het dus belangrijk duidelijk naar jezelf en anderen te communiceren:
Welke soort data gebruikt wordt en uit welke tijdsperiode (verstrek bijvoorbeeld een sample van de oorspronkelijke ruwe data).
Op welke manier de data verzameld is en of hier onregelmatigheden in zaten.
Welke methoden gebruikt gaan worden om de data te voorbewerken, te filteren en te structureren.
Comments