Fra trainees til kompetente Business Data Science konsulenter

Spændende at opleve, hvor ivrige vores konsulenter er efter viden, der går længere end lærebogen. De tager overhalingsbanen i ambitionen om at arbejde med det nyeste inden for data science.

I deres traineeforløb fik de erfaring med at følge Rooftop’s Best Practice, og nedbryde en forretningsidé, anvende domæne viden og levere en god Data science løsning i vores pilotprojekt. Her sigter vi mod at kunne forudsige 'straffens størrelse i en domfældelse, såvel som varigheden indtil en domsfældelse falder, baseret på domme fra den Anklagemyndighedens Vidensbase.

Byrettens domme ligger online i PDF-format, og dele af data var faktisk allerede gjort tilgængelige i HTML-format, men i en mangelfuld kvalitet, der ikke kunne bruges til formålet. Derfor udviklede Tobias og Kristian OCR-teknikker, der forbedrede kvaliteten betydeligt. Efterfølgende gik opgaven up på at fremfinde og udvælge relevant data fra dommene og strukturere data i tabelform, så datagrundlaget kan anvendes i analytics og prædiktionerne kan udvikles ved brug af maskinlæring.

Casen er super spændende, og vi fortsætter til næste trin, hvor vi vil anvende weakly supervised machine learning, f.eks. Snorkel, som vores data science teknik til at udvælge og label relevante enheder og enhedsrelationer, der er vigtige for forudsigelsesopgaven.

I praksis betyder det, at vi baseret på type af kriminalitet, specifik sagsinformation og ordlyden i anklagen fra dommene, har ambition om at kunne forudsige længden af en domsfældelse, såvel som varigheden indtil en domfældelse sker.
Vi forventer at opnå et godt resultat, der kan understøtte startup-virksomheden, Ilas ApS i deres næste udviklingsfase.