CWI promovendus ontwikkelt nieuwe technieken voor verkennen data

Promovendus Thibault Sellam van het Centrum Wiskunde Informatica (CWI) heeft nieuwe technieken ontwikkeld om grote databases te verkennen. Vorige week verdedigde hij zijn proefschrift.

Trefwoorden: #CWI, #databasemanagement, #query, #SQL, #Thibault Sellam, #verkennen data

Lees verder

research

( Foto: screenshot Findviews )

ENGINEERINGNET.NL - Met zijn nieuwe technieken kunnen gebruikers interessante informatie in databases vinden zonder noemenswaardige kennis van de data vooraf.

Sellam voerde zijn onderzoek uit in de Database Architectures (DA) groep van het CWI, onder begeleiding van prof. dr. Martin Kersten en gefinancierd door het nationale onderzoeksprogramma COMMIT/.

Databasemanagementsystemen sluiten impliciet een overeenkomst met de gebruiker. Ze geven snelle en correcte antwoorden in ruil voor precieze en complete vragen, correct gesteld in een query-taal zoals SQL.

Dit is een probleem voor gebruikers die alleen op zoek zijn naar interessante feiten zonder veel kennis van de database en de inhoud ervan. Zij doen dit vaak via trial-and-error, wat erg vermoeiend en foutgevoelig is voor grote databases.

Sellam presenteert vier database-assistenten die gebruikers helpen om interessante query’s te formuleren en bij te schaven:

  1. Claude stelt hypotheses op voor databases door statistische afhankelijkheden tussen verschillende dimensies van de database te gebruiken
  2. Blaeu helpt gebruikers om query’s te formuleren door hen clusters van objecten te laten selecteren
    Ziggy laat zien wat een selectie objecten uniek maakt door de verschillen met de rest van de database te laten zien
  3. Raimond detecteert en organiseert tekstfragmenten die een nieuwswaardige gebeurtenis beschrijven, bijvoorbeeld op social media.

    (Guy Leyen) (bron:CWI)