Veröffentlicht: von

Big Data ist heutzutage in aller Munde. Nach wie vor sollten solche Datenmengen in Datenbanksystemen abgelegt werden. Die Entwicklung nicht-relationaler, verteilter NoSQL Datenbanksysteme hat in den letzten Jahren einen beispiellosen Aufschwung erlebt. Zwei zentrale Probleme haben diesen Prozess angestoßen: die gewaltigen Mengen von Daten, die von den Benutzern selber erzeugt werden (User Generated Content) in modernen Anwendungen und die damit einhergehenden Anfragelasten und Datenvolumnia, sowie der Ruf von Entwicklern nach problemspezifischen Datenmodellen und Schemaflexibilit.

In dieser Abschlussarbeit sollen Entscheidungskriterien (Performance, Skalierbarkeit, Abfragesprache, Reifegradetc.) herausgearbeitet werden, welcher Typ von NoSQL-Datenbanken für welche Anforderung geeignet ist. Ergebnis sollte eine Entscheidungshilfe sein, welches NoSQL-System für eine konkrete Anforderung am besten geeignet ist.

Falls Sie Interesse am Thema haben, melden Sie sich bitte per Mail bei mir: Heide.Faeskorn-Woyke@th-koeln.de

Veröffentlicht: von

In Kooperation mit den Dienes Werken in Overath suchen wir eine Absolventen*in, die/ der sich mit dem Thema Industrie 4.0 und Times-Series-Datenbanken, sowie Visualisierung der untersuchten Maschinendaten auseinandersetzen soll.

Nähere Informationen  finden  Sie hier: Datenmodellierung und Reporting mit einem BI Tool

Falls Sie  Interesse am Thema haben, melden Sie sich bitte per Mail bei mir: Heide.Faeskorn-Woyke@th-koeln.de

Veröffentlicht: von

Der BVM Berufsverband Deutscher Markt- und Sozialforscher schreibt 2018 zum zweiten Mal den Data Science Cup aus. Der Data Science Cup eröffnet einen praktischen Zugang zu Big Data Science und bietet Interessierten die Möglichkeit, Data Science „hands-on“ zu erleben und dabei explizite Aufgabenstellungen zu bearbeiten.

Die Datengrundlage für den diesjährigen Data Science Cup bildet der American Community Survey (ACS) 2016. Der ACS wird jährlich durchgeführt und umfasst ca. 1% der Gesamtbevölkerung. Dabei werden umfangreiche soziodemographische Daten (Bildung, Herkunft, Einkommen etc.) auf Granularität der sogenannten Public Use Microdata Areas (PUMAs) erhoben. Für den Data Science Cup wurden diese Daten mit Daten zur US-Präsidentschaftswahl 2016 angereichert. Da die ACS-Daten im Original öffentlich verfügbar sind, wurde vorab eine Anonymisierung durchgeführt.

Der Preis richtet sich an Datenanalysten, Data Miner, Data Scientists oder IT-Spezialisten – also an alle, die sich mit dem Thema beschäftigen. Am Wettbewerb teilnehmen können auch Teams und Interessierte, die nicht primär in der Marktforschungsbranche tätig sind.

Die vier Aufgabenbereiche auf Grundlage der bereitgestellten ACS-Daten sind:

    Imputation fehlender Werte
    Ausreißer-Erkennung
    Vorhersage von Wahlergebnissen
    Optimierung der Wahlbezirke aus Sicht der kandidierenden Parteien

 

Die Lösungen können online bis zum 6. Mai 2018 eingereicht werden.

Veröffentlicht: von

Die diesjährige Apex Connect findet vom 24. – 26. April 2018 in Düsseldorf statt und bietet Studenten freien Zugang zu allen Themen rund um Oracle Application Express (APEX), PL/SQL und JavaScript

Wer sich für die Einzelheiten interessiert, findet hier: 2018-NextGen-Programm_APEX_Connect_2018 nähere Informationen.

Bitte melden Sie sich per Mail bei mir heide.faeskorn-woyke(at)th-koeln.de, falls Sie teilnehnem möchten.

Veröffentlicht: von

 

Informatikstudierende (Markus Döring, Roland Müller, Teodora Petrisor, Victor Petrusca, Marcel Wiaterek, Alexander Zautke) der TH Köln, Campus Gummersbach gewannen den Student-Pokal der HL7 FHIR-Dev Days in Amsterdam. Bei ihrer Guided Project Präsentation geht es um eine Suchmaschine,  die auf dem FHIR-Standard  beruht. In einer mobilen NLP (Natural Language Processing) Applikation kann der Benutzer Anfragen an eine Medizindatenbank richten, die durch ein Metadatenmodell in exakte Abfragen umgewandelt  werden. Die  Daten werden in der NoSQL-Datenbank couchdb gespeichert und mit mango query abgefragt. Der Standard FHIR (Fast Healthcare Interoperability Resources, ausgesprochen wie englisch fire) wurde von Health Level Seven International (HL7) verabschiedet. Der Standard unterstützt den Datenaustausch medizinischer Softwaresysteme.