Veröffentlicht: von

Big Data ist heutzutage in aller Munde. Nach wie vor sollten solche Datenmengen in Datenbanksystemen abgelegt werden. Die Entwicklung nicht-relationaler, verteilter NoSQL Datenbanksysteme hat in den letzten Jahren einen beispiellosen Aufschwung erlebt. Zwei zentrale Probleme haben diesen Prozess angestoßen: die gewaltigen Mengen von Daten, die von den Benutzern selber erzeugt werden (User Generated Content) in modernen Anwendungen und die damit einhergehenden Anfragelasten und Datenvolumnia, sowie der Ruf von Entwicklern nach problemspezifischen Datenmodellen und Schemaflexibilit.

In dieser Abschlussarbeit sollen Entscheidungskriterien (Performance, Skalierbarkeit, Abfragesprache, Reifegradetc.) herausgearbeitet werden, welcher Typ von NoSQL-Datenbanken für welche Anforderung geeignet ist. Ergebnis sollte eine Entscheidungshilfe sein, welches NoSQL-System für eine konkrete Anforderung am besten geeignet ist.

Falls Sie Interesse am Thema haben, melden Sie sich bitte per Mail bei mir: Heide.Faeskorn-Woyke@th-koeln.de

Veröffentlicht: von

Der BVM Berufsverband Deutscher Markt- und Sozialforscher schreibt 2018 zum zweiten Mal den Data Science Cup aus. Der Data Science Cup eröffnet einen praktischen Zugang zu Big Data Science und bietet Interessierten die Möglichkeit, Data Science „hands-on“ zu erleben und dabei explizite Aufgabenstellungen zu bearbeiten.

Die Datengrundlage für den diesjährigen Data Science Cup bildet der American Community Survey (ACS) 2016. Der ACS wird jährlich durchgeführt und umfasst ca. 1% der Gesamtbevölkerung. Dabei werden umfangreiche soziodemographische Daten (Bildung, Herkunft, Einkommen etc.) auf Granularität der sogenannten Public Use Microdata Areas (PUMAs) erhoben. Für den Data Science Cup wurden diese Daten mit Daten zur US-Präsidentschaftswahl 2016 angereichert. Da die ACS-Daten im Original öffentlich verfügbar sind, wurde vorab eine Anonymisierung durchgeführt.

Der Preis richtet sich an Datenanalysten, Data Miner, Data Scientists oder IT-Spezialisten – also an alle, die sich mit dem Thema beschäftigen. Am Wettbewerb teilnehmen können auch Teams und Interessierte, die nicht primär in der Marktforschungsbranche tätig sind.

Die vier Aufgabenbereiche auf Grundlage der bereitgestellten ACS-Daten sind:

    Imputation fehlender Werte
    Ausreißer-Erkennung
    Vorhersage von Wahlergebnissen
    Optimierung der Wahlbezirke aus Sicht der kandidierenden Parteien

 

Die Lösungen können online bis zum 6. Mai 2018 eingereicht werden.

Veröffentlicht: von

Die diesjährige Apex Connect findet vom 24. – 26. April 2018 in Düsseldorf statt und bietet Studenten freien Zugang zu allen Themen rund um Oracle Application Express (APEX), PL/SQL und JavaScript

Wer sich für die Einzelheiten interessiert, findet hier: 2018-NextGen-Programm_APEX_Connect_2018 nähere Informationen.

Bitte melden Sie sich per Mail bei mir heide.faeskorn-woyke(at)th-koeln.de, falls Sie teilnehnem möchten.

Veröffentlicht: von

 

Informatikstudierende (Markus Döring, Roland Müller, Teodora Petrisor, Victor Petrusca, Marcel Wiaterek, Alexander Zautke) der TH Köln, Campus Gummersbach gewannen den Student-Pokal der HL7 FHIR-Dev Days in Amsterdam. Bei ihrer Guided Project Präsentation geht es um eine Suchmaschine,  die auf dem FHIR-Standard  beruht. In einer mobilen NLP (Natural Language Processing) Applikation kann der Benutzer Anfragen an eine Medizindatenbank richten, die durch ein Metadatenmodell in exakte Abfragen umgewandelt  werden. Die  Daten werden in der NoSQL-Datenbank couchdb gespeichert und mit mango query abgefragt. Der Standard FHIR (Fast Healthcare Interoperability Resources, ausgesprochen wie englisch fire) wurde von Health Level Seven International (HL7) verabschiedet. Der Standard unterstützt den Datenaustausch medizinischer Softwaresysteme.

Veröffentlicht: von

  1. „Agile Entwicklung einer webbasierten Anwendung zur Automatisierung des Rekrutierungs- und Projektbesetzungsprozesses in einem IT-Consulting Unternehmen“, M.Toll., Januar 2017, Bachelorarbeit.
  2. „Intelligentes Wohnen durch den Einsatz eines Smart-Home-Systems auf einem Raspberry Pi Kleincomputer“,  Januar 2017, Mustafa Kamali, Masterabeit.
  3. „Recommender Systeme im e-Commerce, Prozess-gestütztes Vorgehen für eine effektive Integration von Recommender Systemen im e-Commerce Bereich“, Januar 2017, Andre Hassan, Masterarbeit.
  4. Visualisierung von Daten aus der Bundesliga 2011 /2012 durch eine Heatmap„, Februar 2017, Alexandre Wildt Graziani, Bachelorarbeit.
  5. „In-Memory OLTP in Microsofts SQL Server 2014, Analyse der Einsetzbarkeit bei der Grimme Landmaschinenfabrik GmbH & Co. KG“, Bastian Bothe, Februar 2017, Masterarbeit.
  6. „Einsatz von Körpersensoren und mobilen Geräten zur serverseitigen Erfassung und Auswertung von Gesundheitsdaten“, Februar 2017, Björn Flintrop, Masterarbeit.
  7. Virtual Reality Application in Data Visualization and Analysis„, Juli 2017, Xinzhou Zhang, Masterarbeit.
  8. Sentiment Analyse von informellen Kurztexten im Unternehmenskontext„, Juli 2017, Sebastian Haep, Masterarbeit.
  9. „Aufwandsschätzung und Kostenmodell für NoSQL-Migration“, August 2017, Steffen Diether, Bachelorarbeit.
  10. „Konzeption, Entwicklung und Bewertung einer dokumentenbasierten Volltextsuche im Rahmen eines Dokumentenmanagements“, August 2017, Tim Bollmann, Masterarbeit.
  11. Leistungsmessung und Leistungsbewertung von NoSQL-Datenbanken„, August 2017, Tiziano Lombardi, Masterarbeit.
  12. „Performancesteigerung einer Cognos-basierten BI-Anwendung mit Hilfe einer In-Memory Datenbank“, Oktober 2017, Eugen Roor, Bachelorarbeit.
  13. „Entwicklung eines Datenbanksystems für die mobile Erfassung von Produktionsdaten im Erwerbsgartenbau“, Oktober 2017, Ralph Elixmann, Bachelorarbeit.