Das WPF 45 WEB-Data-Mining wird von mir und Frau Prof. Dr. Edda Leopold in unregelmäßigen Abständen, jetzt wieder im Sommersemester 2012 angeboten.

Fragen, die in diesem WPF behandelt werden, sind unter anderem:

  • Wie bringen Suchmaschinen die Ergebnisse einer Suchanfrage in eine vernünftige Reihenfolge?
  • Wie funktioniert der PageRank-Algorithmus?
  • Wie deckt man in sozialen Netzwerken oder anhand von Verbindungsdaten Gruppen von Individuen auf, die zusammen gehören?
  • Wie erzeugt man Profile von Internetnutzern, um deren Verhalten vorherzusagen oder Werbemaßnahmen zielgerecht zu platzieren? (Beispiel: Amazon)
  • Wie funktionieren WebCrawler?
  • Was kann man automatisch Text aus bestehenden Internetquellen mit Wrappern extrahieren und klassifizieren?
  • Wie betreibt man Meinungsforschung im Internet, also z..B. ob ein bestimmter Text einem Produkt positiv oder negativ gegenübersteht?
  • Was versteht man unter WEB Usage-Mining?
  • Wie kann man die Analyse und Mustersuche in Web-Server-Log-Dateien durchführen?

Die ersten Sitzungen werden in Vorlesungform gestaltet. Es werden Grundlagen des Information Retrievals und des Data Minings behandelt, die im Web Data Mining benutzt werden. Danach schließen sich Referate über verschiedene Themen des Web Data Mining an. Das Fach kann auch in englischer Sprache (Referat) belegt werden.

Als Prüfungsleistung werden ein eigener Vortrag und eine Ausarbeitung erwartet.

Die Anmeldung erfolgt über die WPF-Anmeldung. Alle weiteren Unterlagen sind im ILIAS-System zu finden. Die Referate werden am ersten WPF-Termin, also am 20.3.12 um 14:00 in Raum 2.108 (erstes Treffen) vorgestellt.