Hasso-Plattner-InstitutSDG am HPI
Hasso-Plattner-InstitutDSG am HPI
Login
  • de
 

27.06.2008

Potsdam. Fünf Studenten des HPI haben gemeinsam eine neuartige Lösung für die Fusion von Dubletten in Kundendatenbanken entwickelt. Das Projekt wurde in Kooperation mit der FUZZY! Informatik AG, einem führenden Unternehmen im Bereich der Datenqualitätssicherung, durchgeführt. Das Ergebnis wurde beim „Bachelorpodium“ am 27. Juni vorgestellt, zu dem rund 200 Entscheider aus Politik, Wirtschaft, Wissenschaft und Gesellschaft nach Potsdam gekommen waren.

„Für effektive Individualkommunikation mit Kunden ist es notwendig, dass die Kundeninformationen stets korrekt und aktuell sind. Oft sind Kundendaten durch Buchstabendreher bei der Erfassung doppelt im System vorhanden“, erklärte Ziawasch Abedjan, Sprecher der Bachelorprojektgruppe. „Das führt zu Doppelaussendungen, verursacht Mehrkosten und verärgert Kunden“. Für die Erkennung von Duplikaten innerhalb einer Datenbank gibt es bereits bewährte Werkzeuge, unter anderem von dem Kooperationsunternehmen FUZZY! Informatik AG. Das Studententeam beschäftigte sich mit dem darauf folgenden Arbeitsschritt und entwickelte mit „Fuzzy Fuz!on“ eine Lösung, die erkannte Dubletten nach Anweisungen des zuständigen Mitarbeiters automatisch zusammenführt. Wichtig war, dass der Fusionsprozess weitgehend automatisch abläuft, da die zu bearbeitenden Datenmengen in der Regel sehr groß sind – etwa wenn zwei Unternehmen fusionieren und ihre Kundendatenbestände vereinigen. Deshalb ist eine manuelle Fusion, die ebenso durch die Anwendung unterstützt wird, zu zeitintensiv.

„Ein Mensch kann bei zwei Geburtsort-Einträgen wie „Berlin“ und „Brelin“ sehr leicht erkennen, welcher der richtige ist. Unsere Aufgabe war es, mit einer Software automatisch zum richtigen Ergebnis zu kommen“, erklärte Abedjan. Dies wurde über Häufigkeitsanalysen oder den Vergleich des Datensatzes mit korrespondierenden Daten gelöst.

Auch wenn die Entscheidungen über „richtige Daten“ von Dubletten für den Computer zu schwer zu entscheiden ist und ein Mitarbeiter manuell fusionieren muss, wird er dabei von der neuen Software unterstützt. Dem Nutzer ist es nicht nur möglich, die vorhandenen Widersprüche innerhalb der Datensätze schnell zu erfassen, sondern auch auf Fusionsvorschläge des Systems zurückzugreifen.

Die Bachelorprojektgruppe wurde von Prof. Dr. Felix Naumann, Leiter des Fachgebiets Informationssysteme betreut. Der Lehrstuhl beschäftigt sich mit unterschiedlichen Aspekten der Sicherung von Informationsqualität. Eine effektive Datenfusion stellt dabei einen wichtigen Grundbaustein dar.

Bachelorpodium – Ausweis der praxisnahen Ausbildung am HPI

Beim „Bachelorpodium“ des Hasso-Plattner-Instituts präsentieren Bachelorstudenten seit 2005 jedes Jahr einer interessierten Öffentlichkeit die Ergebnisse ihrer Praxis-Projekte, die sie in Teams von vier bis acht Studenten am Ende ihres Bachelorstudiums absolviert haben. Sie zeigen, wie sie zwei Semester lang - von ihren Professoren angeleitet - größere praktische Aufgaben der Informationstechnologie eigenverantwortlich angepackt und welche innovativen Lösungen für Wirtschaft und Gesellschaft sie dabei entwickelt haben. Projektgeber sind renommierte Unternehmen und Institutionen aus ganz Deutschland. Eine Übersicht über die laufenden Projekte gibt die HPI-Internetseite www.hpi.uni-potsdam.de/lehre/studienprojekte/bachelorprojekte.html.

Kurzprofil Hasso-Plattner-Institut

Das Hasso-Plattner-Institut für Softwaresystemtechnik GmbH (HPI) in Potsdam ist Deutschlands universitäres Exzellenz-Zentrum für IT Systems Engineering. Als einziges Universitäts-Institut in Deutschland bietet es den Bachelor- und Master-Studiengang „IT-Systems Engineering“ an – eine praxisnahe und ingenieurwissenschaftlich orientierte Alternative zum herkömmlichen Informatik-Studium, die von derzeit circa 400 Studenten genutzt wird. Insgesamt 50 Professoren und Dozenten sind am HPI tätig. Es betreibt exzellente universitäre Forschung – auch für erste Adressen der Wirtschaft. Vor allem geht es um Grundlagen und Anwendungen für große, hoch komplexe und vernetzte IT-Systeme.

Hinweis für Redaktionen:
Gerne stellen wir für Interviews Kontakt zu den Studenten her. Druckfähige Bilder der Veranstaltung und der Bachelorstudenten mailen wir Ihnen auf Nachfrage gerne zu!