
"Das Hasso-Plattner-Institut ist ein gutes Beispiel für Innovation im institutionellen Bereich, für Innovation in den Lern- und Arbeitsabläufen im Sinne einer gelebten Interdisziplinarität." Günter Stock, Präsident der Berlin-Brandenburgischen Akademie der Wissenschaften
Open Course Design Thinking: d.school-Referent Thomas Both zu Gast
Aufgrund der großen Nachfrage gibt es einen weiteren Open Course Design Thinking vom 31. Mai bis 2....
Bewerbungsschluss HPI-Schülerkolleg
HPI-Schülerkolleg geht 2012 in sein viertes Jahr. Bis zum 6. Juni können sich interessierte und...
Hochschulinformationstag am HPI
Am 8. Juni 2012 findet der Hochschulinformationstag der Universität Potsdam auf dem Campus...
HPI Alumni Homecoming Event 2012
Die zentrale Begegnungsveranstaltung für die Ehemaligen des HPI feiert 2012 gleich mehrere...
Future SOC Symposium am HPI
Vom 14. bis zum 15. Juni 2012 findet das siebte Future SOC Symposium statt.
Zertifikatsverleihung HPI-Schülerkolleg 2011/12
15 Seminareinheiten in je 3 bis 4 Modulen haben die rund 55 Schülerinnen und Schüler abgeschlossen,...
Hier finden sie die Hinweise zum Lehrangebot in den Bachelor- und Master-Studiengängen IT-Systems Engineering im laufenden Semester.
Ein Archiv mit dem Lehrangebot älterer Semester finden sie hier.
Scalable Data Analysis Algorithms (WS2011/2012)
Dozent: Prof. Dr. Felix Naumann, Arvid Heise (Information Systems)Beschreibung |
|
Um die immer schneller ansteigende Menge an Daten zuverlässig zu verarbeiten und analysieren, hat Google 2004 das MapReduce Programmiermodell vorgestellt [1]. Probleme werden in kleine leicht parallelisierbare Unterprobleme formuliert und können dann in einem Cluster oder einer Cloud ausgeführt werden. Somit werden auch große Datenmengen beherrschbar. In diesem Seminar untersuchen wir die Umsetzung von größeren Datenverarbeitungsproblemen auf zwei skalierbaren Plattformen. Je eine 2er Gruppe wird ein Problem auf dem populären Hadoop Framework [2] und dem neuen Stratosphere Projekt [3] umsetzen. Anschließend wird die Gruppe beide Lösungen vergleichend auf dem Lehrstuhlcluster (10 Maschinen) evaluieren.
|
|
Anforderungen |
|
none |
|
Lern- und Lehrformen |
|
Seminar |
|
Literatur |
|
[1] Jeffrey Dean and Sanjay Ghemawat. 2008. MapReduce: simplified data processing on large clusters. Communications of the ACM 51 [3] http://www.stratosphere.eu/ [4] Anand Rajaraman and Jeff Ullman. 2010. Mining of Massive Datasets. http://infolab.stanford.edu/~ullman/mmds.html |
|
Leistungserfassungsprozess |
|
|
|
Termine |
|
|
|
| Allgemeine Informationen | |
ID: |
13 L 1356 |
Kennung: |
ITSE,VT OSIS |
SWS: |
4 |
ECTS Credit Points: |
6 (benotet) |
Einschreibefrist: |
2.11.2011 |
Studiengang: |
IT Systems Engineering (Master) |
Themenmodul: |
Vertiefungsgebiete |
Lehrform: |
Seminar |
Belegungsart: |
Wahlfach |
Themenkomplex: |
|
Vertiefungsgebiet: |
Systems Integration, Information Systems |

