Lese- und Lernempfehlungen Data Science

Inzwischen dürfte selbst den größten Zweiflern klar geworden sein, daß sich mit der künstlichen Intelligenz viel ändern wird. Die Firma von morgen ist intelligent.

Heute möchte ich Ihnen Lernquellen vorstellen, die sich mit dem großen Thema der Data Science und des Deep Learning befassen.

Deep Learning

Das Buch „Deep Learning – An MIT Press book“ (Goodfellow-et-al-2016) ist eine Art Bibel für das große Thema des Deep Learnings. Das Buch ist in die folgenden drei Hauptkapitel gegliedert:

  • „Part I: Applied Math and Machine Learning Basics
  • Part II: Modern Practical Deep Networks
  • Part III: Deep Learning Research“

Wie Sie sehen, bekommen Sie dort einen Überblick über die Basics und erhalten einen tieferen Einblick in aktuelle Deep Learning Netzwerke, sowie einen Ausblick auf die zukünftige Entwicklung.

Der Link, den ich Ihnen weiter unten angefügt habe, führt Sie direkt in die Online Version dieses Buches – wo Sie sich selbst ein Bild machen können.

Mir gefällt neben den Inhalten, daß die Autoren mit umfangreichem Detailwissen glänzen, und, daß zwar Mathematik vorkommt, die Inhalte aber auch ohne sie zu verstehen sind.

Prediction Algorithms

Vorhersagealgorithmen gehören im weitesten Sinne zudem KI Verfahren. Der kurze Artikel „Prediction Algorithms in One Picture“ gibt einen kurzen Überblick über die Charakteristika der einzelnen Verfahren.

Diesen Überblick finde ich hilfreich, aber auch die Verweise auf die weiteren Zusammenfassungen, die innerhalb des Artikels genannt werden (und dort verlinkt sind).

Data Sciences

Zum großen Themenbereich der Data Sciences kann ich den Kurs „Big Data Analytics“ vom Hasse Plattner Institut ebenso empfehlen, wie das offene Buch mit dem Titel „Data Science Live Book„.

Buch

Das erwähnte Buch dokumentiert die unterschiedlichen Teilschritte und Verfahren in einem KI Projekt. Themen sind die explorative Datenanalyse, Verfahren zur Datenvorbereitung, die Vorgehensweise bei der Auswahl von Variablen, oder die Vorgehensweise beim Performancetuning.

Gut finde ich, daß neben den Erläuterungen jeweils Beispiele gezeigt werden, sowie der Programmcode, um die gezeigten Daten auszuwerten.

Kurs

Der erwähnte Kurs wird von Prof. Dr. Emmanuel Müller gehalten – für mich ist es nicht sein erster Kurs. Er gibt – in der vom HPI gewohnten Tiefe und Qualität – einen Komplettüberblick über die Verfahren zur Analyse großer Datenmengen.

Es kommen dort Themen vor, wie

  • Datenexploration
  • Statistische Grundlagen
  • Clustering — unüberwachtes Lernen
  • Klassifikation — überwachtes Lernen
  • Frequent Pattern Mining — Suche nach häufigen Mustern
  • Outlier Mining — Ausreißererkennung

Zu den Grundlagen und zum Clustering hatte ich schon Einiges gehört. Daher bin ich erst einmal nur kurz über die Kapitel und die entsprechenden Videos gegangen.

Die Themen Klassifikation, Frequent Pattern Mining, und Outlier Mining stehen bei mir gerade in Projekten an, und ich habe Müllers Erklärungen für einen Refresher genutzt, bzw bin noch dabei.

Dabei werden auch einige leistungsfähige neuere Verfahren gezeigt, die ich noch nicht kannte. Insbesondere sind einige von diesen Verfahren am HPI entwickelt worden.

Gut wie immer ist das enorme Fachwissen, daß man hier kostenlos und in gut verständlichen Worten bekommt, sowie die hohe Qualität der Produktion (Video und Lesestoff).

Weiterführende Informationen

Das Original dieses Artikels ist auf Der Produktmanager erschienen (©Andreas Rudolph). Folgeartikel zum Thema gibt es über die (→Mailingliste), oder indem Sie →mir auf Twitter folgen.

In der Online Version des Artikels finden Sie hier die versprochenen weiterführenden Links:

Comments are closed.