Data Science – Ressourcen zum selber lernen


Anzeige
Data-Science ist ein interdisziplinäres Feld, in dem wissenschaftliche Methoden, Prozesse, Algorithmen und Systeme angewandt werden, um Wissen und Einsichten aus großen Datenmengen zu ziehen. Anders gesagt: Data-Scientists wenden wissenschaftliche Methoden an, um Muster oder Einsichten zu gewinnen, auf deren Basis Unternehmen Vorgänge optimieren und bessere Entscheidungen treffen können.
Nix mehr verpassen: Die t3n Newsletter zu deinen Lieblingsthemen! Jetzt anmelden
In den letzten Jahren hat die Nachfrage nach Data-Scientists dementsprechend rasant zugenommen. Der Einstieg ist jedoch gar nicht so einfach. Naturwissenschaftler mit Statistikkenntnissen haben ganz gute Karten, aber auch sie müssen sich eine ganze Reihe weiterer zusätzlicher Kenntnisse aneignen. Meistens hapert es an den technischen Skills. Da hattet ihr zwar Statistik I, II und III an der Uni belegt und alle drei bestanden, Python, die in der Datenwissenschaft meistgenutzte Programmiersprache, aber noch nie auch nur eines Blickes gewürdigt. Überhaupt, Programmiersprachen lernt man an der Uni in den Fachbereichen Physik oder Biologie wahrscheinlich nicht.
An dieser Stelle anzusetzen, ist wahrscheinlich nicht die schlechteste Idee. Bevor ihr Python entsprechend nutzen könnt, solltet ihr erstmal die Grundkonzepte der Sprache verstehen lernen. Wer keine Erfahrung hat, dem seien die kostenlosen Einsteigerkurse von Codecademy* ans Herz gelegt. Dort schreibt ihr von der ersten Lektion an kleine Programme und lernt so die Basics – Syntax, Funktionen, Loops, Klassen, Module und sowas. Codecademy bietet außerdem ein kostenpflichtiges Pro-Programm, in dem ihr zusätzliche Projekte bearbeiten könnt. Ob sich das im Einzelfall lohnt, müsst ihr selbst entscheiden.
Anzeige Datenanalyse mit Python
Wenn ihr euch mit den Python-Basics – oder auch gerne darüber hinaus – einigermaßen sicher fühlt, könnt ihr anfangen, euch mit Datenanalyse und wie ihr Python dabei einsetzen könnt, zu befassen. Ein Blick wert ist dafür zum Beispiel dataquest.io – dort findet ihr relativ viele kostenfreie Inhalte – und Lernpfade für Datenanalysten, Data-Scientists und Dateningenieure. Wer doch ein bisschen Geld über hat, das sie oder er in Bildung investieren kann und will, ist ganz gut damit beraten, es in ein paar Monate Premiummitgliedschaft bei dataquest.io zu stecken – Kostenpunkt zwischen 24,50 und 49 US-Dollar pro Monat, abhängig von dem Modell, für das ihr euch entscheidet.
Anzeige
Wenn ihr euch für die Investition entschieden habt, habt ihr durch den Dataquest-Kurs wahrscheinlich einen ganz guten Überblick über Machine Learning mit Python gewonnen. Wenn nicht, nehmt euch am Besten Scikit-Learn vor – eine der meistgenutzten Machine-Learning-Libraries. Die Doku ist ziemlich gut und ausführlich – dort findet ihr Tutorials ohne Ende. Außerdem einen Blick wert ist das GitHub-Repo von Andreas Mueller – einer der Core-Entwickler der Library. Dort findet ihr Bücher, Slides und Notizen zu Workshops, die Mueller wohl ab und an gibt. Wenn ihr das durch habt, könnt und solltet ihr euch an kleineren Machine-Learning-Projekten versuchen – Programmieren lernt ihr am Besten, indem ihr es einfach macht!
https://samplecic.ch/data-science-ressourcen-zum-selber-lernen.html
Комментарии
Отправить комментарий