Data Science mit Python - eLearning
450,00 EUR
- 50 hours
Der Kurs 'Python für Data Science' behandelt die grundlegenden Programmierkonzepte mit Python und erklärt Datenanalytik, maschinelles Lernen, Datenvisualisierung, Web-Scraping und die Verarbeitung natürlicher Sprache. Sie werden ein umfassendes Verständnis der verschiedenen Pakete und Bibliotheken erlangen, die für die Durchführung der Datenanalyse erforderlich sind.
Hauptmerkmale
Sprache
Kurs und Material sind auf Englisch
Niveau
Anfänger - Mittelstufe
Zugang
1 Jahr Zugang zur Selbstlern-eLearning-Plattform rund um die Uhr
6 Stunden Videomaterial
mit empfohlenen 40 Stunden Lernzeit & Übungen
Praktiken
Virtuelle Labore, Testsimulation, Abschlussprojekte
Keine Prüfung
Für den Kurs gibt es keine Prüfung, aber die Studierenden erhalten ein Zertifikat über die abgeschlossene Ausbildung
Bonus-Kurs gratis!
Grundlagen der Statistik für Data Science

Lernergebnisse
Am Ende dieses E-Learning-Kurses zu Data Science mit Python werden Sie in der Lage sein:
Erlangen Sie ein tiefgehendes Verständnis für Datenwissenschaftsprozesse, Daten-Aufbereitung, Datenexploration, Datenvisualisierung, Hypothesenerstellung und -prüfung.
Installieren Sie die erforderliche Python-Umgebung sowie weitere Hilfswerkzeuge und Bibliotheken.
Verstehen Sie die wesentlichen Konzepte der Python-Programmierung, wie Datentypen, Tupel, Listen, grundlegende Operatoren und Funktionen.
Führen Sie hochrangige mathematische Berechnungen mit dem NumPy-Paket und seiner umfangreichen Bibliothek mathematischer Funktionen durch.
Führen Sie hochrangige mathematische Berechnungen mit dem NumPy-Paket und seiner umfangreichen Bibliothek mathematischer Funktionen durch.
Führen Sie wissenschaftliches und technisches Rechnen mit dem SciPy-Paket und seinen Unterpaketen durch, wie Integrate, Optimise, Statistics, IO und Weave.
Führen Sie Datenanalyse und -manipulation mit den in dem Pandas-Paket bereitgestellten Datenstrukturen und Werkzeugen durch.
Erwerben Sie Expertise im maschinellen Lernen mit dem Scikit-Learn Paket
Verstehen Sie überwachte und unüberwachte Lernmodelle wie lineare Regression, logistische Regression, Clusterbildung, Dimensionsreduktion, K-NN und Pipeline.
Verwenden Sie das Scikit-Learn-Paket für die Verarbeitung natürlicher Sprache.
Verwenden Sie die matplotlib-Bibliothek von Python für die Datenvisualisierung
Extrahieren Sie wertvolle Daten von Websites durch Web-Scraping mit Python
Integrieren Sie Python mit Hadoop und MapReduce
Kursinhalt

Einführung in die Datenwissenschaft
Lektion 01
- Datenwissenschaft und ihre Anwendungen
- Der Datenwissenschaftsprozess: Teil 1
- Der Datenwissenschaftsprozess: Teil 2
Grundlagen der Python-Programmierung
Lektion 02
- Einrichten des Jupyter Notebooks
- Python-Funktionen
- Python-Datentypen und Sequenzen
- Tiefgehende Betrachtung von Python-Strings
- Python-Demo: Lesen und Schreiben von CSV-Dateien
- Datum und Uhrzeit in Python
- Objekte in Python Map
- Lambda und Listenverständnis
- Warum Python für Datenanalyse?
- Python-Pakete für Data Science
- StatsModels-Paket
- Scipy-Paket
NumPy
Lektion 03
- Grundlagen von NumPy
- Array-Formen und Achsen in NumPy: Teil A
- Formen und Achsen von NumPy-Arrays: Teil B
- Arithmetische Operationen
- Bedingte Logik
- Häufige mathematische und statistische Funktionen in Numpy
- Indizierung und Slicing
- Dateiverwaltung
Lineare Algebra
Lektion 03
- Einführung in die lineare Algebra
- Skalare und Vektoren
- Skalarprodukt zweier Vektoren
- Lineare Unabhängigkeit von Vektoren
- Norm eines Vektors
- Matrixoperationen
- Rang einer Matrix
- Determinante einer Matrix und Einheitsmatrix oder Operator
- Inverse einer Matrix sowie Eigenwerte und Eigenvektoren
- Analysis in der linearen Algebra
Grundlagen der Statistik
Lektion 05
- Bedeutung der Statistik im Bezug auf Data Science
- Allgemeine statistische Begriffe
- Arten von Statistiken
- Datenkategorisierung und -typen
- Messniveaus
- Maßzahlen der zentralen Tendenz
- Streuungsmaße
- Zufallsvariablen
- Sets
- Maße der Form (Schiefe & Kurtosis)
- Kovarianz und Korrelation
Wahrscheinlichkeitsverteilung
Lektion 06
- Wahrscheinlichkeit, ihre Bedeutung und Wahrscheinlichkeitsverteilung
- Wahrscheinlichkeitsverteilung: Binomialverteilung
- Wahrscheinlichkeitsverteilung: Poisson-Verteilung
- Wahrscheinlichkeitsverteilung: Normalverteilung
- Wahrscheinlichkeitsverteilung: Bernoulli-Verteilung
- Wahrscheinlichkeitsdichtefunktion und Massenfunktion
- Kumulative Verteilungsfunktion
- Zentraler Grenzwertsatz
- Schätzungstheorie
Fortgeschrittene Statistik
Lektion 07
- Verteilung
- Kurtosis, Schiefe und Students T-Verteilung
- Hypothesentest und Mechanismus
- Testergebnisse von Hypothesen: Fehler 1. und 2. Art
- Nullhypothese und Alternativhypothese
- Konfidenzintervalle
- Fehlergrenzen
- Vergleich und Gegenüberstellung von T-Test und Z-Test
- Bayessches Theorem
- Chi-Quadrat-Verteilung
- Chi-Quadrat-Test und Anpassungsgüte
- Varianzanalyse oder ANOVA
- ANOVA-Terminologien
- Varianzzerlegung mit Python
- F-Verteilung mit Python
- F - Test
Pandas
Lektion 08
- Pandas Series
- Eine Serie abfragen
- Pandas Dataframes
- Pandas Panel
- Häufige Funktionen in Pandas
- Pandas-Funktionen Daten Statistische Funktion, Fensterfunktion
- Pandas-Funktion Daten und Zeitdifferenz
- Kategoriale Daten
- Arbeiten mit Textdaten
- Iteration
- Sortierung
- Plotten mit Pandas
Datenanalyse
Lektion 09
- Datenverständnis
- Arten von Daten: Strukturiert, Unstrukturiert, Unordentlich usw.
- Arbeiten mit Daten Auswahl geeigneter Werkzeuge, Datenerfassung, Datenbereinigung
- Import und Export von Daten in Python
- Reguläre Ausdrücke in Python
- Textmanipulation mit regulären Ausdrücken
- Zugriff auf Datenbanken in Python
Daten-Aufbereitung
Lektion 10
- Bezaubernder oder idiomatischer Pandas-Code
- Indexierung und Reindexierung werden geladen
- Zusammenführen
- Speicheroptimierung in Python
- Daten Vorverarbeitung: Daten laden und Nullwerte entfernen
- Daten-Vorverarbeitung: Auffüllen von Nullwerten
- Datenbinning, Formatierung und Normalisierung
- Standardisierung der Datenklassierung
- Datenbeschreibung
Datenvisualisierung
Lektion 11
- Prinzipien der Informationsvisualisierung
- Datenvisualisierung mit Pivot-Tabellen
- Bibliotheken zur Datenvisualisierung in Python: Matplotlib
- Diagrammtypen
- Bibliotheken zur Datenvisualisierung in Python: Seaborn, Plotly, Bokeh
- Mit Matplotlib Diagramme plotten
- 3D-Diagramme für mehrere Spalten mit Matplotlib zeichnen
- Matplotlib zusammen mit anderen Python-Paketen verwenden
- Mit Seaborn Diagramme plotten
- 3D-Diagramme für mehrere Spalten mit Seaborn zeichnen
- Einführung in Plotly und Bokeh
Grundlagen der Statistik für Data Science
Bonus-Kurs gratis!
- Einführung in die Statistik
- Daten verstehen
- Deskriptive Statistik
- Datenvisualisierung
- Wahrscheinlichkeit
- Wahrscheinlichkeitsverteilungen
- Stichproben und Stichprobenverfahren
- Inferenzstatistik
- Anwendung der Inferenzstatistik
- Beziehungen zwischen Variablen
- Anwendung der Statistik in der Wirtschaft
- Begleitete Übungen
Kursprojekt
Der Kurs umfasst auch praxisnahe, branchenbezogene Projekte. Die erfolgreiche Bewertung eines der folgenden Projekte ist Teil der Zulassungskriterien:
Projekt 1: Analyse des Einzelhandelsumsatzes für die strategische Planung
Untersuchen Sie die Umsatzdaten eines Bekleidungsgeschäfts, um die Unternehmensleitung bei der Entwicklung effektiver Strategien für Umsatzwachstum und Geschäftserweiterung zu unterstützen.
Projekt 2: Bewertung der Wirksamkeit von Marketingkampagnen
Führen Sie explorative Datenanalysen und Hypothesentests durch, um die wichtigsten Faktoren zu identifizieren, die die Kundenakquise und den Erfolg von Kampagnen beeinflussen.
Projekt 3: Visuelle Untersuchung von Immobiliendaten
Verwenden Sie verschiedene Visualisierungstechniken, um einen Immobiliendatensatz zu analysieren und aussagekräftige Erkenntnisse zu gewinnen.
Projekt 4: Untersuchung der Preise auf dem Wohnungsmarkt
Untersuchen Sie Daten zum Wohnungsmarkt, um Trends bei den Immobilienpreisen aufzudecken, die Faktoren hinter der Preisgestaltung zu verstehen und zu bewerten, wie sich verschiedene Merkmale von Immobilien auf den Wert auswirken.
Projekt 5: Analyse von Kundenverhaltensmustern
Wenden Sie Wahrscheinlichkeitsverteilungen an, um das Kundenverhalten zu untersuchen und die Leistung von Geschäften anhand eines maßgeschneiderten Datensatzes zu bewerten.

Wer sollte sich für dieses Programm einschreiben?
Dieser Kurs ist ideal für Personen, die eine Karriere in den Bereichen Datenwissenschaft, maschinelles Lernen oder künstliche Intelligenz anstreben und ihre Python-Programmier- und Datenanalysefähigkeiten verbessern möchten.
Angehende Datenwissenschaftler
Datenanalysten
Softwareentwickler oder Programmierer
Forscher und Akademiker
Begeisterte für maschinelles Lernen
Studenten und Absolventen
Voraussetzungen
Lernende müssen einen Hochschulabschluss oder einen Schulabschluss besitzen. Zusätzlich wird eine Neugier für Datenanalyse und der Wunsch, die Anwendungen von Python im Bereich der Datenwissenschaft zu erforschen, stark empfohlen. Es wird auch empfohlen zu haben:
- Grundkenntnisse in Python-Programmierung: Vertrautheit mit grundlegenden Konzepten der Python-Programmierung wie Variablen, Schleifen, Funktionen und Kontrollfluss.
- Grundverständnis der Statistik: Ein grundlegendes Verständnis der Statistik, einschließlich Konzepten wie Mittelwert, Median, Standardabweichung, Wahrscheinlichkeit und Korrelation.
- Mathematik: Grundlegende mathematische Fähigkeiten, insbesondere in Bereichen wie Algebra und lineare Algebra, sind hilfreich, besonders beim Arbeiten mit maschinellen Lernalgorithmen oder Modellen.
Häufig gestellte Frage

Benötigen Sie eine Unternehmenslösung oder LMS-Integration?
Haben Sie nicht den Kurs oder das Programm gefunden, das für Ihr Unternehmen geeignet wäre? Benötigen Sie eine LMS-Integration? Schreiben Sie uns! Wir werden alles lösen!