Data Science: Analiza danych w Python i PANDAS

Otwórz sobie drzwi do Data Science! Przenieś się na wyższy poziom i pracuj jak profesjonalny analityk danych!
4.74 (1563 reviews)
Udemy
platform
Polski
language
Programming Languages
category
instructor
Data Science: Analiza danych w Python i PANDAS
13 462
students
14.5 hours
content
Feb 2025
last update
$59.99
regular price

Why take this course?

Świetnie, skoro jesteś gotowy do poznania DataFrame w PANDAS i kolejnych etapów analizy danych, to zacznijmy od podstaw. DataFrame jest to struktura danych w PANDAS, która pozwala na przechowywanie i manipulowanie dużymi zbiorami tabularnych danych. Jest to kluczowy obiekt, który może składać się z jednej lub wielu kolumn, a także posiada indeksację zwaną MultiIndex.

Tworzenie i manipulowanie DataFrame:

  1. Tworzenie DataFrame: Możesz go stworzyć na podstawie istniejącej tabeli z Pythonu lub Importując dane z zewnętrznych źródeł, takich jak pliki CSV, Excel czy nawet bazy danych.
    import pandas as pd
    
    # Przykład z pliku CSV
    df = pd.read_csv('path/to/your/file.csv')
    
  2. Dodawanie lub usuwanie kolumn: Możesz zwiększyć lub zmniejszyć liczbę kolumn w DataFrame przez dodawanie nowych kolumn lub usuwanie istniejących.
    # Dodanie nowej kolumny
    df['new_column'] = [1, 2, 3]
    
    # Usunięcie kolumny
    df.drop('old_column', axis=1, inplace=True)
    
  3. Przebudowanie indeksu DataFrame: Mógłbyś przekonwertować indeks bieżący na wielomianowy lub odwrócić ten proces.
    # Tworzenie MultiIndex z istniejących danych
    df = df.reset_index(drop=True)
    df[['A', 'B']] = df[['B', 'A']]  # Przebudowanie indeksu (reordering kolumn)
    
    # Odzyskanie wielomianowego indeksu
    df.set_index('column_name', inplace=True)
    
  4. Grupowanie i agregacja danych: Możesz zgrupować dane według określonych kolumn i wykonać na nich agregacje, aby zobaczyć charakterystyczne cechy grup danych.
    df.groupby('column_name').agg({'another_column': 'sum'})
    
  5. Łączenie DataFrame: Możesz połączyć różne DataFrame ze sobą, zarówno po poziomie horizontalnym (kolumnowo), jak i verticalnym (wierszowo).
    # Łączenie poziomie
    df1 = pd.read_csv('path/to/file1.csv')
    df2 = pd.read_csv('path/to/file2.csv')
    result = pd.concat([df1, df2], axis=1)
    
    # Łączenie wierszowo (na przykład po podziale na grupy)
    grouped = df.groupby('column_name')
    result = grouped.agg(...)
    
  6. Wykresowanie danych: Możesz wygenerować różne rodzaje wykresów, aby wizualizować dane. PANDAS używa modułu matplotlib do stworzenia wykresów.
    df.plot(kind='line', x='column_name', y='another_column')
    
  7. Pobieranie i zapisywanie danych: Możesz łatwo zapewnić persystencję danych, pobierając je z zewnętrznych źródeł lub zapisując na dysku.
    # Zapisywanie `DataFrame` do pliku CSV
    df.to_csv('path/to/file.csv', index=False)
    
    # Pobieranie `DataFrame` z pliku Excel
    df = pd.read_excel('path/to/file.xlsx')
    

Te są podstawy pracy z DataFrame w PANDAS. Jako że jesteś zainteresowan Data Science'em, znajdziesz w nim wiele używnych narzędzi do analizy danych i przeprowadzania badań statystycznych. Praktyka jest kluczowa, więc zacznij od prostych zadań i postępuj krok po kroku, zwiększając złożoność analiz. Powodzenia!

Course Gallery

Data Science: Analiza danych w Python i PANDAS – Screenshot 1
Screenshot 1Data Science: Analiza danych w Python i PANDAS
Data Science: Analiza danych w Python i PANDAS – Screenshot 2
Screenshot 2Data Science: Analiza danych w Python i PANDAS
Data Science: Analiza danych w Python i PANDAS – Screenshot 3
Screenshot 3Data Science: Analiza danych w Python i PANDAS
Data Science: Analiza danych w Python i PANDAS – Screenshot 4
Screenshot 4Data Science: Analiza danych w Python i PANDAS

Loading charts...

1670274
udemy ID
30/04/2018
course created date
30/09/2019
course indexed date
Bot
course submited by