Wprowadzenie do Matplotlib przy użyciu Pythona dla początkujących

Węzeł źródłowy: 1172034

Ten artykuł został opublikowany jako część Blogathon Data Science

Jeśli interesuje Cię analityka danych lub wizualizacja danych, jesteś we właściwym miejscu, aby zacząć. Zacznijmy więc od prostego wprowadzenia na temat: Wizualizacja danych czyli proces tłumaczenia liczb, tekstu lub dużych zbiorów danych na różnego rodzaju wykresy, takie jak histogramy, mapy, wykresy słupkowe, wykresy kołowe itp. Do wizualizacji potrzebujemy pewnych narzędzi lub technologii. Biblioteki Matplotu to jedna z najpotężniejszych bibliotek Pythona do wizualizacji danych. W tym artykule wyjaśnię Ci, jak możesz wizualizować różne typy wykresów i wykresów, aby bardzo łatwo wyjaśnić komuś swoje dane.

W tym artykule omówimy następujące kwestie:

  1. Instalacja
  2. Ważne typy działek

Zacznijmy od małego wprowadzenia Biblioteki Matplotu. Biblioteki Matplotu to podstawowa biblioteka wizualizacyjna lub kreśląca języka programowania Python. Biblioteki Matplotu to potężne narzędzie do wykonywania różnorodnych zadań. Jest w stanie tworzyć różne typy raportów wizualizacyjnych, takie jak wykresy liniowe, wykresy punktowe, histogramy, wykresy słupkowe, wykresy kołowe, wykresy pudełkowe i wiele innych różnych wykresów. Ta biblioteka obsługuje również drukowanie trójwymiarowe.

Instalacja Matplotliba

Sprawdźmy jak skonfigurować Biblioteki Matplotu w Google-Colab. Notatniki Colab są podobne do notatników Jupyter, z tą różnicą, że działają w chmurze. Jest również połączony z naszym Dyskiem Google, dzięki czemu dostęp do naszych notatników Colab jest znacznie łatwiejszy w dowolnym miejscu i czasie, w dowolnym systemie. Możesz zainstalować Biblioteki Matplotu przy użyciu PIP dowództwo.

!pip instaluje matplotlib
Użycie pip do zainstalowania Matplotlib
Źródło: Lokalne

Aby zweryfikować instalację, musisz napisać następujący fragment kodu:

importuj matplotlib print(matplotlib.__version__)
Drukowanie wersji Matplotlib
Źródło: Lokalne

Ważne typy wykresów w Matplotlib

Teraz, gdy wiesz, co to jest Biblioteki Matplotu i jak możesz zainstalować go w swoim systemie, omówmy różne rodzaje wykresów, które możesz narysować w celu analizy danych lub przedstawienia wyników.

Działki podrzędne-

Podplots() to a Biblioteki Matplotu funkcja używana do wyświetlania wielu wykresów na jednym rysunku. Przyjmuje różne argumenty, takie jak liczba wierszy, kolumn lub sharex, oś sharey.

Kod:

# Najpierw utwórz siatkę działek
rys., ax = plt.subplots(2,2,figsize=(10,6)) #this utworzy wątki poboczne z 2 wierszami i 2 kolumnami 
#a drugim argumentem jest rozmiar działki 
# Narysujmy wszystkie liczby 
ax[0][0].plot(x1, np.sin(x1), 'g') #row=0,col=0 
ax[0][1].plot(x1, np.cos(x1), 'y') #wiersz=0,kol=1 ax[1][0].plot(x1, np.sin(x1), 'b') #row=1,col=0 ax[1][1].plot(x1, np.cos(x1), „czerwony”) #row=1,col=1 plt.tight_layout() 
#pokaż działki
plt.show ()
Wątki poboczne w matplotlib
Źródło: Lokalne

Sprawdźmy teraz różne kategorie działek Biblioteki Matplotu zapewnia.

  • Działka liniowa
  • Histogram
  • Wykres słupkowy
  • Wykres punktowy
  • Wykresy kołowe
  • Wykres pudełkowy

Przez większość czasu musimy pracować z Pyplotem jako interfejsem Biblioteki Matplotu. Zatem importujemy Pyplot w ten sposób:

import matplotlib.pyplot

Aby było łatwiej, możemy zaimportować go w ten sposób:

import matplotlib.pyplot jako plt 

Wykresy liniowe-

Wykres liniowy służy do sprawdzenia zależności pomiędzy osiami x i y.

Funkcja plot() w pliku Biblioteki Matplotu Moduł Pyplot biblioteki służy do tworzenia sześciokątnego wykresu 2D współrzędnych x i y. plot() będzie przyjmować różne argumenty, takie jak wykres(x, y, skala, skala, dane, **kwargs).

x, y są współrzędnymi osi poziomej i pionowej, gdzie wartości x są opcjonalne, a wartością domyślną jest range(len(y)).

skala, skala parametry służą do automatycznego skalowania osi x lub y, a ich wartością domyślną jest true.

** kwargs służy do określenia właściwości, takich jak etykieta linii, szerokość linii, znacznik, kolor itp.

Kod:

#ta linia utworzy tablicę liczb od 1 do 10 o długości 100 
#np.linspace(satrt,stop,num) 
x1 = np.linspace(0, 10, 100) #wykres liniowy 
plt.plot(x1, np.sin(x1), '-',color='pomarańczowy') 
plt.plot(x1, np.cos(x1), '--',kolor='b')
#podaj nazwę osi x i y 
plt.xlabel('etykieta x')
plt.ylabel('etykieta y') 
#podaj także tytuł fabuły 
plt.title("Tytuł") 
plt.show () 
Wykres liniowy w Matplotlib
Źródło: Lokalne

Histogram-

Najpopularniejszym wykresem przedstawiającym rozkłady częstotliwości jest histogram. Aby utworzyć histogram, pierwszym krokiem jest utworzenie zbioru zakresów, następnie rozłożenie całego zakresu wartości na serię przedziałów i policzenie wartości, która będzie mieścić się w danym przedziale. możemy użyć plt.hist() funkcja do wykreślania histogramów, które będą przyjmować różne argumenty, takie jak dane, pojemniki, kolor itp.

x: współrzędna x lub sekwencja tablicy

pojemniki: wartość całkowita określająca liczbę potrzebnych pojemników na wykresie

zakres: dolny i górny zakres pojemników

gęstość: opcjonalny parametr zawierający wartości logiczne

typ hist: opcjonalny parametr używany do tworzenia różnych typów histogramów, takich jak: -bar, słupek skumulowany, krok, stopień wypełnienia, a domyślnym jest słupek

Kod:

#losuj próbki z losowych rozkładów. x = np.random.normal(170, 10, 250) #wykres histogramów plt.hist(x) plt.show()
Histogram w Matplotlib
Źródło: Lokalne

Działka barowa-

Do pokazania związku pomiędzy wartościami liczbowymi i kategorycznymi używany jest głównie wykres słupkowy. Na wykresie słupkowym mamy jedną oś reprezentującą określoną kategorię kolumn i drugą oś reprezentującą wartości lub liczbę określonej kategorii. Wykresy słupkowe są wykreślane zarówno w pionie, jak i w poziomie, przy użyciu następującego wiersza kodu:

plt.bar(x, wysokość, szerokość, dół, wyrównanie)

x: reprezentujące współrzędne osi x

wysokość: wysokość prętów

width: szerokość prętów. Jego domyślna wartość to 0.8

Dolny: To opcjonalne. Jest to współrzędna y słupka, jej domyślna wartość to Brak

wyrównywać: środek, krawędź, domyślną wartością jest środek

Kod:

#zdefiniuj dane tablicy= [5. , 25. , 50. , 20.] plt.bar(zakres(długość(dane)), dane,kolor='c') plt.show()
Barplot w Matplotlib
Źródło: Lokalne

Wykres punktowy-

Wykresy punktowe służą do pokazania relacji między zmiennymi i wykorzystują kropki do wykreślenia lub służą do pokazania relacji między dwiema zmiennymi numerycznymi.

Połączenia rozpraszać() metoda w Biblioteki Matplotu Biblioteka służy do kreślenia.

Kod:

#utwórz współrzędne osi x i y x = np.array([5,7,8,7,2,17,2,9,4,11,12,9,6]) y = np.array([99,86,87,88,111,86,103,87,94,78,77,85,86 ,XNUMX]) plt.scatter(x, y) plt.legend() plt.show()
Wykres punktowy w Matplotlib
Źródło: Lokalne

Wykres kołowy-

Wykres kołowy (lub wykres kołowy) służy do pokazania procentu całości. Dlatego używa się go, gdy chcemy porównać poszczególne kategorie z całością. Ciasto() przyjmie różne parametry, takie jak:

x: Sekwencja tablicy

etykiety: Lista ciągów, które będą nazwą każdego wycinka na wykresie kołowym

Autopkt: Służy do oznaczania klinów wartościami numerycznymi. Etykiety zostaną umieszczone wewnątrz klinów. Jego format to% 1.2f%

Kod:

#zdefiniuj rozmiar figury plt.figure(figsize=(7,7)) x = [25,30,45,10] #etykiety etykiet wykresu kołowego = ['A','B','C',' D'] plt.pie(x, etykiety=etykiety) plt.show()
Wykres kołowy w Matplotlib
Źródło: Lokalne

Fabuła pudełkowa-

Wykres pudełkowy służy do pokazania podsumowania całego zbioru danych lub wszystkich wartości liczbowych w zbiorze danych. Podsumowanie zawiera minimum, pierwszy kwartyl, medianę, trzeci kwartyl i maksimum. Ponadto mediana występuje między pierwszym a trzecim kwartylem. Tutaj oś x zawiera wartości danych, a współrzędne y pokazują rozkład częstotliwości.

Parametry stosowane na wykresach pudełkowych są następujące:

Dane: Tablica NumPy

zielony: Przyjmie wartości logiczne, tj. prawda lub fałsz, dla wykresu pionowego i poziomego, domyślną wartością jest Prawda

width: To zajmie tablicę i zestawy szerokości pól, parametry opcjonalne

Artysta aktualizacji: Służy do wypełniania pól kolorem, a jego domyślna wartość to false

etykiety: Tablica ciągów znaków używana do ustawiania etykiet zbioru danych

Kod:

#utwórz losowe wartości za pomocą wartości numpy= np.random.normal(100, 20, 300) #utwórz wykres za pomocą funkcji boxplot() dostępnej w matplotlib plt.boxplot(values,patch_artist=True,vert=True) plt.show()
Wykres pudełkowy w Matplotlib
Źródło: Lokalne

Wykres obszarowy-

Wykres warstwowy lub wykres warstwowy służy do graficznej wizualizacji danych ilościowych w oparciu o wykres liniowy. fill_between() funkcja służy do wykreślenia wykresu warstwowego.

Parametr:

x, y reprezentują współrzędne x i y wykresu. To zajmie tablicę o długości n.

Interpolować jest wartością logiczną i jest opcjonalna. Jeśli to prawda, dokonaj interpolacji między dwiema liniami, aby znaleźć dokładny punkt przecięcia.

** kwargs: alfa, kolor, kolor twarzy, kolor krawędzi, szerokość linii.

Kod:

import numpy jako np import pandy jako pd import matplotlib.pyplot jako plt y = [2, 7, 14, 17, 20, 27, 30, 38, 25, 18, 6, 1] #wykreśl linię podanych danych plt .plot(np.arange(12),y, color="blue", alpha=0.6, linewidth=2) #udekoruj wykres, nadając mu etykiety plt.xlabel('Miesiąc', rozmiar=12) plt.ylabel( 'Obrót(Cr.)', rozmiar=12) #ustaw początek osi Y od zera plt.ylim(bottom=0) plt.show()
Wykres powierzchniowy
Źródło: Lokalne

Wypełnij obszar na wykresie liniowym, używając funkcji fill_between() dla wykresu warstwowego.

plt.fill_between(np.arange(12), obrót, kolor="turkusowy", alfa=0.4)
Wypełnianie obszaru na wykresie liniowym za pomocą fill_between()
Źródło: Lokalne

Chmura słów-

Wordcloud to wizualna reprezentacja danych tekstowych. Słowa są zwykle pojedyncze, a znaczenie każdego słowa jest pokazywane za pomocą rozmiaru lub koloru czcionki. The wordcloud () funkcja służy do tworzenia chmury słów w Pythonie.

Połączenia wordcloud () przyjmie różne argumenty, takie jak:

width: ustaw szerokość płótna. domyślnie 400

wysokość: ustaw wysokość płótna. domyślnie 400

max_words: liczba dozwolonych słów, jego wartość domyślna to 200.

kolor tła: kolor tła obrazu chmury słów. Domyślny kolor to czarny.

Po utworzeniu obiektu chmury słów możesz wywołać funkcję generowania, aby wygenerować chmurę słów i przekazać dane tekstowe.

Kod:

#importuj biblioteki z wordcloud import WordCloud import matplotlib.pyplot jako plt z PIL import Import obrazu numpy jako np #set the figure size . plt.figure(figsize=(10,15)) #fikcyjny tekst. tekst = '''Nulla laoreet bibendum purus, vitae sollicitudin sapien facilisis at.
 Donec erat diam, faucibus pulvinar eleifend vitae, vulputate quis ipsum.
 Maecenas luctus odio turpis, gdzie indziej niesklasyfikowany dignissim dolor aliquet id.
 Mauris eu semper risus, ut volutpat mi. Vivamus ut pellentesque sapien.
 Etiam fringilla tincidunt lectus sed interdum. Etiam vel dignissim erat.
 Curabitur placerat masa nisl, quis tristique ante mattis vitae.
 Ut volutpat augue non semper finibus. Nullam commodo dolor sit amet purus auctor Mattis.
 Ut id nulla quis purus tempus porttitor. Ut venenatis sollicitudin est eget gravida.
 Duis imperdiet ut nisl cursus ultrices. Maecenas dapibus eu odio id hendrerit.
 Quisque eu velit hendrerit, commodo magna euismod, luctus nunc.
 Proin vel augue cursus, placerat urna aliquet, consequat nisl.
 Duis vulputate turpis a faucibus porta. Etiam blandit tortor vitae dui przedsionek viverra.
 Phasellus w Porta Elit. Duis vel ligula consectetur, pulvinar nisl vel, lobortis ex.'''
wordcloud = WordCloud(margin=0,colormap='BuPu').generate(text) Funkcja #imshow() w module pyplot biblioteki matplotlib służy do wyświetlania danych w postaci obrazu. plt.imshow(wordcloud, interpolation='bilinear') plt.axis('off') plt.margins(x=0, y=0) plt.show()
Chmura słów
Źródło: Lokalne

Wykresy 3-D-

Teraz, gdy znasz już kilka prostych wykresów, czas przyjrzeć się bardziej skomplikowanym, np. wykresom trójwymiarowym. Początkowo Matplotlib został zbudowany dla wykresów dwuwymiarowych, ale później dodano do niego wykresy 3-D. Sprawdźmy, jak można wykreślić wykres 2-D w Matplotlib.

Kod:

z mpl_toolkits zaimportuj mplot3d
%matplotlib import inline numpy jako np import matplotlib.pyplot jako plt
fig = plt.figure() ax = plt.axes(projekcja='3d')

Powyższy kod służy do tworzenia osi trójwymiarowych.

Wykres 3-D w Matplotlib
Źródło: Lokalne

Każdy wykres, który widzieliśmy na wykresie 2D za pomocą Matplotlib, można również narysować jako wykres 3D. Na przykład sprawdźmy wykres liniowy na płaszczyźnie 3D.

ax = plt.axes(projection='3d') # Dane dla linii trójwymiarowej zline = np.linspace(0, 15, 1000) xline = np.sin(zline) yline = np.cos(zline) ax. plot3D(xline, yline, zline, 'gray') # Dane dla trójwymiarowych punktów rozproszonych zdata = 15 * np.random.random(100) xdata = np.sin(zdata) + 0.1 * np.random.randn(100 ) ydata = np.cos(zdata) + 0.1 * np.random.randn(100) ax.scatter3D(xdata, ydata, zdata, c=zdata, cmap='Zieloni');
Wykres punktowy 3D
Źródło: Lokalne

wszystkie inne typy wykresów można rysować w ten sam sposób. Jednym ze specjalnych wykresów udostępnianych przez Matplotlib 3-D jest wykres konturowy. Możesz narysować wykres konturowy, korzystając z poniższego łącza:

fig = plt.figure() ax = plt.axes(projection='3d') ax.plot_wireframe(X, Y, Z, kolor='czarny') ax.set_title('szkielet');
Wykres konturowy w Matplotlib
Źródło: Lokalne

Aby zrozumieć wszystkie wymienione typy działek, możesz zapoznać się z poniższymi informacjami: https://www.youtube.com/watch?v=yZTBMMdPOww

Wnioski

W tym artykule omówiliśmy Biblioteki Matplotu czyli podstawowa biblioteka do rysowania w Pythonie oraz podstawowe informacje o różnych typach wykresów do analizy statystycznej, która jest powszechnie używana. Omówiliśmy także sposób rysowania wielu wykresów na jednym rysunku za pomocą funkcji subplot.

Również tutaj omawialiśmy, jak dostosować figurę lub jak zmienić jej rozmiar, a także jak ozdobić wątki za pomocą różnych argumentów. Skoro znasz już podstawy rysowania i tworzenia wykresów, możesz spróbować wykreślić różne zbiory danych i funkcje matematyczne.

Jako specjaliści ds. danych (w tym analitycy danych, badacze danych, inżynierowie ML, inżynierowie DL) wszyscy z nich muszą w pewnym momencie wizualizować dane i prezentować wnioski, więc co byłoby lepszą opcją niż to, a teraz, gdy znasz tę technologię, byłbyś trochę pewny siebie w branży.

Dziękujemy za przeczytanie artykułu, udostępnij go, jeśli uznasz go za interesujący!

Media pokazane w tym artykule nie są własnością Analytics Vidhya i są używane według uznania Autora.

Źródło: https://www.analyticsvidhya.com/blog/2021/10/introduction-to-matplotlib-using-python-for-beginners/

Znak czasu:

Więcej z Analityka Widhja