Ten artykuł został opublikowany jako część Blogathon Data Science
Jeśli interesuje Cię analityka danych lub wizualizacja danych, jesteś we właściwym miejscu, aby zacząć. Zacznijmy więc od prostego wprowadzenia na temat: Wizualizacja danych czyli proces tłumaczenia liczb, tekstu lub dużych zbiorów danych na różnego rodzaju wykresy, takie jak histogramy, mapy, wykresy słupkowe, wykresy kołowe itp. Do wizualizacji potrzebujemy pewnych narzędzi lub technologii. Biblioteki Matplotu to jedna z najpotężniejszych bibliotek Pythona do wizualizacji danych. W tym artykule wyjaśnię Ci, jak możesz wizualizować różne typy wykresów i wykresów, aby bardzo łatwo wyjaśnić komuś swoje dane.
W tym artykule omówimy następujące kwestie:
- Instalacja
- Ważne typy działek
Zacznijmy od małego wprowadzenia Biblioteki Matplotu. Biblioteki Matplotu to podstawowa biblioteka wizualizacyjna lub kreśląca języka programowania Python. Biblioteki Matplotu to potężne narzędzie do wykonywania różnorodnych zadań. Jest w stanie tworzyć różne typy raportów wizualizacyjnych, takie jak wykresy liniowe, wykresy punktowe, histogramy, wykresy słupkowe, wykresy kołowe, wykresy pudełkowe i wiele innych różnych wykresów. Ta biblioteka obsługuje również drukowanie trójwymiarowe.
Instalacja Matplotliba
Sprawdźmy jak skonfigurować Biblioteki Matplotu w Google-Colab. Notatniki Colab są podobne do notatników Jupyter, z tą różnicą, że działają w chmurze. Jest również połączony z naszym Dyskiem Google, dzięki czemu dostęp do naszych notatników Colab jest znacznie łatwiejszy w dowolnym miejscu i czasie, w dowolnym systemie. Możesz zainstalować Biblioteki Matplotu przy użyciu PIP dowództwo.
!pip instaluje matplotlib
Aby zweryfikować instalację, musisz napisać następujący fragment kodu:
importuj matplotlib print(matplotlib.__version__)
Ważne typy wykresów w Matplotlib
Teraz, gdy wiesz, co to jest Biblioteki Matplotu i jak możesz zainstalować go w swoim systemie, omówmy różne rodzaje wykresów, które możesz narysować w celu analizy danych lub przedstawienia wyników.
Działki podrzędne-
Podplots() to a Biblioteki Matplotu funkcja używana do wyświetlania wielu wykresów na jednym rysunku. Przyjmuje różne argumenty, takie jak liczba wierszy, kolumn lub sharex, oś sharey.
Kod:
# Najpierw utwórz siatkę działek rys., ax = plt.subplots(2,2,figsize=(10,6)) #this utworzy wątki poboczne z 2 wierszami i 2 kolumnami #a drugim argumentem jest rozmiar działki # Narysujmy wszystkie liczby ax[0][0].plot(x1, np.sin(x1), 'g') #row=0,col=0 ax[0][1].plot(x1, np.cos(x1), 'y') #wiersz=0,kol=1 ax[1][0].plot(x1, np.sin(x1), 'b') #row=1,col=0 ax[1][1].plot(x1, np.cos(x1), „czerwony”) #row=1,col=1 plt.tight_layout() #pokaż działki plt.show ()
Sprawdźmy teraz różne kategorie działek Biblioteki Matplotu zapewnia.
- Działka liniowa
- Histogram
- Wykres słupkowy
- Wykres punktowy
- Wykresy kołowe
- Wykres pudełkowy
Przez większość czasu musimy pracować z Pyplotem jako interfejsem Biblioteki Matplotu. Zatem importujemy Pyplot w ten sposób:
import matplotlib.pyplot
Aby było łatwiej, możemy zaimportować go w ten sposób:
import matplotlib.pyplot jako plt
Wykresy liniowe-
Wykres liniowy służy do sprawdzenia zależności pomiędzy osiami x i y.
Funkcja plot() w pliku Biblioteki Matplotu Moduł Pyplot biblioteki służy do tworzenia sześciokątnego wykresu 2D współrzędnych x i y. plot() będzie przyjmować różne argumenty, takie jak wykres(x, y, skala, skala, dane, **kwargs).
x, y są współrzędnymi osi poziomej i pionowej, gdzie wartości x są opcjonalne, a wartością domyślną jest range(len(y)).
skala, skala parametry służą do automatycznego skalowania osi x lub y, a ich wartością domyślną jest true.
** kwargs służy do określenia właściwości, takich jak etykieta linii, szerokość linii, znacznik, kolor itp.
Kod:
#ta linia utworzy tablicę liczb od 1 do 10 o długości 100 #np.linspace(satrt,stop,num) x1 = np.linspace(0, 10, 100) #wykres liniowy plt.plot(x1, np.sin(x1), '-',color='pomarańczowy') plt.plot(x1, np.cos(x1), '--',kolor='b') #podaj nazwę osi x i y plt.xlabel('etykieta x') plt.ylabel('etykieta y') #podaj także tytuł fabuły plt.title("Tytuł") plt.show ()
Histogram-
Najpopularniejszym wykresem przedstawiającym rozkłady częstotliwości jest histogram. Aby utworzyć histogram, pierwszym krokiem jest utworzenie zbioru zakresów, następnie rozłożenie całego zakresu wartości na serię przedziałów i policzenie wartości, która będzie mieścić się w danym przedziale. możemy użyć plt.hist() funkcja do wykreślania histogramów, które będą przyjmować różne argumenty, takie jak dane, pojemniki, kolor itp.
x: współrzędna x lub sekwencja tablicy
pojemniki: wartość całkowita określająca liczbę potrzebnych pojemników na wykresie
zakres: dolny i górny zakres pojemników
gęstość: opcjonalny parametr zawierający wartości logiczne
typ hist: opcjonalny parametr używany do tworzenia różnych typów histogramów, takich jak: -bar, słupek skumulowany, krok, stopień wypełnienia, a domyślnym jest słupek
Kod:
#losuj próbki z losowych rozkładów. x = np.random.normal(170, 10, 250) #wykres histogramów plt.hist(x) plt.show()
Działka barowa-
Do pokazania związku pomiędzy wartościami liczbowymi i kategorycznymi używany jest głównie wykres słupkowy. Na wykresie słupkowym mamy jedną oś reprezentującą określoną kategorię kolumn i drugą oś reprezentującą wartości lub liczbę określonej kategorii. Wykresy słupkowe są wykreślane zarówno w pionie, jak i w poziomie, przy użyciu następującego wiersza kodu:
plt.bar(x, wysokość, szerokość, dół, wyrównanie)
x: reprezentujące współrzędne osi x
wysokość: wysokość prętów
width: szerokość prętów. Jego domyślna wartość to 0.8
Dolny: To opcjonalne. Jest to współrzędna y słupka, jej domyślna wartość to Brak
wyrównywać: środek, krawędź, domyślną wartością jest środek
Kod:
#zdefiniuj dane tablicy= [5. , 25. , 50. , 20.] plt.bar(zakres(długość(dane)), dane,kolor='c') plt.show()
Wykres punktowy-
Wykresy punktowe służą do pokazania relacji między zmiennymi i wykorzystują kropki do wykreślenia lub służą do pokazania relacji między dwiema zmiennymi numerycznymi.
Połączenia rozpraszać() metoda w Biblioteki Matplotu Biblioteka służy do kreślenia.
Kod:
#utwórz współrzędne osi x i y x = np.array([5,7,8,7,2,17,2,9,4,11,12,9,6]) y = np.array([99,86,87,88,111,86,103,87,94,78,77,85,86 ,XNUMX]) plt.scatter(x, y) plt.legend() plt.show()
Wykres kołowy-
Wykres kołowy (lub wykres kołowy) służy do pokazania procentu całości. Dlatego używa się go, gdy chcemy porównać poszczególne kategorie z całością. Ciasto() przyjmie różne parametry, takie jak:
x: Sekwencja tablicy
etykiety: Lista ciągów, które będą nazwą każdego wycinka na wykresie kołowym
Autopkt: Służy do oznaczania klinów wartościami numerycznymi. Etykiety zostaną umieszczone wewnątrz klinów. Jego format to% 1.2f%
Kod:
#zdefiniuj rozmiar figury plt.figure(figsize=(7,7)) x = [25,30,45,10] #etykiety etykiet wykresu kołowego = ['A','B','C',' D'] plt.pie(x, etykiety=etykiety) plt.show()
Fabuła pudełkowa-
Wykres pudełkowy służy do pokazania podsumowania całego zbioru danych lub wszystkich wartości liczbowych w zbiorze danych. Podsumowanie zawiera minimum, pierwszy kwartyl, medianę, trzeci kwartyl i maksimum. Ponadto mediana występuje między pierwszym a trzecim kwartylem. Tutaj oś x zawiera wartości danych, a współrzędne y pokazują rozkład częstotliwości.
Parametry stosowane na wykresach pudełkowych są następujące:
Dane: Tablica NumPy
zielony: Przyjmie wartości logiczne, tj. prawda lub fałsz, dla wykresu pionowego i poziomego, domyślną wartością jest Prawda
width: To zajmie tablicę i zestawy szerokości pól, parametry opcjonalne
Artysta aktualizacji: Służy do wypełniania pól kolorem, a jego domyślna wartość to false
etykiety: Tablica ciągów znaków używana do ustawiania etykiet zbioru danych
Kod:
#utwórz losowe wartości za pomocą wartości numpy= np.random.normal(100, 20, 300) #utwórz wykres za pomocą funkcji boxplot() dostępnej w matplotlib plt.boxplot(values,patch_artist=True,vert=True) plt.show()
Wykres obszarowy-
Wykres warstwowy lub wykres warstwowy służy do graficznej wizualizacji danych ilościowych w oparciu o wykres liniowy. fill_between() funkcja służy do wykreślenia wykresu warstwowego.
Parametr:
x, y reprezentują współrzędne x i y wykresu. To zajmie tablicę o długości n.
Interpolować jest wartością logiczną i jest opcjonalna. Jeśli to prawda, dokonaj interpolacji między dwiema liniami, aby znaleźć dokładny punkt przecięcia.
** kwargs: alfa, kolor, kolor twarzy, kolor krawędzi, szerokość linii.
Kod:
import numpy jako np import pandy jako pd import matplotlib.pyplot jako plt y = [2, 7, 14, 17, 20, 27, 30, 38, 25, 18, 6, 1] #wykreśl linię podanych danych plt .plot(np.arange(12),y, color="blue", alpha=0.6, linewidth=2) #udekoruj wykres, nadając mu etykiety plt.xlabel('Miesiąc', rozmiar=12) plt.ylabel( 'Obrót(Cr.)', rozmiar=12) #ustaw początek osi Y od zera plt.ylim(bottom=0) plt.show()
Wypełnij obszar na wykresie liniowym, używając funkcji fill_between() dla wykresu warstwowego.
plt.fill_between(np.arange(12), obrót, kolor="turkusowy", alfa=0.4)
Chmura słów-
Wordcloud to wizualna reprezentacja danych tekstowych. Słowa są zwykle pojedyncze, a znaczenie każdego słowa jest pokazywane za pomocą rozmiaru lub koloru czcionki. The wordcloud () funkcja służy do tworzenia chmury słów w Pythonie.
Połączenia wordcloud () przyjmie różne argumenty, takie jak:
width: ustaw szerokość płótna. domyślnie 400
wysokość: ustaw wysokość płótna. domyślnie 400
max_words: liczba dozwolonych słów, jego wartość domyślna to 200.
kolor tła: kolor tła obrazu chmury słów. Domyślny kolor to czarny.
Po utworzeniu obiektu chmury słów możesz wywołać funkcję generowania, aby wygenerować chmurę słów i przekazać dane tekstowe.
Kod:
#importuj biblioteki z wordcloud import WordCloud import matplotlib.pyplot jako plt z PIL import Import obrazu numpy jako np #set the figure size . plt.figure(figsize=(10,15)) #fikcyjny tekst. tekst = '''Nulla laoreet bibendum purus, vitae sollicitudin sapien facilisis at.
Donec erat diam, faucibus pulvinar eleifend vitae, vulputate quis ipsum.
Maecenas luctus odio turpis, gdzie indziej niesklasyfikowany dignissim dolor aliquet id.
Mauris eu semper risus, ut volutpat mi. Vivamus ut pellentesque sapien.
Etiam fringilla tincidunt lectus sed interdum. Etiam vel dignissim erat.
Curabitur placerat masa nisl, quis tristique ante mattis vitae.
Ut volutpat augue non semper finibus. Nullam commodo dolor sit amet purus auctor Mattis.
Ut id nulla quis purus tempus porttitor. Ut venenatis sollicitudin est eget gravida.
Duis imperdiet ut nisl cursus ultrices. Maecenas dapibus eu odio id hendrerit.
Quisque eu velit hendrerit, commodo magna euismod, luctus nunc.
Proin vel augue cursus, placerat urna aliquet, consequat nisl.
Duis vulputate turpis a faucibus porta. Etiam blandit tortor vitae dui przedsionek viverra.
Phasellus w Porta Elit. Duis vel ligula consectetur, pulvinar nisl vel, lobortis ex.'''
wordcloud = WordCloud(margin=0,colormap='BuPu').generate(text) Funkcja #imshow() w module pyplot biblioteki matplotlib służy do wyświetlania danych w postaci obrazu. plt.imshow(wordcloud, interpolation='bilinear') plt.axis('off') plt.margins(x=0, y=0) plt.show()
Wykresy 3-D-
Teraz, gdy znasz już kilka prostych wykresów, czas przyjrzeć się bardziej skomplikowanym, np. wykresom trójwymiarowym. Początkowo Matplotlib został zbudowany dla wykresów dwuwymiarowych, ale później dodano do niego wykresy 3-D. Sprawdźmy, jak można wykreślić wykres 2-D w Matplotlib.
Kod:
z mpl_toolkits zaimportuj mplot3d
%matplotlib import inline numpy jako np import matplotlib.pyplot jako plt
fig = plt.figure() ax = plt.axes(projekcja='3d')
Powyższy kod służy do tworzenia osi trójwymiarowych.
Każdy wykres, który widzieliśmy na wykresie 2D za pomocą Matplotlib, można również narysować jako wykres 3D. Na przykład sprawdźmy wykres liniowy na płaszczyźnie 3D.
ax = plt.axes(projection='3d') # Dane dla linii trójwymiarowej zline = np.linspace(0, 15, 1000) xline = np.sin(zline) yline = np.cos(zline) ax. plot3D(xline, yline, zline, 'gray') # Dane dla trójwymiarowych punktów rozproszonych zdata = 15 * np.random.random(100) xdata = np.sin(zdata) + 0.1 * np.random.randn(100 ) ydata = np.cos(zdata) + 0.1 * np.random.randn(100) ax.scatter3D(xdata, ydata, zdata, c=zdata, cmap='Zieloni');
wszystkie inne typy wykresów można rysować w ten sam sposób. Jednym ze specjalnych wykresów udostępnianych przez Matplotlib 3-D jest wykres konturowy. Możesz narysować wykres konturowy, korzystając z poniższego łącza:
fig = plt.figure() ax = plt.axes(projection='3d') ax.plot_wireframe(X, Y, Z, kolor='czarny') ax.set_title('szkielet');
Aby zrozumieć wszystkie wymienione typy działek, możesz zapoznać się z poniższymi informacjami: https://www.youtube.com/watch?v=yZTBMMdPOww
Wnioski
W tym artykule omówiliśmy Biblioteki Matplotu czyli podstawowa biblioteka do rysowania w Pythonie oraz podstawowe informacje o różnych typach wykresów do analizy statystycznej, która jest powszechnie używana. Omówiliśmy także sposób rysowania wielu wykresów na jednym rysunku za pomocą funkcji subplot.
Również tutaj omawialiśmy, jak dostosować figurę lub jak zmienić jej rozmiar, a także jak ozdobić wątki za pomocą różnych argumentów. Skoro znasz już podstawy rysowania i tworzenia wykresów, możesz spróbować wykreślić różne zbiory danych i funkcje matematyczne.
Jako specjaliści ds. danych (w tym analitycy danych, badacze danych, inżynierowie ML, inżynierowie DL) wszyscy z nich muszą w pewnym momencie wizualizować dane i prezentować wnioski, więc co byłoby lepszą opcją niż to, a teraz, gdy znasz tę technologię, byłbyś trochę pewny siebie w branży.
Dziękujemy za przeczytanie artykułu, udostępnij go, jeśli uznasz go za interesujący!
- '
- 100
- 11
- 3d
- 7
- 77
- 9
- dostęp
- Wszystkie kategorie
- Alfa
- analiza
- analityka
- POWIERZCHNIA
- argumenty
- artykuł
- paski
- Podstawy
- Bit
- Czarny
- Pudełko
- wezwanie
- Wykresy
- Chmura
- kod
- wspólny
- dane
- Analityka danych
- Wizualizacja danych
- krawędź
- Inżynierowie
- itp
- EU
- Postać
- i terminów, a
- format
- funkcjonować
- Dający
- szary
- Krata
- tutaj
- W jaki sposób
- How To
- HTTPS
- obraz
- Włącznie z
- przemysł
- Informacja
- IT
- Etykiety
- język
- duży
- Biblioteka
- Linia
- LINK
- Lista
- Mapy
- Media
- ML
- laptopy
- z naszej
- Option
- Inne
- teraźniejszość
- specjalistów
- Programowanie
- własność
- Python
- ilościowy
- zasięg
- Czytający
- Relacje
- Raporty
- run
- nauka
- Naukowcy
- Serie
- zestaw
- Share
- Prosty
- Rozmiar
- mały
- So
- początek
- rozpoczęty
- podpory
- system
- tech
- Technologia
- Podstawy
- czas
- wartość
- wyobrażanie sobie
- Co to jest
- słowa
- Praca
- X
- youtube
- zero