Adattudós szeretne lenni? 1. rész: 10 kemény készség, amire szüksége van – KDnuggets

Adattudós szeretne lenni? 1. rész: 10 kemény készség, amire szükséged van – KDnuggets

Forrás csomópont: 2252793

Adattudós szeretne lenni? 1. rész: 10 kemény készség, amire szükséged van
A kép szerzője
 

Sok átfogó cikkel találkozhat arról, hogyan válhat adattudóssá. Nagyon sok jó információval szolgálnak, azonban nagyon lesújtóak lehetnek. Főleg kezdőként csak azt akarod tudni, amit tudnod kell, és ropogtatni szeretnél. 

Ez a blog pontosan erről fog szólni. Végigmegyek azon a 10 kemény készségen, amelyre szükséged van ahhoz, hogy adattudós legyél. 

Gyerünk…

Ha nem tudja, hogyan kell kódolni semmilyen programozási nyelven, az első lépése az lesz, hogy megtanulja a kódolást. Az én ajánlásom az lesz Piton, mivel vitathatatlanul az adattudomány legnépszerűbb programozási nyelve. 

További nyelvek, amelyeket az adattudományhoz tanulhat R, SQL, Julia, És így tovább.

A topic that some people say you don’t need in the world of coding. But I believe that is truly wrong. I did a BootCamp that did not touch on the mathematical side – and I definitely realized it played a big weakness in my proficiency in the field. 

Az adattudományhoz szükséges matematikai területek a lineáris algebra, a lineáris regresszió, a valószínűségszámítás és a statisztika. Az adattudomány mögött meghúzódó matematika elsajátítása rendkívül előnyös lesz az adattudományi karrierje szempontjából, és munkáltatója is felfigyel rá. 

A matek tanulása idegtépő tud lenni, így teljesen megértem a habozásodat. Olvassa el Hogyan lehet legyőzni a matematikától való félelmet, és megtanulni matematikát az adattudományhoz hogy megkönnyebbüljön az elméd. 

Az Integrated Development Environment (IDE) olyan szoftveralkalmazás, amely átfogó környezettel rendelkezik, amely kifejezetten szoftverfejlesztéshez szükséges eszközök és szolgáltatások kombinációját tartalmazza. Az IDE-k segítenek adatelemzési, vizualizációs és gépi tanulási feladatok végrehajtásában. A megfelelő IDE kiválasztása inkább az Ön preferenciáitól függ, például:

Az IDE-ben megtudhatja, hogyan szerezhet jártasságot a programozási nyelvben, tanulhat matematikát és az alábbiakat. A Jupyter Notebook és a Visual Studio Code a kedvenceim! Ezek akkor is nagyon hasznosak lesznek, ha munkát kap, mivel a munkáltatók elvárják, hogy ismerje a népszerű IDE-ket.

A kódolás az évek során sokkal könnyebbé vált, és ez a rendelkezésre álló könyvtárak sokféleségétől függ. Ezek a könyvtárak olyan eszközök, amelyeket az adatelemzési és gépi tanulási folyamatok egyszerűsítésére használhat. 

Ha úgy döntött, hogy megtanulja a Python nyelvet, ezeket a könyvtárakat javaslom, hogy tanulja meg: 

Az ok, amiért az elején adok egy listát a könyvtárakról, az az, hogy az adattudományi tanulási út során egyre többet fog látni ezeket a könyvtárakat. Tanulja meg, hogy mindegyik mit nyújt, és látni fogja, hol alkalmazhatja. Például a Matplotlib használható adatvizualizációra. 

Exactly what it says – transforming your data. Data transformation is an important phase for a data scientist as you will spend a lot of time taking raw data and modifying, adjusting and converting it into a format that can be used for analysis and other tasks. 

Meg kell tanulnia a normalizálást, a szabványosítást, a méretezést, a funkciótervezést és még sok mást. 

Egy cikk, amit olvashatsz: Adatátalakítás: szabványosítás vs normalizálás

Az adatvizualizáció az adattudomány fontos aspektusa, mivel a kódoláson kívül több módon is képesnek kell lennie arra, hogy az eredményeket közvetítse. A csapatodban nem mindenki lesz technikailag hajlamos, ezért az eredmények vizuális megjelenítése segít ebben és a döntéshozatali folyamatban is. 

Olvassa el: Az adatvizualizáció bevált gyakorlatai és forrásai a hatékony kommunikációhoz

The next thing you want to learn is machine learning. There are a variety of aspects within machine learning, and you won’t be able to be an expert in everything – but it’s still good to be a jack of all trades within this area. Brace yourself, because there’s a lot to learn. 

Érdemes az alapvető fogalmakkal kezdeni, mint például a felügyelt tanulás, a felügyelet nélküli tanulás, az osztályozás és a regressziós feladatok. Ha ezeket jól megérti, és meg tudja különböztetni őket, akkor többet szeretne megtudni a különböző gépi tanulási algoritmusokról, például a támogató vektorgépekről és a neurális hálózatokról.

Miután megértette a gépi tanulási modelleket, meg kell tanulnia:

  • Gépi tanulási modell felépítése
  • Modell értékelése
  • bevetés
  • Modell értelmezhetőség
  • Túl- és alulfitting
  • Hiperparaméter hangolás
  • Érvényesítés és keresztellenőrzés
  • Együttes módszerek
  • Dimenzionalitás csökkentés
  • Szabályosítási technikák
  • Gradiens Descent
  • Ideghálózatok és mély tanulás
  • Erősítő tanulás

Mint mondtam, ezen a területen van mit tanulni, ezért azt tanácsolom, hogy szánjon időt és gyakoroljon!

Íme egy cikk, amely segíthet: A legjobb 15 YouTube-csatorna, amelyekkel magasabb szintre emelheti gépi tanulási készségeit

Mindezen ismeretek birtoklása nagyszerű, de egyes eszközök a következő szintre emelhetik adattudományi karrierjét. Ha megérti a különböző technológiákat, hol használhatók, valamint az előnyöket és hátrányokat, akkor az adattudományi utazása hatékonyabbá válik. 

Számos eszköz és technológia létezik, amelyek nagy hasznot húzhatnak bárki számára, aki adatokkal dolgozik. Azért felsorolok néhány népszerűet, mint pl Apache Spark, TensorFlow, PyTorch, Hadoop, Csoportkép, megy, És így tovább. 

A felhőalapú számítástechnika az adattudomány nagyon fontos eleme, mivel minden projekt és feladat, amelyen dolgozni fog, termékekké alakul. A számítási felhőszolgáltatások méretezhető tárolást és számítási teljesítményt tesznek lehetővé, valamint könnyű hozzáférést biztosítanak az eszközökhöz és szolgáltatásokhoz. 

Meg kell tanulnia a felhő platformokat, mint pl Amazon webszolgáltatás, Microsoft Azureés Google Cloud Platform

A számítási felhővel kapcsolatos további szempontok, amelyeket ismernie kell, az adattárolás, az adatbázisok, az adattárház, a nagy adatfeldolgozás, a konténerezés és az adatfolyamok. 

Olvassa el: 

A projekteket az utolsó kemény készségként fogom hozzáadni, amelyre szüksége van, mivel a fentiek mindegyikét bemutatja. Ne menj el egy csomó projektet csak azért, mert fel szeretnéd tenni az önéletrajzodba, és munkát akarsz szerezni. Igen, ez a végső cél, de ügyeljen arra, hogy teljesen megértse projektjeit. 

Egy interjú során megkérdezik a projektjeiről, a csínjáról, és fel kell készülnie arra, hogy a lehető legtöbb tudással válaszoljon. Használja projektjeit készségeinek bemutatására, valamint arra, hogy azonosította gyengeségeit, és hogyan dolgozott rajtuk. 

Olvassa el: 

Igyekeztem ezt a cikket a lehető legsűrítettebbé tenni, hogy ne érezze magát túlterheltnek. Remélem, sikerült, és kellő részlettel és forrással elláttam Önt, hogy elindítsa az adattudományi utazást!

Nézze meg a 2. részt az adattudósként szükséges puha készségekkel kapcsolatban.
 
 
Nisha Arya adattudós, szabadúszó műszaki író és közösségi menedzser a KDnuggets-nél. Különösen érdekli az adattudományi karriertanácsadás vagy oktatóanyagok, valamint elméleti alapú ismeretek nyújtása a Data Science területén. Azt is szeretné feltárni, hogy a mesterséges intelligencia milyen különböző módokon járulhat hozzá az emberi élet hosszú élettartamához. Szívesen tanuló, aki igyekszik bővíteni műszaki ismereteit és íráskészségét, miközben segít másoknak.
 

Időbélyeg:

Még több KDnuggets