Konteks, Konsistensi, dan Kolaborasi Sangat Penting Untuk Keberhasilan Ilmu Data

Node Sumber: 1882940

Konteks, Konsistensi, dan Kolaborasi Sangat Penting Untuk Keberhasilan Ilmu Data
Foto oleh mohamed_hassan di Pixabay

 

Bidang kecerdasan buatan (AI) dan pembelajaran mesin (ML), pada akhir tahun 2021, bukan lagi bidang yang baru lahir dengan masa depan yang tidak pasti di depannya. AI dan ML telah berkembang menjadi lingkup pengaruh yang sangat berpengaruh di dunia ilmu data yang lebih luas, sebuah fakta bahwa tetap lebih benar dari pernah sepanjang tahun ini.

Namun, seiring AI, ML, dan, selanjutnya, ilmu data terus berkembang, begitu pula parameter yang dapat membuat atau menghancurkan keberhasilan tim ilmu data. Peluang untuk memperoleh wawasan yang signifikan dan mendalam dari bidang AI dan ML didasarkan pada tim ilmu data yang lebih besar dari sekadar ilmuwan data yang beroperasi dengan satu laptop. Ada terlalu banyak data yang perlu diperoleh, dibersihkan, dan disiapkan untuk analisis – sebuah proses yang menghabiskan sebagian besar hari kerja rata-rata ilmuwan data – untuk ditangani oleh satu orang saja. 

Proyek ilmu data modern berkisar pada informasi penting mengenai persiapan data, proyek ilmu data sebelumnya, dan cara potensial ke depan untuk menyebarkan model data yang harus dibagikan dengan beberapa ilmu data. Oleh karena itu, sangat penting untuk menyelidiki alasan mengapa tim ilmu data memerlukan konteks, konsistensi, dan kolaborasi yang aman dari data mereka untuk memastikan keberhasilan ilmu data. Mari kita periksa dengan cepat masing-masing persyaratan ini sehingga kita dapat lebih memahami seperti apa kesuksesan ilmu data di masa depan.

Bagian Satu: Konteks

 
Pemeriksaan kami terhadap kesuksesan ilmu data di masa depan dimulai dengan konteks: tidak ada proses pembuatan model berulang yang bergantung pada eksperimen coba-dan-gagal dapat bertahan lama tanpa pengetahuan institusional yang didokumentasikan, disimpan, dan tersedia untuk ilmuwan data. Namun, banyak pengetahuan kelembagaan sering hilang karena kurangnya dokumentasi dan penyimpanan yang tepat.

Pertimbangkan skenario umum ini: seorang ilmuwan data junior atau warga negara ditarik ke dalam sebuah proyek untuk meningkatkan keterampilan mereka, hanya untuk berjuang segera setelahnya dengan kolaborasi sinkron dan asinkron karena kurangnya konteks. Anggota tim ad-hoc ini memerlukan konteks untuk mengetahui lebih banyak tentang data yang berinteraksi dengan mereka, orang-orang yang telah menangani masalah di masa lalu, dan bagaimana pekerjaan sebelumnya memengaruhi lanskap proyek saat ini.

Kebutuhan untuk mendokumentasikan proyek dengan benar serta model data dan alur kerjanya dapat dengan mudah mengalihkan perhatian tim ilmuwan data, apalagi satu yang beroperasi sendiri. Para pemimpin dapat mempertimbangkan opsi untuk menyewa pengembang lepas untuk menyumbangkan waktu mereka terhadap pelestarian dan penyebaran pengetahuan kelembagaan untuk meningkatkan tinjauan standar dan sesi umpan balik proyek ilmu data modern. Sesi ini serta sistem perangkat lunak, meja kerja, dan praktik terbaik dapat merampingkan penangkapan yang lebih efektif dari konteks terkait proyek yang meningkatkan kemampuan penemuan data ilmuwan data junior dan warga negara di masa depan.

Keberhasilan ilmu data membutuhkan manajemen pengetahuan yang disederhanakan dan konteks sekitarnya. Tanpa itu, ilmuwan data baru, junior, dan warga negara kemungkinan akan kesulitan dengan orientasi dan kontribusi yang berarti untuk proyek mereka, yang pada gilirannya mengarah pada tim yang menciptakan kembali proyek daripada berkontribusi pada pekerjaan sebelumnya. 

Bagian Kedua: Konsistensi

 
Bidang ML dan AI telah berkontribusi pada perubahan mendasar dalam hal layanan keuangan, ilmu kesehatan dan kehidupan, serta manufaktur; industri ini, bagaimanapun, tunduk pada lingkungan peraturan yang signifikan. Ini berarti bahwa proyek AI yang berlangsung di lingkungan yang diatur harus dapat direproduksi dengan jejak audit yang jelas. Dengan kata lain, para pemimpin TI dan bisnis yang dalam beberapa hal, bentuk, atau bentuk terlibat dengan proyek ilmu data perlu memastikan tingkat konsistensi data dalam hal hasil proyek ilmu data mereka. 

Pemimpin TI dan bisnis yang dapat mengharapkan tingkat konsistensi yang andal juga dapat menikmati kepercayaan diri yang lebih besar ketika tiba saatnya untuk membuat jenis perubahan strategis yang difasilitasi oleh AI. Ada banyak hal yang dipertaruhkan dalam proyek ilmu data dan ada banyak investasi yang menungganginya, sehingga para ilmuwan data berhak mendapatkan infrastruktur di mana mereka dapat beroperasi dengan tingkat reproduktifitas yang terjamin. dari awal hingga selesai. Reproduksibilitas penuh ini diterjemahkan ke dalam konsistensi dalam data yang dicari oleh eksekutif puncak untuk memutuskan apakah proyek ilmu data cukup signifikan atau tidak dan sejalan dengan tujuan bisnis mereka.

Para eksekutif puncak ini, pada gilirannya, mengharapkan bahwa seiring berkembangnya tim sains mereka, demikian juga rangkaian pelatihan yang diperlukan dan persyaratan perangkat keras untuk memastikan konsistensi dalam hasil dari proyek-proyek lama. Oleh karena itu, proses dan sistem yang membantu mengelola lingkungan adalah kebutuhan mutlak untuk ekspansi tim ilmu data. Jika, misalnya, seorang ilmuwan data menggunakan laptop saat seorang insinyur data menjalankan versi perpustakaan yang berbeda yang berjalan di VM cloud, ilmuwan data tersebut dapat melihat model data mereka menghasilkan hasil yang berbeda dari satu mesin ke mesin berikutnya. Intinya: eksekutif harus memastikan bahwa kolaborator data mereka memiliki cara yang konsisten untuk berbagi lingkungan perangkat lunak yang sama persis.

Bagian Ketiga: Kolaborasi

 
Akhirnya, kami sampai pada pentingnya kolaborasi yang aman. Karena bisnis terus mengalihkan operasi mereka ke model kerja-dari-rumah, organisasi menyadari bahwa kolaborasi ilmu data jauh lebih sulit daripada kolaborasi langsung. Meskipun beberapa tugas inti ilmu data dapat dikelola dengan bantuan ilmu data tunggal (persiapan data, penelitian, dan iterasi model data), sebagian besar eksekutif bisnis secara keliru meninggalkan kolaborasi di pinggir jalan dan kemudian menghambat produktivitas jarak jauh.

Tapi bagaimana seseorang memfasilitasi koordinasi yang efektif dan jarak jauh antara peserta proyek serta keamanan data proyek? Jawabannya terletak pada file kerja yang dapat dibagikan dan data yang berkaitan dengan proyek ilmu data yang membuatnya lebih layak untuk menyebarkan informasi dari jarak jauh. Dan seiring dengan semakin sederhananya penyebaran data terkait proyek, semakin mudah pula berbagi informasi, semakin mudah pula untuk memfasilitasi kolaborasi data jarak jauh. Peserta proyek ilmu data dapat memanfaatkan alat berbasis cloud untuk memperkuat keamanan di balik penelitian mereka. tetapi terlalu banyak pemimpin yang membuat kesalahan dengan tidak mendorong kolaborasi, mengurangi produktivitas.

Kesimpulan

 
Kemajuan tipis yang telah terungkap di bidang ilmu data dalam beberapa tahun terakhir belum pernah terjadi sebelumnya dan terus terang menakjubkan. Kemajuan ilmu data telah memungkinkan perusahaan di seluruh dunia untuk menjawab pertanyaan yang sebelumnya hanya memiliki sedikit, jika ada, jawaban yang tersedia tanpa inovasi yang dimungkinkan oleh AI dan ML. 

Namun, seiring dengan semakin matang dan berkembangnya dunia ilmu data, inilah saatnya bagi para eksekutif puncak dan tim ilmu data yang mereka awasi untuk beralih dari cara yang lebih ad-hoc dan reaktif dalam menyelesaikan pekerjaan. Sumber daya yang dapat digunakan ilmuwan data untuk menghasilkan konteks, konsistensi, dan kolaborasi yang lebih besar seperti meja kerja perangkat lunak kemungkinan besar penting untuk keberhasilan ilmu data. Pada akhirnya, proyek akan menuntut lebih sedikit upaya dari para ilmuwan data, insinyur, analis, dan peneliti, yang akan lebih mampu mempercepat keberhasilan bidang yang berkelanjutan dan menakjubkan.

 
 
Nahla Davies adalah pengembang perangkat lunak dan penulis teknologi. Sebelum mengabdikan pekerjaannya penuh waktu untuk penulisan teknis, dia berhasil—di antara hal-hal menarik lainnya—untuk melayani sebagai programmer utama di sebuah organisasi branding pengalaman Inc. 5,000 yang kliennya termasuk Samsung, Time Warner, Netflix, dan Sony.

Sumber: https://www.kdnuggets.com/2022/01/context-consistency-collaboration-essential-data-science-success.html

Stempel Waktu:

Lebih dari KDnugget