Контекст, послідовність і співпраця є важливими для успіху Data Science

Вихідний вузол: 1882940

Контекст, послідовність і співпраця є важливими для успіху Data Science
Фото mohamed_hassan на Pixabay

 

Наприкінці 2021 року галузі штучного інтелекту (AI) і машинного навчання (ML) більше не є галузями, що тільки зароджуються, і їх чекає невизначене майбутнє. Штучний інтелект та машинне навчання стали надзвичайно впливовими сферами впливу на ширший світ науки про дані, і цей факт залишився правдивішим, ніж протягом цього року.

У той час як AI, ML, а згодом і наука про дані продовжують розширюватися, з’являються параметри, які можуть сприяти або перешкоджати успіху команд з обробки даних. Можливості отримати суттєві та глибокі знання зі сфер штучного інтелекту та машинного навчання ґрунтуються на командах з обробки даних, які є більшими, ніж просто один спеціаліст із обробки даних, який працює з одним ноутбуком. Існує просто занадто багато даних, які потрібно отримати, очистити та підготувати для аналізу – процес, який займає значну частину середнього робочого дня спеціаліста з даних – для того, щоб будь-яка людина могла впоратися з ними самостійно. 

Сучасні проекти науки про дані обертаються навколо важливої ​​інформації щодо підготовки даних, попередніх проектів науки про дані та потенційних шляхів розгортання моделей даних, якими потрібно ділитися з багатьма науками про дані. Тому вкрай важливо дослідити причини, чому команди з обробки даних вимагають контексту, узгодженості та безпечної взаємодії своїх даних для забезпечення успіху в галузі обробки даних. Давайте швидко розглянемо кожну з цих вимог, щоб краще зрозуміти, як може виглядати подальший успіх науки про дані.

Частина перша: Контекст

 
Наше дослідження майбутнього успіху науки про дані починається з контексту: відсутність процесу ітеративного створення моделі що спирається на експерименти типу «пробуй і невдало». може тривати довго без інституційних знань, які документуються, зберігаються та стають доступними для науковців із обробки даних. І все ж значна кількість інституційних знань регулярно втрачається через відсутність належної документації та зберігання.

Розглянемо такий поширений сценарій: молодшого спеціаліста або спеціаліста з обробки даних залучають до проекту, щоб покращити свої навички, але невдовзі після цього він починає боротися з синхронна та асинхронна співпраця через брак контексту. Цим спеціальним членам команди потрібен контекст, щоб дізнатися більше про дані, з якими вони взаємодіють, про людей, які вирішували проблеми в минулому, і про те, як попередня робота вплинула на поточний ландшафт проекту.

Необхідність належного документування проектів, а також моделей даних і їхніх робочих процесів може легко відволікти команду спеціалістів із обробки даних, не кажучи вже про одного, що працює окремо. Лідери можуть розглянути такий варіант найняти позаштатного розробника приділяти свій час збереженню та розповсюдженню інституційних знань для вдосконалення стандартних сеансів перегляду та зворотного зв’язку сучасних проектів з науки про дані. Ці сесії, а також програмні системи, робочі місця та найкращі практики можуть оптимізувати більш ефективне захоплення контексту, пов’язаного з проектом, що покращить доступність даних для молодших спеціалістів і спеціалістів з обробки даних у майбутньому.

Для успіху науки про дані потрібні впорядковане управління знаннями і навколишній контекст. Без цього новачкам, молодшим спеціалістам і науковцям із даних громадян, імовірно, буде важко приєднатися до них і внести вагомий внесок у свої проекти, що, у свою чергу, призведе до того, що команди створюватимуть проекти заново, а не будуть робити внесок у попередню роботу. 

Частина друга: послідовність

 
Сфери машинного навчання та штучного інтелекту сприяли фундаментальним змінам у сфері фінансових послуг, охорони здоров’я та наук про життя, а також виробництва; ці галузі, однак, підпадають під дію значного нормативного середовища. Це означає, що проект штучного інтелекту, який відбувається в регульованому середовищі, має бути відтворюваним із чітким аудиторським слідом. Іншими словами, ІТ-лідери та бізнес-лідери, які певним чином, формою або формою беруть участь у проекті з обробки даних, потребують цього забезпечити рівень узгодженості даних коли справа доходить до результатів їхнього наукового проекту. 

ІТ-керівники та бізнес-лідери, які можуть розраховувати на надійний рівень узгодженості, також можуть користуватися більшою впевненістю, коли прийде час здійснювати типи стратегічних змін, які сприяє ШІ. Коли мова заходить про проекти з обробки даних, на карту поставлено багато, і вони потребують великих інвестицій, тому науковці заслуговують на інфраструктуру, у якій вони зможуть працювати з гарантованим рівнем відтворюваності. від початку до кінця. Ця повна відтворюваність перетворюється на узгодженість даних, які шукають топ-менеджери, щоб вирішити, чи є науковий проект даних достатньо важливим і чи відповідає цілям бізнесу.

Ці топ-менеджери повинні, у свою чергу, очікувати, що в міру розширення їхніх наукових команд також будуть необхідні навчальні набори та вимоги до апаратного забезпечення для забезпечення узгодженості результатів старих проектів. Тому процеси та системи, які допомагають керувати середовищем, є абсолютною необхідністю для розширення команди з обробки даних. Якщо, наприклад, фахівець з даних використовує ноутбук, а інженер з обробки даних використовує іншу версію бібліотеки, що працює на хмарній віртуальній машині, цей спеціаліст з обробки даних може бачити, що їх модель даних дає різні результати від однієї машини до іншої. Підсумок: керівники повинні переконатися, що їхні співробітники з обробки даних мають узгоджений спосіб спільного використання точно тих самих програмних середовищ.

Частина третя: Співпраця

 
Нарешті, ми підходимо до важливості безпечної співпраці. Оскільки компанії продовжують переводити свою діяльність на модель роботи з дому, організації розуміють, що співпраця в галузі обробки даних є набагато складнішою, ніж співпраця особисто. Незважаючи на те, що деякі основні обов’язки з обробки даних можна виконати за допомогою єдиної науки про дані (підготовка даних, дослідження та ітерація моделі даних), більшість керівників підприємств помилково залишили співпрацю на узбіччі й згодом перешкоджали віддаленій продуктивності.

Але як забезпечити ефективну та дистанційну координацію між учасниками проекту, а також захист даних проекту? Відповідь криється в робочих файлах і даних, які стосуються наукового проекту даних що робить його більш життєздатним дистанційно поширювати інформацію. І оскільки розповсюдження даних, пов’язаних із проектом, стає простішим, чим простішим стає обмін інформацією, тим легше сприяти віддаленій співпраці з даними. Учасники наукового проекту з даних можуть використовувати хмарні інструменти для посилення безпеки своїх досліджень. але занадто багато керівників зробили помилку, не заохочуючи співпрацю, знижуючи продуктивність.

Висновок

 
Чистий прогрес, який розгорнувся в галузі науки про дані за останні роки, був безпрецедентним і, відверто кажучи, вражаючим. Розвиток науки про дані дає можливість компаніям у всьому світі вирішувати питання, на які раніше було небагато, якщо взагалі було, доступних відповідей без інновацій, які стали можливими завдяки штучному інтелекту та машинному обігу. 

Однак, оскільки світ науки про дані продовжує розвиватися та розвиватися, топ-менеджерам і командам з обробки даних, якими вони керують, настав час відійти від більш тимчасового та реактивного способу виконання роботи. Ресурси, які науковці з даних можуть використовувати для створення контексту, узгодженості та кращої співпраці, як-от верстаки програмного забезпечення, ймовірно, будуть важливими для успіху в галузі даних. Зрештою, проекти вимагатимуть менше зусиль від спеціалістів із обробки даних, інженерів, аналітиків і дослідників, які зможуть краще прискорити подальший і вражаючий успіх галузі.

 
 
Нала Девіс є розробником програмного забезпечення та технічним автором. Перш ніж повністю присвятити свою роботу технічним написанням, вона встигла — серед іншого інтригуючого — стати провідним програмістом у 5,000 фірмовій організації, що займається досвідом брендингу, серед клієнтів якої є Samsung, Time Warner, Netflix та Sony.

Джерело: https://www.kdnuggets.com/2022/01/context-consistency-collaboration-essential-data-science-success.html

Часова мітка:

Більше від KDnuggets