Контекст, согласованность и сотрудничество необходимы для успеха в науке о данных

Исходный узел: 1882940

Контекст, согласованность и сотрудничество необходимы для успеха в науке о данных
Фото mohamed_hassan на Pixabay

 

Области искусственного интеллекта (ИИ) и машинного обучения (МО) в конце 2021 года больше не являются зарождающимися областями с неопределенным будущим впереди. ИИ и машинное обучение превратились в чрезвычайно влиятельные сферы влияния на более широкий мир науки о данных. остался вернее, чем когда-либо в течение этого года.

Однако по мере того, как ИИ, машинное обучение и, впоследствии, наука о данных продолжали расширяться, то же самое происходило и с параметрами, которые могут способствовать или разрушать успех команд по обработке и анализу данных. Возможности получить важные и глубокие знания в области ИИ и машинного обучения основаны на командах специалистов по данным, которые больше, чем просто один специалист по данным, работающий с одним ноутбуком. Просто слишком много данных необходимо получить, очистить и подготовить для анализа — процесс, который занимает значительную часть среднего рабочего дня специалиста по данным — для того, чтобы любой человек мог справиться в одиночку. 

Современные проекты по науке о данных вращаются вокруг важной информации, касающейся подготовки данных, предыдущих проектов по науке о данных и потенциальных путей развертывания моделей данных, которые должны использоваться совместно с несколькими науками о данных. Поэтому очень важно исследовать причины, по которым группам специалистов по обработке и анализу данных требуется контекст, согласованность и безопасное взаимодействие их данных для обеспечения успеха в области анализа данных. Давайте быстро рассмотрим каждое из этих требований, чтобы лучше понять, как может выглядеть успех в науке о данных.

Часть первая: контекст

 
Наше исследование будущего успеха науки о данных начинается с контекста: нет процесса итеративного построения модели. который основан на пробных экспериментах может длиться долго без институциональных знаний, которые документируются, хранятся и предоставляются специалистам по данным. И, тем не менее, значительная часть институциональных знаний регулярно теряется из-за отсутствия надлежащей документации и хранения.

Рассмотрим распространенный сценарий: начинающий специалист по обработке и анализу данных привлекается к участию в проекте, чтобы улучшить свои навыки, но вскоре после этого сталкивается с трудностями. синхронное и асинхронное сотрудничество из-за отсутствия контекста. Этим членам специальной команды нужен контекст, чтобы больше узнать о данных, с которыми они взаимодействуют, о людях, которые решали проблемы в прошлом, и о том, как предыдущая работа повлияла на текущий ландшафт проекта.

Необходимость должным образом документировать проекты, а также модели данных и их рабочие процессы могут легко отвлечь команду специалистов по данным, не говоря уже об одном, работающем в одиночку. Руководители могут рассмотреть возможность нанять внештатного разработчика посвятить свое время сохранению и распространению институциональных знаний для улучшения стандартных обзоров и отзывов о современных проектах по науке о данных. Эти сеансы, а также программные системы, рабочие места и передовой опыт могут упростить более эффективный захват контекста, связанного с проектом, что улучшит обнаружение данных младшими и гражданскими специалистами по данным в будущем.

Успех науки о данных требует упрощенное управление знаниями и окружающий его контекст. Без этого новые, младшие и гражданские специалисты по данным, вероятно, будут испытывать трудности с адаптацией и значимым вкладом в свои проекты, что, в свою очередь, приведет к тому, что команды будут воссоздавать проекты, а не вносить свой вклад в предыдущую работу. 

Часть вторая: последовательность

 
Области машинного обучения и искусственного интеллекта внесли свой вклад в фундаментальные изменения, когда речь идет о финансовых услугах, здравоохранении и науках о жизни, а также производстве; эти отрасли, тем не менее, подлежат значительной нормативно-правовой базы. Это означает, что проект ИИ, реализуемый в регулируемой среде, должен быть воспроизводим с четким контрольным следом. Другими словами, ИТ-руководители и бизнес-лидеры, которые так или иначе вовлечены в проект по науке о данных, должны обеспечить уровень согласованности данных когда дело доходит до результатов их проекта по науке о данных. 

Руководители ИТ и бизнеса, которые могут рассчитывать на надежный уровень согласованности, также могут чувствовать себя более уверенно, когда приходит время вносить стратегические изменения, которые облегчает ИИ. Когда речь идет о проектах по науке о данных, на карту поставлено многое, и они требуют больших инвестиций, поэтому специалисты по данным заслуживают инфраструктуры, в которой они могут работать с гарантированным уровнем воспроизводимости. от начала и до конца. Эта полная воспроизводимость приводит к согласованности данных, которые ищут топ-менеджеры, чтобы решить, является ли проект по науке о данных достаточно важным и соответствует их бизнес-целям.

Этим руководителям, в свою очередь, следует ожидать, что по мере расширения их научных групп будут расти и необходимые наборы для обучения и требования к оборудованию, чтобы обеспечить согласованность результатов старых проектов. Таким образом, процессы и системы, которые помогают управлять средой, являются абсолютной необходимостью для расширения команды специалистов по обработке и анализу данных. Если, например, специалист по данным использует ноутбук, а специалист по данным запускает другую версию библиотеки, работающую на облачной виртуальной машине, этот специалист по данным может увидеть, что их модель данных дает разные результаты на разных машинах. Итог: руководители должны убедиться, что их сотрудники, работающие с данными, имеют согласованный способ совместного использования одних и тех же программных сред.

Часть третья: сотрудничество

 
Наконец, мы подошли к важности безопасного сотрудничества. Поскольку предприятия продолжают переводить свою деятельность на модель работы на дому, организации понимают, что сотрудничество в области обработки данных намного сложнее, чем личное сотрудничество. Несмотря на то, что некоторыми основными обязанностями в области науки о данных можно управлять с помощью одной науки о данных (подготовка данных, исследование и итерация модели данных), большинство руководителей бизнеса по ошибке оставили совместную работу на второй план и впоследствии препятствовали удаленной продуктивности.

Но как обеспечить эффективную и удаленную координацию между участниками проекта, а также безопасность данных проекта? Ответ заключается в общих рабочих файлах и данных, относящихся к проекту по науке о данных. которые делают его более жизнеспособным распространять информацию дистанционно. И по мере того, как распространение данных, связанных с проектом, становится проще, чем проще становится обмен информацией, тем легче облегчить удаленную совместную работу с данными. Участники проекта по науке о данных могут использовать облачные инструменты для усиления безопасности своих исследований. но слишком многие лидеры совершили ошибку, не поощряя сотрудничество, снижая производительность.

Заключение

 
Явный прогресс, который произошел в области науки о данных за последние годы, был беспрецедентным и, откровенно говоря, удивительным. Развитие науки о данных позволило компаниям во всем мире решать вопросы, на которые раньше было мало, если вообще было, доступных ответов, без инноваций, которые стали возможными благодаря ИИ и МО. 

Однако по мере того, как мир науки о данных продолжает взрослеть и расти, пришло время для топ-менеджеров и команд по обработке данных, за которыми они наблюдают, отказаться от более ситуативного и реактивного способа выполнения работы. Ресурсы, которые специалисты по данным могут использовать для создания контекста, согласованности и более тесного сотрудничества, такие как программные рабочие места, вероятно, будут иметь важное значение для успеха в науке о данных. В конечном счете, проекты потребуют меньше усилий от специалистов по данным, инженеров, аналитиков и исследователей, которые смогут лучше ускорить непрерывный и удивительный успех в этой области.

 
 
Нахла Дэвис является разработчиком программного обеспечения и техническим писателем. Прежде чем полностью посвятить свою работу техническому письму, ей удалось, среди прочего, поработать ведущим программистом в организации по брендингу Inc. 5,000, клиентами которой являются Samsung, Time Warner, Netflix и Sony.

Источник: https://www.kdnuggets.com/2022/01/context-consistency-collaboration-essential-data-science-success.html.

Отметка времени:

Больше от КДнаггетс