تقریباً هر شرکتی یک تیم علم داده دارد. به عنوان رهبر تیم، مسئولیت شما این است که تیم را مؤثر کنید، یعنی چیزهای جدیدی را ارسال کنید که ارزش تجاری را به تولید اضافه کند و در طول زمان به بهبود ادامه دهد.
داشتن الگوریتم های علم داده در تولید هدف نهایی است. هر چند رسیدن به تولید به خودی خود اتفاق نمی افتد. شرایطی کاملاً ممکن است که تیمی از افراد با استعداد به سختی بر روی الگوریتمهای پیچیده ریاضی در نوتبوکهای Jupyter کار کنند که هرگز کاملاً موفق به تولید محصول نهایی نمیشوند.
این مقاله بهترین روشها را برای عبور از موانع هدایت یک تیم علم داده به سمت تولید پوشش میدهد. یعنی اطمینان از کار بر روی مشکلات درست، ایجاد یک سیستم پردازش داده قوی، و حمایت از تیم خود در سازمان.
کار بر روی مشکلات درست، به صورت تدریجی
فرض کنید تیم شما وظیفه دارد برای یک فروشگاه آنلاین که تجهیزات ورزشی می فروشد، توصیه هایی برای محصول ایجاد کند. آنها هرگز توصیه های محصول را در وب سایت نشان نداده اند. دانشمندان داده شما در مورد اجرای آخرین الگوریتم فیلتر مشارکتی که در مورد آن مطالعه کرده اند هیجان زده هستند و نظرات شما را می خواهند. چه باید گفت؟
در این مورد، منطقی است که شور و شوق اعضای تیم خود را از «آنچه از نظر آکادمیک برای پیادهسازی جالبتر است» به سمت «چگونه میتوانیم به عنوان یک تیم، کمک سریع و محکمی در جهت اهداف تجاری شرکت داشته باشیم» هدایت کنید. یعنی افزایش فروش و تعامل کاربر.»
این ممکن است به معنای کنار گذاشتن مقالات یادگیری ماشین برای لحظهای باشد و یک الگوریتم ساده برای نمایش توصیههای محصول بر اساس دستهبندی هر کاربر که بیشترین جستجو را انجام داده است، اجرا شود. همچنین ممکن است به معنای نظارت بر میزان کلیک روی این توصیهها باشد. این کار ممکن است چند روز یا چند هفته طول بکشد، و پس از ادغام در وب سایت و نظارت بر آن در طول زمان، می تواند تصمیمات بعدی را تعیین کند. بهبودهای بیشتر، که ممکن است شامل یک رویکرد فیلتر مشارکتی باشد، سپس می تواند با ایده اولیه کار مقایسه شود.
ایجاد انگیزه در افراد باهوش دارای مدرک دکترا برای کار بر روی "میوه کم آویزان"، مانند یافتن دسته بندی محصولی که بیشترین جستجو را برای هر کاربر دارد، می تواند بسیار دشوار باشد. چند راه برای متقاعد کردن آنها عبارتند از:
- به این نکته اشاره کنید که الگوریتم های ساده همیشه می توانند به صورت تدریجی پیچیده تر شوند، در حالی که برعکس این کار دشوارتر است. ساختن چیزهای ساده ابتدا به این معنی است که الگوریتم به احتمال زیاد در دراز مدت به شکلی باقی می ماند.
- به دانشمندان داده اجازه دهید و حتی آنها را تشویق کنید تا پروژههای جانبی را دنبال کنند، در طول ساعات کاری مقالات را بخوانند. شاید حتی هکاتونهای داخلی سازماندهی شود که در آن دانشمندان داده میتوانند دادهها را بدون توجه به ادغام نتیجه نهایی با محصول به کار ببرند. این فعالیت ها می تواند آنها را تیز و الهام بخش نگه دارد.
- ترتیبی دهید که دانشمندان داده یک جلسه دو هفته ای یا ماهانه یک به یک با سهامداران کسب و کار داشته باشند. به این ترتیب آنها به چشم انداز شرکت متصل می مانند.
مهم است که از تیم خود بخواهید که به طور منظم با شما در ارتباط باشند که روی چه چیزی و چرا کار می کنند، تا بفهمند که امیدوارند به چه چیزی دست پیدا کنند. راه های مختلفی برای پیگیری وظایف وجود دارد، مانند تابلوهای Kanban یا JIRA. نگه داشتن تاریخچه ایده هایی که مردم داشته اند و اینکه آیا ایده ها به نتیجه رسیده اند یا خیر. نه برای قضاوت افراد، بلکه برای ایجاد یک شهود جمعی از آنچه احتمالاً مؤثر است و آنچه قبلاً امتحان شده است.
همانطور که برای خودتان، منطقی است که جلسات هفتگی (یا مکرر) با جنبه های تجاری داشته باشید. این کار برای اطمینان از اینکه موارد کاری تیم با نیازهای واقعی کسب و کار مطابقت دارند و با تغییر این نیازها به روز می شوند. برای پربارتر کردن جلسات، سؤالات زیادی بپرسید تا نیازهای واقعی را از کلمات کلیدی تشخیص دهید و انتظارات را روشن کنید. از آنجایی که شما کسی هستید که بیشترین دانش را در مورد داده ها دارید، در مورد آنچه ممکن است با داده هایی که در اختیار دارید پیشنهاد دهید. در اینجا چند نکته وجود دارد که می توانید مطرح کنید:
- ما داده های کافی برای اعمال [الگوریتم های یادگیری عمیق] نداریم.
- وقتی [ما یادگیری ماشینی را در توصیههایمان ادغام کردهایم، انتظار دارید چه ارزشی برای کسبوکار داشته باشد؟
- تیم خدمات مشتری [x ساعت در ماه] را صرف طبقهبندی شدت بلیطهای پشتیبانی میکند. ما می توانیم ابزاری بسازیم تا به طور خودکار آنها را طبقه بندی کنیم تا زمان آزاد شود. شما چی فکر میکنید؟
هنگامی که مسیری را که تیم علم داده باید طی کند را مشخص کردید، زمان آن فرا رسیده است که رسیدن به آنجا را تا حد امکان آسان کنید.
ساختن یک سیستم قوی
استحکام به این موضوع اشاره دارد که یک سیستم پردازش داده تا چه حد می تواند به ورودی ها و بارهای غیرمنتظره پاسخ دهد، مسائل با چه سرعتی آشکار و حل می شوند و آیا مکانیزمی برای ادغام بازخورد بیرونی در سیستم وجود دارد یا خیر. شما میخواهید مراقب نحوه رفتار سیستم با توجه به خطاهای فنی و همچنین نتایج تجاری باشید.
با ادامه مثال ایجاد توصیهها، برای جلوگیری از خطا، باید آنچه را که هنگام حذف یا سازماندهی مجدد دسته مورد علاقه کاربر اتفاق میافتد، پیگیری کنید. مهمتر از آن، شما همچنین باید نظارت کنید که چگونه معیارهای کسب و کار تحت تأثیر تغییرات قرار می گیرند، مانند نسبت کلیک بر روی پیوندهای توصیه شده.
تلاش برای پیچیدهتر کردن تولید توصیهها (به عنوان مثال، در نظر گرفتن جنسیت کاربر یا زبان مرورگر) بدون وجود سیستمی برای پیگیری معیارهای تجاری تحت تأثیر، سوء استفاده از منابع است. پیچیدگی الگوریتمها و پیچیدگی سیستمی که کیفیت را تضمین میکند و بازخورد ارائه میکند باید با سرعتی مشابه رشد کند.
به عنوان سرپرست تیم، این وظیفه شماست که زیرساختی را راه اندازی کنید که یکپارچه سازی، تحویل و ارزیابی الگوریتم های علم داده را امکان پذیر می کند. شما باید خودتان پایهریزی کنید و از استخدام افراد کلیدی برای حمایت از این تلاش - یعنی مهندسان داده - دفاع کنید. اینها افرادی هستند که تست های رگرسیون جامع را روی مجموعه داده های بزرگ می نویسند، خطوط لوله داده و ماشین های تهیه را با وابستگی های لازم برای دانشمندان داده راه اندازی و نظارت می کنند. آنها همچنین ابزارهای سفارشی را برای ترکیب دادههای نتیجه کسبوکار و دادههای مربوط به نسخههای الگوریتمی که این نتایج را ایجاد کردهاند، خواهند ساخت. این داده ها دقیقاً بازخوردی هستند که باید قبل از ادامه کار یکپارچه شوند.
شاید تماشای آن جالب باشد این صحبت توسط جسی تی اندرسون. او در مورد اهمیت داشتن مهندسان داده و تعداد مناسب در تیم شما عمیقاً صحبت می کند، که به معنای داشتن تعداد بیشتری از آنها نسبت به دانشمندان داده واقعی است.
ایجاد روابط درون سازمانی
حتی اگر تیم علم داده با پشتوانه مهندسین داده و فرآیندهای جامد، سخت روی خلق ارزش کار کند، باز هم موانع خارجی ممکن است افزایش یابد. این موانع میتوانند به شکل تیمی متفاوت در حال تغییر سیستمهای مشترک، مانند APIها، بدون مشورت با تیم علم داده باشند. همچنین می تواند به سادگی این باشد که بقیه سازمان از ارزشی که تیم علم داده ارائه می دهد بی خبر بماند.
هیچ وقت دیر نیست و پیش از بروز سوءتفاهم های جدی، فعال بودن و ایجاد روابط قوی با تیم های دیگر هرگز دیر نیست. اگر شرکت شما ارائههای داخلی دورهای دارد، حتماً آنچه را که روی آن کار میکنید ارائه دهید. اگر سیستمی برای پیگیری الگوریتمهایی وجود داشته باشد که نتایج کسبوکار را دنبال میکند، همانطور که در بخش قبل توضیح داده شد، ارائهای درباره ارزشی که تیم علم داده ارائه میدهد، یا شاید درباره آنچه امتحان شده و کاملاً جواب نداده است، جمع آوری کنید. .
از سایر بخشها دعوت کنید تا با سؤالات و ایدهها نزد شما بیایند. برخی از بخشها هستند که به طور طبیعی با تیم علم داده رابطه نزدیکی دارند، مانند بازاریابی و تجزیه و تحلیل. مطمئن شوید که آنها چگونه کار می کنند و چگونه می توانند داده های مربوط به معیارهای تجاری مانند نرخ کلیک و نرخ تبدیل را در اختیار شما قرار دهند.
به ویژه برای همکاری با سایر تیم های فنی، الگوهای شناخته شده ای وجود دارد که می توانید از آنها استفاده کنید. بیایید یک معماری میکرو سرویس را فرض کنیم، جایی که توصیه ها توسط یک برنامه وب سبک وزن یا یک لامبدا ارائه می شود. برای آزمایش تعامل بین سرویس توصیه و سایر سرویسها هنگام بهروزرسانی هر یک از آنها، میتوان از تست های قرارداد مبتنی بر مصرف کننده و آن تست ها را به فرآیند ادغام پیوسته اضافه کنید. تو میتوانی بخوانی این مقاله توسط ایان رابینسون برای تجزیه و تحلیل کامل این الگوی آزمایشی. تستهای قرارداد مبتنی بر مصرفکننده زمانی که یک تغییر اساسی رخ دهد با شکست مواجه میشوند (به عنوان مثال، یک API تغییر میکند و مشتریان آن همچنان انتظار نوع قدیمی دادهها را دارند). این یک هشدار فوری است مبنی بر اینکه یک یا چند سرویس باید قبل از استقرار در تولید تنظیم شوند و اطمینان حاصل می کند که تیم های مختلف همگام هستند.
نتیجه
به عنوان رهبر تیم علم داده، ممکن است در تصمیمات و مسئولیت ها غرق شوید. تنها نکته مهم این است که مطمئن شوید شما و تیمتان با حل مشکلات تجاری ملموس در مسیر درست حرکت می کنید. این یک فرآیند ثابت مدیریت ارتباط با ذینفعان با تغییر اولویت ها است. ایجاد یک فرآیند توسعه پایدار و ایجاد روابط قوی در درون سازمان می تواند پیشرفت شما را تسریع کند.
بدون پایه ای برای ارائه ارزش تجاری و توانایی اندازه گیری آن، برتری فنی کاربرد محدودی خواهد داشت و برای ایجاد اعتماد با سایر تیم ها کافی نخواهد بود. هدف ارائه تدریجی ارزش کافی برای القای این اعتماد است که با تغییر و تحول کسب و کار، تیم علم داده به همان اندازه آماده سازگاری و استفاده مناسب از داده ها و فرصت های موجود خواهد بود.
منبع: https://www.codementor.io/blog/data-science-production-7h8ko1958k
- &
- حساب
- فعالیت ها
- مدافع
- حمایت از
- الگوریتم
- الگوریتم
- تحلیل
- علم تجزیه و تحلیل
- API
- رابط های برنامه کاربردی
- نرم افزار
- معماری
- دور و بر
- مقاله
- بهترین
- بهترین شیوه
- مرورگر
- ساختن
- بنا
- کسب و کار
- ایجاد می شود
- تغییر دادن
- مشتریان
- ارتباط
- شرکت
- مشاوره
- ادامه
- قرارداد
- تبدیل
- خدمات مشتری
- داده ها
- پردازش داده ها
- علم اطلاعات
- یادگیری عمیق
- تحویل
- پروژه
- موثر
- مورد تأیید
- تجهیزات
- چشم
- نام خانوادگی
- فرم
- رایگان
- جنس
- خوب
- شدن
- اینجا کلیک نمایید
- استخدام
- تاریخ
- امید
- چگونه
- HTTPS
- اندیشه
- شالوده
- ادغام
- اثر متقابل
- علاقه
- شهود
- مسائل
- IT
- کار
- نگهداری
- کلید
- دانش
- زبان
- بزرگ
- آخرین
- رهبری
- برجسته
- یادگیری
- محدود شده
- طولانی
- فراگیری ماشین
- ماشین آلات
- ساخت
- بازار یابی (Marketing)
- اندازه
- جلسات
- اعضا
- متریک
- نظارت بر
- از جمله
- نوت بوک
- تعداد
- آنلاین
- سفارش
- دیگر
- الگو
- مردم
- در حال حاضر
- ارایهها در همایشهای علمی
- محصول
- تولید
- پروژه ها
- کیفیت
- بالا بردن
- نرخ
- مطالعه
- تغییر مسیر
- رگرسیون
- روابط
- مورد نیاز
- منابع
- REST
- حراجی
- علم
- دانشمندان
- حس
- خدمات
- تنظیم
- به اشتراک گذاشته شده
- ساده
- هوشمند
- ورزش ها
- ماندن
- پشتیبانی
- قابل تحمل
- سیستم
- سیستم های
- فنی
- آزمون
- تست
- تست
- زمان
- مسیر
- اعتماد
- به روز رسانی
- ارزش
- دید
- تماشا کردن
- وب
- سایت اینترنتی
- هفتگی
- چه شده است
- WHO
- در داخل
- مهاجرت کاری
- ساعات کاری
- X