راهنمای جامع موتورهای پیشنهادی در سال 2022

گره منبع: 1883089

این مقاله به عنوان بخشی از بلاگاتون علم داده.

معرفی

ارزش بازار جهانی استفاده از Recommendation Engine در سال 2.69 برابر با 2021 میلیارد دلار بود. پیش بینی می شود تا سال 15.10 از 2026 میلیارد دلار فراتر رود و CAGR 37.79 درصد را طی سال های 2022-2026 گزارش می کند.

توصیه هایی که شرکت ها به شما می دهند، گاهی از تکنیک های تجزیه و تحلیل داده ها برای شناسایی مواردی استفاده می کنند که با سلیقه و ترجیحات شما مطابقت دارند. با توجه به رشد سریع داده‌ها از طریق اینترنت، تعجبی ندارد که بگوییم نتفلیکس می‌داند که می‌خواهید کدام فیلم بعدی را تماشا کنید یا مقاله خبری برتر را که می‌خواهید در توییتر خود بخوانید.

با پیشرفت‌های اخیر در هوش مصنوعی و رقابت فزاینده در بین شرکت‌های متعدد، جستجو، نقشه‌برداری و ارائه داده‌های مربوطه به کاربران برای بهبود تجربه مصرف‌کننده و افزایش روند دیجیتالی‌سازی ضروری است.

با این اوصاف، در راهنمای امروز، موتورهای توصیه، اهمیت آن‌ها، چالش‌های پیش روی، اصول کار، تکنیک‌های مختلف، اپلیکیشن‌ها و شرکت‌های برتر استفاده‌کننده از آن‌ها و در آخر، نحوه ساخت موتور توصیه‌ای خود در پایتون را مورد بحث قرار خواهیم داد.

فهرست مطالب

  • Recommendation Engines چیست؟
  • چرا موتورهای توصیه در یادگیری ماشین مهم هستند؟
  • تکنیک های مختلف موتورهای توصیه کننده
  • کار موتورهای توصیه
  • چالش های موتورهای توصیه
  • چگونه یک موتور توصیه بسازیم
  • برنامه ها و شرکت های برتر با استفاده از موتورهای توصیه
  • نتیجه

Recommendation Engine چیست؟

موتور توصیه یک سیستم فیلترینگ داده است که بر اساس الگوریتم های مختلف یادگیری ماشینی عمل می کند تا محصولات، خدمات و اطلاعات را به کاربران بر اساس تجزیه و تحلیل داده ها توصیه کند. بر اساس اصل یافتن الگوها در داده‌های رفتار مشتری با استفاده از عوامل مختلفی مانند ترجیحات مشتری، تاریخچه معاملات گذشته، ویژگی‌ها یا زمینه موقعیتی کار می‌کند.

داده های مورد استفاده برای یافتن بینش ها را می توان به طور ضمنی یا صریح جمع آوری کرد. شرکت ها معمولاً از پتابایت داده برای موتورهای توصیه خود استفاده می کنند تا نظرات خود را با تجربیات، رفتارها، ترجیحات و علایق خود ارائه دهند.

در این بازار همیشه در حال تحول از تراکم اطلاعات و اضافه بار محصول، هر شرکت از موتورهای توصیه برای اهداف کمی متفاوت استفاده می کند. با این حال، همه هدف یکسانی از فروش بیشتر، افزایش تعامل و حفظ مشتری، و ارائه بخشی از دانش و راه حل های شخصی به مصرف کنندگان دارند.

چرا موتورهای توصیه در ML مهم هستند؟

شکی نیست که موتورهای توصیه روشی خارق‌العاده برای افزایش تجربه کاربر، تحریک تقاضا، افزایش درآمد، افزایش نرخ کلیک (CTR)، تعامل فعال با کاربران و سایر معیارهای مهم هستند. موتورهای توصیه به عنوان ابزارهای قدرتمند فیلتر کردن داده ها، در زمان واقعی کار می کنند. هنگامی که تقاضا برای ارائه پیشنهادات و توصیه های شخصی به کاربران وجود دارد، آنها می توانند سودمند باشند.

اجازه دهید نتفلیکس را به عنوان مثال در نظر بگیریم.

هزاران فیلم و چندین دسته نمایش برای تماشا وجود دارد. با این حال، نتفلیکس مجموعه‌ای از نمایش‌های تبلیغاتی فیلم‌هایی را که به احتمال زیاد از آنها لذت خواهید برد، به شما پیشنهاد می‌کند. با این استراتژی، نتفلیکس به نرخ لغو کمتری دست می یابد، یک میلیارد دلار در سال صرفه جویی می کند، در وقت شما صرفه جویی می کند و تجربه کاربری بهتری را ارائه می دهد.

به همین دلیل است که موتورهای توصیه ضروری هستند و دقیقاً چه تعداد از کسب و کارها با ارائه هجوم قابل توجهی از فرصت های فروش متقابل فرصت های تعامل را با محصولات خود افزایش می دهند.

تکنیک های مختلف موتورهای پیشنهادی

سه نوع مختلف از موتورهای توصیه‌گر در یادگیری ماشینی شناخته شده است که عبارتند از:

1. فیلتر مشارکتی

روش فیلتر مشارکتی داده‌های مربوط به رفتار کاربر، فعالیت‌های آنلاین و اولویت‌ها را جمع‌آوری و تجزیه و تحلیل می‌کند تا بر اساس شباهت با سایر کاربران، آنچه را که دوست دارند پیش‌بینی کند. از یک فرمول به سبک ماتریسی برای رسم و محاسبه این شباهت ها استفاده می کند.

مزیت

یکی از مزیت‌های مهم فیلتر مشارکتی این است که برای توصیه دقیق موارد پیچیده، نیازی به تجزیه و تحلیل یا درک موضوع (محصولات، فیلم‌ها، کتاب‌ها) ندارد. هیچ وابستگی به محتوای قابل تجزیه و تحلیل ماشین وجود ندارد، به این معنی که توصیه هایی را بر اساس آنچه در مورد کاربر می داند انتخاب می کند.

مثال

اگر کاربر X کتاب A، کتاب B و کتاب C را دوست داشته باشد در حالی که کاربر Y کتاب A، کتاب B و کتاب D را دوست دارد، علایق مشابهی دارند. بنابراین، این امکان وجود دارد که کاربر X کتاب D را انتخاب کند و کاربر Y از خواندن Bood C لذت ببرد. فیلترینگ مشارکتی اینگونه اتفاق می‌افتد.

2. فیلتر بر اساس محتوا

فیلترینگ مبتنی بر محتوا بر اساس اصل توصیف یک محصول و نمایه ای از انتخاب های مورد نظر کاربر عمل می کند. فرض بر این است که اگر یک مورد خاص را دوست دارید، این مورد دیگر را نیز دوست خواهید داشت. محصولات با استفاده از کلمات کلیدی (ژانر، نوع محصول، رنگ، طول کلمه) برای ارائه توصیه ها تعریف می شوند. یک نمایه کاربری برای توصیف نوع موردی که این کاربر از آن لذت می برد ایجاد می شود. سپس الگوریتم شباهت موارد را با استفاده از فاصله کسینوس و اقلیدسی ارزیابی می کند.

مزیت

یکی از مزیت‌های مهم این تکنیک موتور توصیه‌گر این است که نیازی به اطلاعات اضافی در مورد سایر کاربران ندارد زیرا توصیه‌ها مختص این کاربر است. همچنین، این مدل می‌تواند علایق خاص یک کاربر را به تصویر بکشد و اشیاء خاص را پیشنهاد دهد که تعداد کمی از کاربران به آن علاقه‌مند هستند.

مثال

فرض کنید یک کاربر X دوست دارد فیلم های اکشن مانند مرد عنکبوتی را تماشا کند. در این صورت، این تکنیک موتور توصیه‌گر فقط فیلم‌هایی در ژانر اکشن یا فیلم‌هایی که تام هالند را توصیف می‌کنند، توصیه می‌کند.

3. مدل ترکیبی

در سیستم‌های توصیه ترکیبی، هم داده‌های متا (همکاری) و هم داده‌های معاملاتی (مبتنی بر محتوا) به طور همزمان استفاده می‌شوند تا طیف وسیع‌تری از موارد را به کاربران پیشنهاد دهند. در این تکنیک، تگ های پردازش زبان طبیعی را می توان برای هر شی (فیلم، آهنگ) اختصاص داد و معادلات برداری شباهت را محاسبه می کند. سپس یک ماتریس فیلتر مشترک می‌تواند بسته به رفتار، اعمال و نیات کاربران، چیزهایی را به کاربران پیشنهاد دهد.

مزایای

این سیستم توصیه در حال ظهور است و گفته می شود که از نظر دقت از هر دو روش فوق بهتر عمل می کند.

مثال

نتفلیکس از یک موتور توصیه هیبریدی استفاده می کند. با تجزیه و تحلیل علایق کاربر (مشارکتی) و توصیه نمایش‌ها/فیلم‌هایی که ویژگی‌های مشابهی با مواردی که کاربر رتبه بالایی دارد (مبتنی بر محتوا) را توصیه می‌کند.

کار موتورهای توصیه

داده ها حیاتی ترین عنصر در ساخت موتور توصیه هستند. این بلوک ساختمانی است که الگوها توسط الگوریتم ها از آن استخراج می شوند. هر چه جزئیات بیشتری داشته باشد، با دقت و عملی بیشتری توصیه های درآمدزایی مناسب را ارائه می دهد. اساساً یک موتور توصیه با استفاده از ترکیبی از الگوریتم های داده و یادگیری ماشین در چهار فاز کار می کند. بیایید اکنون آنها را با جزئیات درک کنیم:

1 جمع آوری داده ها

اولین و مهم ترین مرحله برای ایجاد یک موتور توصیه جمع آوری داده های مناسب برای هر کاربر است. دو نوع داده وجود دارد، به عنوان مثال، صریح داده هایی که حاوی اطلاعات جمع آوری شده از ورودی های کاربر مانند رتبه بندی ها، نظرات، پسندیدن ها، نپسندیدن ها یا نظرات در مورد محصولات.

در مقابل، ما داریم ضمنی داده هایی که حاوی اطلاعات جمع آوری شده از فعالیت های کاربر مانند سابقه جستجوی وب، کلیک‌ها، اقدامات سبد خرید، گزارش جستجو و تاریخچه سفارش.

نمایه داده های هر کاربر در طول زمان متمایزتر می شود. از این رو جمع آوری داده های ویژگی های مشتری مانند:

  • جمعیت شناسی (سن، جنسیت)
  • روانشناسی (علائق، ارزشها) برای شناسایی مشتریان مشابه
  • داده های ویژگی (ژانر، نوع شی) برای تعیین شباهت محصولات مشابه.

2. ذخیره اطلاعات

هنگامی که داده ها را جمع آوری کردید، گام بعدی ذخیره سازی کارآمد داده ها است. همانطور که داده های بیشتری را جمع آوری می کنید، فضای ذخیره سازی گسترده و مقیاس پذیر باید در دسترس باشد. بسته به نوع داده ای که جمع آوری می کنید چندین گزینه ذخیره سازی در دسترس هستند، مانند NoSQL، پایگاه داده استاندارد SQL، MongoDB و AWS.

هنگام انتخاب بهترین گزینه های ذخیره سازی، باید عواملی را در نظر گرفت: سهولت اجرا، اندازه ذخیره سازی داده ها، یکپارچگی و قابلیت حمل.

3. داده ها را تجزیه و تحلیل کنید

پس از جمع آوری داده ها، باید داده ها را تجزیه و تحلیل کنید. سپس داده ها باید حفاری و تجزیه و تحلیل شوند تا توصیه های فوری ارائه شود. رایج ترین روش هایی که در آن می توانید داده ها را تجزیه و تحلیل کنید عبارتند از:

  • تجزیه و تحلیل زمان واقعی، که در آن سیستم از ابزارهایی استفاده می کند که رویدادها را هنگام ایجاد ارزیابی و تجزیه و تحلیل می کند. این تکنیک عمدتا زمانی اجرا می شود که بخواهیم توصیه های فوری ارائه دهیم.
  • تجزیه و تحلیل دسته ای، که در آن پردازش و تجزیه و تحلیل داده ها به صورت دوره ای انجام می شود. این تکنیک عمدتا زمانی اجرا می شود که بخواهیم ایمیل هایی با توصیه ها ارسال کنیم.
  • تحلیل زمان واقعی، که در آن داده ها را به جای چند ثانیه در عرض چند دقیقه تجزیه و تحلیل و پردازش می کنید زیرا فوراً به آن نیاز ندارید. این تکنیک عمدتاً زمانی اجرا می‌شود که وقتی کاربر هنوز در سایت است، توصیه‌هایی ارائه می‌کنیم.

4. فیلتر کردن داده ها

هنگامی که داده ها را تجزیه و تحلیل می کنید، مرحله نهایی فیلتر کردن دقیق داده ها برای ارائه توصیه های ارزشمند است. ماتریس‌ها، قواعد ریاضی و فرمول‌های مختلف برای ارائه پیشنهاد درست روی داده‌ها اعمال می‌شوند. شما باید الگوریتم مناسب را انتخاب کنید و نتیجه این فیلترینگ توصیه هاست.

چالش های موتورهای توصیه

کمال به سادگی وجود ندارد. یک فیزیکدان نظری انگلیسی "استیون هاوکینگ" یک بار گفت:

"یکی از قوانین اساسی جهان این است که هیچ چیز کامل نیست."

به طور مشابه، برخی از چالش‌ها وجود دارد که شرکت‌ها برای ایجاد یک سیستم توصیه‌گر مؤثر باید بر آن‌ها غلبه کنند. در اینجا به برخی از آنها اشاره می کنیم:

1. مشکل شروع سرد

این مشکل زمانی ایجاد می شود که یک کاربر جدید به سیستم می پیوندد یا موارد جدیدی را به رکورد اضافه می کند. سیستم توصیه‌گر نمی‌تواند در ابتدا این مورد یا کاربر جدید را پیشنهاد دهد زیرا هیچ رتبه‌بندی یا نظری ندارد. از این رو، پیش‌بینی اولویت‌ها یا اولویت‌های کاربر جدید یا رتبه‌بندی موارد جدید برای موتور چالش‌برانگیز است که منجر به توصیه‌های دقیق‌تر می‌شود.

به عنوان مثال، یک فیلم جدید در نتفلیکس را نمی توان توصیه کرد تا زمانی که تعداد زیادی بازدید و رتبه بندی دریافت کند.

با این حال، یک مدل مبتنی بر یادگیری عمیق می‌تواند مشکل شروع سرد را حل کند، زیرا این مدل‌ها برای پیش‌بینی به رفتار کاربر بستگی زیادی ندارند. می تواند با بررسی زمینه محصول و جزئیات کاربر مانند توضیحات محصول، تصاویر و رفتارهای کاربر، همبستگی بین کاربر و مورد را بهینه کند.

2. مشکل پراکندگی داده ها

همانطور که همه ما می دانیم، موتورهای توصیه به شدت به داده ها بستگی دارند. در برخی شرایط، برخی از کاربران رتبه بندی یا بررسی اقلامی را که خریداری کرده اند ارائه نمی دهند. اگر داده‌های باکیفیت نداشته باشیم، مدل رتبه‌بندی بسیار پراکنده می‌شود و منجر به مشکلات پراکندگی داده‌ها می‌شود.

این مشکل یافتن کاربران با رتبه‌بندی یا علایق مشابه را برای الگوریتم چالش‌برانگیز می‌کند.

برای اطمینان از بهترین کیفیت داده ها و برای اینکه بتوانید از موتور توصیه حداکثر استفاده را ببرید، چهار سوال از خود بپرسید:

  • داده ها چقدر جدید هستند؟
  • اطلاعات چقدر پر سر و صدا است؟
  • اطلاعات چقدر متنوع است؟
  • چقدر سریع می توانید داده های جدید را به مدل سیستم توصیه کننده خود وارد کنید؟

سوالات بالا تضمین می کند که کسب و کار شما با الزامات پیچیده تجزیه و تحلیل داده ها مطابقت دارد.

3. مشکل تغییر تنظیمات کاربر

تعاملات کاربر و آیتم در رتبه بندی و بررسی ها می تواند داده های تغییر عظیمی ایجاد کند.

به عنوان مثال، ممکن است امروز در نتفلیکس باشم تا با دوست دخترم یک فیلم عاشقانه تماشا کنم. اما فردا، ممکن است حال و هوای دیگری داشته باشم، و یک تریلر روانشناختی کلاسیک چیزی است که دوست دارم تماشا کنم.

در مورد اولویت های کاربر، موتورهای توصیه گر ممکن است به اشتباه کاربران را برچسب گذاری کنند، که نتایج را در مجموعه داده های بزرگ به طور ناکارآمد تفسیر می کند. از این رو، مقیاس پذیری یک چالش بزرگ برای این مجموعه داده ها است و برخی روش های پیشرفته در مقیاس بزرگ برای پرداختن به این موضوع مورد نیاز است.

چگونه یک موتور توصیه در پایتون بسازیم؟

این بخش راهنما به شما کمک می کند تا سیستم های توصیه اولیه را در پایتون بسازید. ما با توصیه مواردی که با یک آیتم خاص، در مورد ما، فیلم، قابل مقایسه هستند، بر ایجاد یک سیستم توصیه اولیه تمرکز خواهیم کرد. به خاطر داشته باشید، این یک موتور توصیه دقیق و قوی نیست. این فقط نشان می‌دهد که چه فیلم‌ها/اقلامی بیشتر شبیه به اولویت فیلم شما هستند.

کدها و فایل های دیتا را در انتهای این قسمت می توانید پیدا کنید. پس بیایید شروع کنیم:

توجه داشته باشید: برای اجرای این کد بسیار پیشنهاد می شود که روی google collab یا notebook jupyter کار کنید.

#1. کتابخانه های مورد نیاز را وارد کنید.

کتابخانه‌های یادگیری ماشینی numpy و pandas را وارد کنید، زیرا ما از آنها برای فریم‌های داده و ارزیابی همبستگی‌ها استفاده خواهیم کرد.

رمز

numpy را به عنوان np وارد کنید وارد کردن پانداها به عنوان pd

#2. داده ها را دریافت کنید

نام ستون ها را تعریف کنید، فایل csv مجموعه داده فیلم ها و نظرات را بخوانید و 5 ردیف اول را چاپ کنید.

رمز

column_names = ['user_id'، 'item_id'، 'rating', 'timestamp'] df = pd.read_csv('u.data', sep='t', names=column_names) df.head()

تولید

Recommendation Engines 2022

همانطور که در بالا می بینید، ما چهار ستون داریم: شناسه کاربر، که برای هر کاربر منحصر به فرد است. شناسه مورد برای هر فیلم، رتبه بندی فیلم و مهر زمانی آنها منحصر به فرد است.

حالا بیایید عنوان فیلم را دریافت کنیم:

رمز

movie_titles = pd.read_csv("نام_عناوین_فیلم") movie_titles.head()

تولید

خروجی | Recommendation Engines 2022

داده ها را با استفاده از کتابخانه پانداها بخوانید و 5 ردیف بالای مجموعه داده را چاپ کنید. ما شناسه و عنوان هر فیلم را داریم.

اکنون می توانیم دو ستون را به هم بپیوندیم:

رمز

df = pd.merge(df,file_titles,on='item_id') df.head()

تولید

کد | Recommendation Engines 2022

اکنون چارچوب داده ترکیبی را داریم که در ادامه برای تجزیه و تحلیل داده های اکتشافی (EDA) از آن استفاده خواهیم کرد.

#3. تجزیه و تحلیل داده های اکتشافی

بیایید کمی داده ها را بررسی کنیم و نگاهی به برخی از بهترین فیلم ها بیاندازیم.

واردات تجسم اولین قدم ما در EDA خواهد بود.

رمز

matplotlib.pyplot را به صورت plt وارد کنید واردات دریا به عنوان sns sns.set_style ('سفید') %matplotlib درون خطی

در مرحله بعد، ما یک چارچوب داده رتبه بندی با رتبه بندی متوسط ​​و تعداد رتبه بندی ها به عنوان دو ستون خود ایجاد خواهیم کرد:

رمز

df.groupby('title')['rating'].mean().sort_values(ascending=False).head()

تولید

تجزیه و تحلیل داده های اکتشافی

رمز

df.groupby('title')['rating'].count().sort_values(ascending=False).head()

تولید

خروجی 3 | Recommendation Engines 2022

رمز

رتبه بندی = pd.DataFrame(df.groupby('title')['rating'].mean()) ratings.head()

تولید

خروجی 4 | Recommendation Engines 2022

سپس، تعداد ستون‌های رتبه‌بندی را درست در کنار میانگین رتبه‌بندی‌ها تنظیم کنید:

رمز

رتبه‌بندی‌ها['تعداد رتبه‌بندی‌ها'] = pd.DataFrame(df.groupby('title')['rating'].count()) ratings.head()

تولید

Recommendation Engines 2022

برای بررسی بصری چندین رتبه بندی، چند هیستوگرام ترسیم کنید:

رمز

plt.figure(figsize=(10,4،XNUMX)) رتبه‌بندی‌ها['تعداد رتبه‌بندی‌ها'].hist(bins=70)

تولید

Recommendation Engines 2022 | خروجی

رمز

plt.figure(figsize=(10,4،XNUMX)) رتبه بندی['rating'].hist(bins=70)

تولید

خروجی | Recommendation Engines 2022

رمز

sns.jointplot(x='rating',y='تعداد رتبه بندی',data=ratings,alpha=0.5)

تولید

Recommendation Engines 2022

باشه! اکنون که دید جامعی از شکل داده ها داریم، بیایید به ساخت یک سیستم توصیه ساده در پایتون برویم:

#4. پیشنهاد فیلم های مشابه

حالا بیایید یک ماتریس با شناسه های کاربری و عنوان فیلم بسازیم. سپس هر سلول شامل رتبه‌بندی کاربر از آن فیلم می‌شود.

توجه داشته باشید: تعداد زیادی وجود خواهد داشت NaN ارزش‌ها چون اکثر مردم بیشتر فیلم را ندیده‌اند.

رمز

moviemat = df.pivot_table(index='user_id',columns='title',values='rating') moviemat.head()

تولید

پیشنهاد فیلم های مشابه

چاپ بیشترین امتیاز فیلم ها:

رمز

ratings.sort_values('num of ratings',ascending=False).head(10)

تولید

خروجی | پیشنهاد فیلم های مشابه

بیایید دو فیلم را انتخاب کنیم: جنگ ستارگان، یک فیلم علمی تخیلی. و دیگری Liar Liar که کمدی است. گام بعدی این است که امتیاز کاربران را برای آن دو فیلم بگیرید:

رمز

starwars_user_ratings = moviemat['Star Wars (1977)'] liarliar_user_ratings = moviemat['دروغگو دروغگو (1997)'] starwars_user_ratings.head()

تولید

پیشنهاد فیلم های مشابه | خروجی

سپس می توانیم از متد ()corrwith برای بدست آوردن همبستگی بین دو سری پاندا استفاده کنیم:

رمز

similar_to_starwars = moviemat.corrwith(starwars_user_ratings) similar_to_liarliar = moviemat.corrwith(ارزش_کاربر_liarliar)

تولید

خروجی | پیشنهاد فیلم های مشابه

هنوز مقادیر تهی زیادی وجود دارد که با حذف مقادیر NaN قابل پاکسازی هستند. بنابراین ما به جای یک سری از یک DataFrame استفاده می کنیم:

رمز

corr_starwars = pd.DataFrame(similar_to_starwars,columns=['Correlation']) corr_starwars.dropna(inplace=True) corr_starwars.head()

تولید

خروجی کد

حال، فرض کنید ما دیتافریم را بر اساس همبستگی مرتب می کنیم. در این صورت، ما باید قابل مقایسه ترین فیلم ها را دریافت کنیم، با این حال، توجه داشته باشید که چند فیلم دریافت می کنیم که واقعاً منطقی نیستند.

این به این دلیل است که تعداد زیادی فیلم وجود دارد که فقط یک بار توسط کاربرانی که جنگ ستارگان را تماشا کرده‌اند تماشا کرده‌اند.

رمز

corr_starwars.sort_values('Correlation',ascending=False).head(10)

تولید

خروجی | موتورهای 2022 را توصیه کنید

ما می‌توانیم با فیلتر کردن فیلم‌هایی که کمتر از 100 بررسی دارند، این مشکل را برطرف کنیم. ما می توانیم این مقدار را بر اساس هیستوگرافی که قبلا در بخش EDA ترسیم کردیم، تعیین کنیم.

رمز

corr_starwars = corr_starwars.join(رتبه‌بندی['تعداد رتبه‌بندی‌ها']) corr_starwars.head()

تولید

خروجی | موتورهای توصیه شده 2022

اکنون مقادیر را مرتب کنید و شاهد باشید که چگونه عناوین درک بسیار بیشتری دارند:

رمز

corr_starwars[corr_starwars['num of ratings']>100]. sort_values('Correlation',ascending=False).head()

تولید

خروجی کد | موتورهای توصیه شده 2022

در حال حاضر همان درآمد برای فیلم کمدی دروغگو دروغگو:

رمز

corr_liarliar = pd.DataFrame(similar_to_liarliar,columns=['Correlation']) corr_liarliar.dropna(inplace=True) corr_liarliar = corr_liarliar.join(رتبه‌بندی['تعداد رتبه‌بندی‌ها']) corr_liarliar[corr_liarliar['num of ratings']>100].sort_values('Correlation',ascending=False).head()

تولید

موتورهای توصیه شده 2022

کار عالی، شما یک موتور توصیه فیلم برای خودتان ساخته اید.

توجه: از اینجا به نوت بوک گوگل دسترسی داشته باشید.

برنامه ها و شرکت های برتر با استفاده از موتورهای توصیه

بسیاری از صنایع از موتورهای توصیه برای تقویت تعامل کاربر و افزایش چشم اندازهای خرید استفاده می کنند. همانطور که همه دیدیم، موتورهای توصیه می‌توانند نحوه ارتباط کسب‌وکارها با کاربران را تغییر دهند و بر اساس اطلاعاتی که می‌توانند جمع‌آوری کنند، بازگشت سرمایه (ROI) خود را به حداکثر برسانند.

خواهیم دید که چگونه تقریباً هر کسب و کاری از یک موتور توصیه برای داشتن فرصتی برای سود استفاده می کند.

1- تجارت الکترونیکی

تجارت الکترونیک صنعتی است که در آن موتورهای توصیه برای اولین بار به طور گسترده مورد استفاده قرار گرفتند. کسب‌وکارهای تجارت الکترونیک برای ارائه توصیه‌های دقیق با میلیون‌ها مشتری و داده‌های موجود در پایگاه داده آنلاین خود مناسب‌تر هستند.

2. خرده فروشی

داده های خرید با ارزش ترین اطلاعات برای الگوریتم یادگیری ماشینی است. این دقیق ترین نقطه داده در مورد قصد کاربر است. خرده فروشان با داده های خرید در خط مقدم شرکت هایی هستند که توصیه های ملموسی را برای مشتریان خود ارائه می کنند.

3 رسانه ها

مانند تجارت الکترونیک، شرکت های رسانه ای اولین کسانی هستند که به تکنیک های موتورهای توصیه می پردازند. تشخیص یک سایت خبری بدون موتور توصیه کار سختی است.

4. بانکداری

بانکداری یک صنعت بازار انبوه است که میلیون‌ها نفر از آن به صورت دیجیتالی استفاده می‌کنند و برای توصیه‌ها مهم است. درک وضعیت مالی دقیق مشتری و انتخاب های گذشته، که با داده های هزاران کاربر قابل مقایسه مرتبط است، کاملاً تعیین کننده است.

5. مخابرات

این صنعت پویایی مشابهی با صنعت بانکداری دارد. شرکت‌های مخابراتی دارای اعتبار میلیون‌ها مشتری هستند که هر اقدامشان مستند است. محدوده محصولات آنها نیز نسبت به سایر بخش‌ها نسبتاً محدود است و توصیه‌ها در مخابرات را به یک راه‌حل قابل مدیریت تبدیل می‌کند.

6 خدمات رفاهی

پویایی مشابه با مخابرات، اما ابزارهای خدماتی دارای دامنه محدودتری از محصولات هستند که استفاده از توصیه ها را نسبتاً آسان می کند.

شرکت های برتر که از موتورهای توصیه استفاده می کنند شامل

  • آمازون                    
  • نت فلیکس
  • Spotify
  • لینک
  • یوتیوب
  • TikTok    
  • اینستاگرام
  • فیس بوک
  • اتش افروز
  • Quora
  • گوگل
  • یاهو        

افکار نهایی

موتورهای توصیه ابزار بازاریابی قدرتمندی هستند که به شما کمک می‌کنند تا بهتر بفروشید، متقابل کنید و کسب‌وکارتان را تقویت کنید. در زمینه موتورهای توصیه چیزهای زیادی در حال انجام است. هر شرکتی باید با فناوری به روز باشد تا بهترین مجموعه از توصیه های رضایتمندی را به همه کاربران خود ارائه دهد.

در اینجا به پایان این راهنما می رسیم. امیدوارم همه موضوعات و توضیحات به اندازه کافی مفید باشند تا به شما در شروع سفر خود در موتورهای توصیه در یادگیری ماشین کمک کنند.

مقالات بیشتری را در وبلاگ ما بخوانید موتورهای پیشنهادی

اگر هنوز شک دارید، در پروفایل رسانه های اجتماعی من با من تماس بگیرید، و من خوشحال خواهم شد که به شما کمک کنم. در زیر می توانید اطلاعات بیشتری در مورد من بخوانید:

من یک دانشمند داده با مدرک لیسانس در علوم کامپیوتر و متخصص در یادگیری ماشین، هوش مصنوعی و بینایی کامپیوتر هستم. مرینال همچنین یک وبلاگ نویس آزاد، نویسنده و متخصص با پنج سال تجربه در کار خود است. با سابقه کار در بیشتر زمینه های علوم کامپیوتر، در حال حاضر در حال تحصیل در مقطع کارشناسی ارشد در محاسبات کاربردی با تخصص در هوش مصنوعی از دانشگاه ویندزور هستم و یک نویسنده محتوا و تحلیلگر محتوا هستم.

بیشتر بخوانید درباره موتورهای پیشنهادی توسط Mrinal Walia:

1. 5 پروژه برتر سیستم پیشنهادی یادگیری ماشین منبع باز با منابع

2. پروژه های یادگیری عمیق منبع باز برای دانشجویان علوم کامپیوتر را باید امتحان کنید

رسانه نشان داده شده در این مقاله متعلق به Analytics Vidhya نیست و به صلاحدید نویسنده استفاده می شود. 

منبع: https://www.analyticsvidhya.com/blog/2022/01/a-comprehensive-guide-on-recommendation-engines-in-2022/

تمبر زمان:

بیشتر از تجزیه و تحلیل Vidhya