سب سے عام ڈیٹا سائنس انٹرویو کے سوالات اور جوابات

ماخذ نوڈ: 1860815

سلور بلاگسب سے عام ڈیٹا سائنس انٹرویو کے سوالات اور جوابات

پچھلے کچھ سالوں میں کمپنیوں کے 900+ ڈیٹا سائنس انٹرویو سوالات کا تجزیہ کرنے کے بعد، اس گائیڈ میں سب سے عام ڈیٹا سائنس انٹرویو سوالات کے زمروں کا جائزہ لیا گیا ہے، ہر ایک کو مثال کے ساتھ بیان کیا گیا ہے۔


By نیٹ روزیدی، ڈیٹا سائنسدان اور پروڈکٹ مینیجر.

ڈیٹا سائنسدان بننا ایک باوقار خصلت سمجھا جاتا ہے۔ 2012 میں، ہارورڈ بزنس ریویو نے 'ڈیٹا سائنٹسٹ' کو 21ویں صدی کا سب سے پرکشش کام قرار دیا، اور صنعت میں کرداروں کا بڑھتا ہوا رجحان اس بیان کی تصدیق کرتا نظر آتا ہے۔ اس جنسیت کی تصدیق کرنے کے لیے ابھی بھی جاری ہے، Glassdoor کی معلومات سے پتہ چلتا ہے کہ ڈیٹا سائنسدان ہونا 2021 میں امریکہ میں دوسری بہترین ملازمت ہے۔

ماخذ: گلاس ڈور۔

ایسی باوقار نوکری حاصل کرنے کے لیے، آپ کو ملازمت کے سخت انٹرویوز سے گزرنا پڑتا ہے۔ ڈیٹا سائنس سے پوچھے گئے سوالات بہت وسیع اور پیچیدہ ہو سکتے ہیں۔ اس کی توقع کی جاتی ہے، ڈیٹا سائنسدان کے کردار پر غور کرتے ہوئے عام طور پر بہت سارے شعبوں کو شامل کیا جاتا ہے۔ ڈیٹا سائنس ملازمت کے انٹرویوز کی تیاری میں آپ کی مدد کرنے کے لیے، میں نے تمام قابل اطلاق سوالات کا جائزہ لیا ہے اور انہیں مختلف سوالات کے زمروں میں الگ کر دیا ہے۔ یہ ہے میں نے یہ کیسے کیا۔

تجزیہ کی تفصیل اور طریقہ کار

میں نے مختلف جاب سرچ بورڈز اور ویب سائٹس اور کمپنی ریویو پلیٹ فارمز جیسے Glassdoor, Indeed, Reddit اور Blind App سے ڈیٹا اکٹھا کیا۔ مزید واضح طور پر، پچھلے چار سالوں میں 903 سوالات جمع کیے گئے ہیں۔

سوالات کو پہلے سے طے شدہ زمروں میں تقسیم کیا گیا ہے۔ یہ زمرے ہمارے ذرائع سے لیے گئے انٹرویو کے تجربے کی تفصیل کے ماہرانہ تجزیہ کا نتیجہ ہیں۔

زمرہ جات ہیں:

  1. کوڈنگ
  2. ماڈلنگ
  3. والگورزم
  4. اعداد و شمار
  5. احتمال
  6. مصنوعات
  7. بزنس کیس
  8. سسٹم ڈیزائن
  9. ٹیکنیکل

آپ کو کس قسم کے انٹرویو کے سوالات کی توقع کرنی چاہئے؟

یہ چارٹ آپ کو جمع کردہ ڈیٹا کے مطابق فی زمرہ سوال کی قسم دکھاتا ہے۔

فیصد میں ترجمہ کیا گیا، چارٹ اس طرح لگتا ہے:

جیسا کہ آپ دیکھ سکتے ہیں، کوڈنگ اور ماڈلنگ کے سوالات سب سے زیادہ غالب ہیں۔ تمام سوالات میں سے آدھے سے زیادہ اس علاقے سے آتے ہیں۔ جب آپ اس کے بارے میں سوچتے ہیں تو یہ حیرت کی بات نہیں ہے۔ کوڈنگ اور ماڈلنگ شاید ڈیٹا سائنسدان کے لیے دو اہم ترین ہنر ہیں۔ کوڈنگ قسم کے سوالات بڑے پیمانے پر ہوتے ہیں، جو تمام سوالات کے ایک تہائی سے زیادہ پر مشتمل ہوتے ہیں۔ دیگر سوالات کی اقسام، جیسے الگورتھم اور اعداد و شمار، بھی کافی اہم ہیں۔ تمام سوالات میں سے 24% ان دو زمروں سے آتے ہیں۔ دیگر زمروں کی نمائندگی نہیں کی جاتی ہے۔ ڈیٹا سائنسدان کے کردار کی نوعیت پر غور کرتے ہوئے مجھے یہ معقول معلوم ہوتا ہے۔

اب میں ہر سوال کے زمرے میں آپ کی رہنمائی کرنا چاہتا ہوں اور پوچھے جانے والے سوالات کی کچھ مثالیں دکھانا چاہتا ہوں۔

ڈیٹا سائنس انٹرویو کے سوالات پر سب سے زیادہ آزمائشی تصورات

کوڈنگ

جیسا کہ آپ پہلے ہی دیکھ چکے ہیں، ڈیٹا سائنس میں کوڈنگ سوالات واحد سب سے اہم موضوع ہیں۔ اس طرح کے سوالات کو بصیرت کی شناخت کے لیے کوڈ کا استعمال کرتے ہوئے کسی قسم کے ڈیٹا میں ہیرا پھیری کی ضرورت ہوگی۔ سوالات کو کوڈنگ کی صلاحیت، مسئلہ حل کرنے کی مہارت، اور تخلیقی صلاحیتوں کو جانچنے کے لیے ڈیزائن کیا گیا ہے۔ آپ اسے عام طور پر کمپیوٹر یا وائٹ بورڈ پر کریں گے۔

کوڈنگ انٹرویو سوال کی مثال

ایک مائیکروسافٹ سے مثال کیا یہ ہے:

سوال: "نئے اور موجودہ صارفین کے حصہ کا حساب لگائیں۔ ایک تناسب کے طور پر مہینے کی پیداوار، نئے صارفین کا حصہ، اور موجودہ صارفین کا حصہ۔ نئے صارفین کی تعریف ایسے صارفین کے طور پر کی جاتی ہے جنہوں نے موجودہ مہینے میں خدمات کا استعمال شروع کیا۔ موجودہ صارفین وہ صارفین ہیں جنہوں نے موجودہ مہینے میں خدمات کا استعمال شروع کیا اور کسی بھی پچھلے مہینے میں خدمات کا استعمال کیا۔ فرض کریں کہ تمام تاریخیں سال 2020 کی ہیں۔

آپ ٹیبل استعمال کر رہے ہوں گے۔ حقائق_واقعات، نمونہ ڈیٹا کے ساتھ اس طرح نظر آرہا ہے:

مطلوبہ آؤٹ پٹ حاصل کرنے کے لیے، آپ کو یہ کوڈ لکھنا چاہیے:

تمام_صارفین کے ساتھ بطور ( SELECT date_part('month', time_id) مہینہ کے طور پر، شمار (DISTINCT user_id) بطور تمام_صارف حقیقت_واقعات گروپ کے حساب سے ماہ، نئے_صارفین بطور ماہ، شمار (DISTINCT user_id) بطور new_users FROM (SELECT user_id, min(time_id) بطور new_user_start_date FROM fact_events GROUP BY user_id) sq GROUP BY month ) SELECT au.month, new_users / all_users::decimal as share_new_users، 1- (newus_users_users کے بطور) تمام_صارفین سے یا نئے_صارفین میں شامل ہوں nu.month = au.month 

جب کوڈنگ کی بات آتی ہے تو ایس کیو ایل میں کوڈ لکھنا اکثر آزمائشی تصور ہوتا ہے۔ یہ کوئی تعجب کی بات نہیں ہے کیونکہ ڈیٹا سائنس میں SQL سب سے زیادہ استعمال ہونے والا ٹول رہا ہے۔ ان تصورات میں سے ایک جس سے آپ انٹرویوز میں تقریباً گریز نہیں کر سکتے ہیں جوائنز ہے۔ اس لیے یقینی بنائیں کہ آپ مختلف جوائنز کے درمیان فرق جانتے ہیں اور مطلوبہ نتیجہ حاصل کرنے کے لیے ان کا استعمال کیسے کریں۔

اس کے علاوہ، آپ GROUP BY شق کو اکثر استعمال کرتے ہوئے ڈیٹا کو گروپ کرنے کی توقع کر سکتے ہیں۔ کچھ دوسرے تصورات جو عام طور پر پوچھے جاتے ہیں وہ ہیں WHERE اور/یا HAVING شق کا استعمال کرتے ہوئے ڈیٹا کو فلٹر کرنا۔ آپ سے الگ ڈیٹا منتخب کرنے کے لیے بھی کہا جائے گا۔ اور یہ بھی یقینی بنائیں کہ آپ مجموعی افعال کو جانتے ہیں، جیسے SUM(), AVG(), COUNT(), MIN(), MAX()۔

کچھ تصورات اتنی کثرت سے سامنے نہیں آتے، لیکن ان کا ذکر کرنا اور اس طرح کے سوالات کے لیے تیار رہنا ضروری ہے۔ مثال کے طور پر، Common Table Expressions یا CTEs ایک ایسا ہی موضوع ہے۔ دوسری CASE() شق ہے۔ اس کے علاوہ، سٹرنگ ڈیٹا کی اقسام اور تاریخوں کو سنبھالنے پر اپنی میموری کو تازہ کرنا نہ بھولیں۔

ماڈلنگ

ہمارے تحقیقی ڈیٹا میں ماڈلنگ دوسری سب سے بڑی کیٹیگری تھی، یہاں سے آنے والے تمام سوالات میں سے 20%۔ یہ سوالات شماریاتی ماڈلز بنانے اور مشین لرننگ ماڈلز کو لاگو کرنے کے بارے میں آپ کے علم کو جانچنے کے لیے بنائے گئے ہیں۔

ماڈلنگ انٹرویو سوال کی مثال

رجعت، سب سے عام تکنیکی ڈیٹا سائنس کا تصور جو انٹرویوز میں پوچھا جاتا ہے۔ شماریاتی ماڈلنگ کی نوعیت پر غور کرتے ہوئے یہ حیرت کی بات نہیں ہے۔

ایک Galvanize سے مثال مندرجہ ذیل ہوں گے:

سوال: "رجعت میں ریگولرائزیشن کیا ہے؟"

یہاں یہ ہے کہ آپ اس سوال کا جواب کیسے دے سکتے ہیں:

جواب: "ریگولرائزیشن ایک خاص قسم کی رجعت ہے جہاں قابلیت کے تخمینے کو محدود (یا ریگولرائز) صفر پر رکھا جاتا ہے۔ ایسا کرنے سے، نمونے کی خرابی کو کم کرتے ہوئے ماڈل کے فرق کو کم کرنا ممکن ہے۔ ریگولرائزیشن کا استعمال اوور فٹنگ سے بچنے یا کم کرنے کے لیے کیا جاتا ہے۔ اوور فٹنگ اس وقت ہوتی ہے جب ماڈل ٹریننگ ڈیٹا کو اتنی اچھی طرح سے سیکھتا ہے کہ یہ نئے ڈیٹا پر ماڈل کی کارکردگی کو کمزور کرتا ہے۔ زیادہ فٹنگ سے بچنے کے لیے عام طور پر رج یا لاسو کو ریگولرائز کیا جاتا ہے۔

کچھ تصورات جن کا باقاعدگی سے تجربہ کیا جاتا ہے، وہ ہیں، دوسرے رجعت تجزیہ تصورات، جیسے لاجسٹک ریگریشن، Bayesian logistic regression، اور naive Bayes classifiers۔ آپ سے بے ترتیب جنگلات کے ساتھ ساتھ ماڈلز کی جانچ اور تشخیص کے بارے میں بھی پوچھا جا سکتا ہے۔

والگورزم

الگورتھم پر سوالات وہ تمام سوالات ہیں جن کے لیے ریاضی کے مسئلے کو حل کرنے کی ضرورت ہوتی ہے، بنیادی طور پر پروگرامنگ زبانوں میں سے کسی ایک کو استعمال کرتے ہوئے کوڈ کے ذریعے۔ ان سوالات میں مرحلہ وار عمل شامل ہوتا ہے، عام طور پر جواب پیدا کرنے کے لیے ایڈجسٹمنٹ یا حساب کی ضرورت ہوتی ہے۔ یہ سوالات مسئلہ حل کرنے اور ڈیٹا میں ہیرا پھیری کے بنیادی علم کی جانچ کرتے ہیں، جسے کام پر پیچیدہ مسائل کے لیے لاگو کیا جا سکتا ہے۔

الگورتھم انٹرویو سوال کی مثال

الگورتھم کے تحت سب سے زیادہ تجربہ کیا جانے والا تکنیکی تصور ایک پروگرامنگ زبان کے ساتھ ریاضی یا نحوی مسئلہ کو حل کرنا ہے۔

یہاں ہے ایک مثال آپ کو Leetcode پر مل سکتی ہے۔:

سوال: "آپ کو دو غیر خالی منسلک فہرستیں دی گئی ہیں جو دو غیر منفی عدد کی نمائندگی کرتی ہیں۔ ہندسوں کو الٹ ترتیب میں ذخیرہ کیا جاتا ہے، اور ان کے ہر نوڈس میں ایک ہندسہ ہوتا ہے۔ دو نمبروں کو شامل کریں اور رقم کو منسلک فہرست کے طور پر واپس کریں۔

ڈیٹا کی مثال کچھ اس طرح ہو سکتی ہے:

ماخذ: Leetcode.

جوابجاوا میں لکھا ہوا کوڈ ہونا چاہیے:

پبلک لسٹ نوڈ ایڈ ٹو نمبرز (لسٹ نوڈ ایل 1، لسٹ نوڈ ایل 2) { لسٹ نوڈ ڈمی ہیڈ = نیا لسٹ نوڈ (0)؛ لسٹ نوڈ p = l1، q = l2، curr = dummyHead؛ int کیری = 0; جبکہ (p != null || q != null) { int x = (p != null) ? p.val : 0; int y = (q != null) ? q.val : 0; int sum = کیری + x + y؛ لے جانا = رقم / 10؛ curr.next = نیا لسٹ نوڈ (رقم % 10)؛ curr = curr.next؛ اگر (p != null) p = p.next; اگر (q != null) q = q.next; } اگر (کیری > 0) { curr.next = new ListNode(cary); } واپس dummyHead.next؛ } 

اس قسم کے سوال کے ذریعہ اکثر جانچے جانے والے دوسرے عمومی تصورات ہیں صفیں، متحرک پروگرامنگ، تار، لالچی الگورتھم، گہرائی سے پہلی تلاش، درخت، ہیش ٹیبل، اور بائنری تلاش۔

اعداد و شمار

شماریات کے انٹرویو کے سوالات وہ سوالات ہیں جو شماریاتی تھیوری اور متعلقہ اصولوں کے علم کی جانچ کرتے ہیں۔ ان سوالات کا مقصد یہ آزمانا ہے کہ آپ ڈیٹا سائنس کے بانی نظریاتی اصولوں سے کتنے واقف ہیں۔ کیے جانے والے تجزیوں کے نظریاتی اور ریاضیاتی پس منظر کو سمجھنے کے قابل ہونا ضروری ہے۔ ان سوالات کے اچھے جواب دیں، اور ہر انٹرویو لینے والا آپ کی تعریف کرے گا۔

شماریات کے انٹرویو کے سوال کی مثال

سب سے زیادہ ذکر کردہ تکنیکی تصور نمونے اور تقسیم ہے۔ ڈیٹا سائنسدان کے لیے، یہ اعداد و شمار کے سب سے زیادہ استعمال ہونے والے اصولوں میں سے ایک ہے جسے ڈیٹا سائنسدان روزانہ نافذ کرتا ہے۔

مثال کے طور پر، IBM سے انٹرویو کا سوال پوچھتا ہے:

سوال: "غیر گاوسی تقسیم کے ساتھ ڈیٹا کی قسم کی مثال کیا ہے؟"

سوال کا جواب دینے کے لیے، آپ پہلے گاوسی تقسیم کی وضاحت کر سکتے ہیں۔ پھر آپ غیر گاوسی تقسیم کی مثالیں دے کر اس کی پیروی کر سکتے ہیں۔ کچھ اس طرح:

جواب: "گاوسی تقسیم ایک ایسی تقسیم ہے جہاں اوسط سے معیاری انحراف کی جانچ کرتے وقت اعداد و شمار کا ایک خاص معلوم فیصد پایا جا سکتا ہے، بصورت دیگر ایک عام تقسیم کے طور پر جانا جاتا ہے۔ غیر گاوسی تقسیم کی کچھ مثالیں کفایتی تقسیم یا دو نامی تقسیم ہوسکتی ہیں۔

ملازمت کے انٹرویو کی تیاری کرتے وقت، یقینی بنائیں کہ آپ درج ذیل عنوانات کا بھی احاطہ کرتے ہیں: تغیر اور معیاری انحراف، ہم آہنگی اور ارتباط، پی-ویلیو، اوسط اور درمیانی، مفروضے کی جانچ، اور بایسیئن شماریات۔ یہ وہ تمام تصورات ہیں جن کی آپ کو بطور ڈیٹا سائنٹسٹ ضرورت ہوگی، لہذا ملازمت کے انٹرویوز میں بھی ان کی توقع کریں۔

احتمال

یہ سوالات صرف احتمالی تصورات پر نظریاتی علم کے متقاضی ہیں۔ انٹرویو لینے والے یہ سوالات عام طور پر کام کی جگہ پر کیے جانے والے پیچیدہ ڈیٹا اسٹڈیز کو مکمل کرنے کے امکانات کے طریقوں اور استعمال کے بارے میں آپ کے علم کی گہری سمجھ حاصل کرنے کے لیے پوچھتے ہیں۔

امکان انٹرویو سوال کی مثال

یہ بہت زیادہ امکان ہے، پن کا مقصد، جو سوال آپ کو ملے گا وہ ہے ڈائس/کارڈز کے سیٹ سے ایک مخصوص کارڈ/نمبر حاصل کرنے کے امکان کا حساب لگانا۔ یہ ہماری تحقیق میں زیادہ تر کمپنیوں کے لیے سوال کرنے کا سب سے عام عنصر لگتا ہے، کیونکہ ان میں سے بہت سے لوگوں نے اس قسم کے سوالات پوچھے ہیں۔

اس طرح کی ایک مثال فیس بک سے امکانی سوال:

سوال: "52 کارڈ کے ڈیک میں الگ الگ دو کارڈ کھینچ کر جوڑا حاصل کرنے کا کیا امکان ہے؟"

یہاں یہ ہے کہ آپ اس کا جواب کیسے دے سکتے ہیں:

جواب: "یہ پہلا کارڈ جو آپ کھینچتے ہیں وہ کچھ بھی ہو سکتا ہے، لہذا یہ نتیجہ پر اثر انداز نہیں ہوتا ہے اس کے علاوہ ڈیک میں ایک کارڈ کم رہ گیا ہے۔ ایک بار پہلا کارڈ تیار ہونے کے بعد، ڈیک میں باقی تین کارڈ ہوتے ہیں جو ایک جوڑا حاصل کرنے کے لیے تیار کیے جا سکتے ہیں۔ لہذا، آپ کے پہلے کارڈ کو جوڑے کے ساتھ ملانے کا موقع 3 میں سے 51 ہے (باقی کارڈز)۔ اس کا مطلب ہے کہ اس واقعہ کے ہونے کا امکان 3/51 یا 5.89% ہے۔

چونکہ یہ ایک قسم کا "خصوصی" سوال ہے جو صرف امکان سے متعلق ہے، اس لیے کوئی دوسرا تصور نہیں پوچھا جاتا۔ فرق صرف اتنا ہے کہ سوال کتنا تخیلاتی ہے۔ لیکن بنیادی طور پر، آپ کو ہمیشہ کسی نہ کسی واقعہ کے امکان کا حساب لگانا ہوگا اور اپنی سوچ کو ظاہر کرنا ہوگا۔

مصنوعات

پروڈکٹ انٹرویو کے سوالات آپ سے ڈیٹا کے ذریعے پروڈکٹ/سروس کی کارکردگی کا جائزہ لینے کے لیے کہیں گے۔ یہ سوالات کسی بھی ماحول میں ڈیٹا سائنس کے اصولوں کو اپنانے اور استعمال کرنے کے بارے میں آپ کے علم کی جانچ کرتے ہیں، جیسا کہ روزمرہ کے کام کا معاملہ ہے۔

پروڈکٹ انٹرویو سوال کی مثال

اس زمرے میں سب سے نمایاں تکنیکی تصور کمپنی کی مصنوعات کی شناخت کرنا اور ڈیٹا سائنسدان کے نقطہ نظر سے بہتری کی تجویز پیش کرنا ہے۔ پروڈکٹ سائیڈ پر جانچے گئے تکنیکی تصورات میں اعلیٰ تغیر کی وضاحت پروڈکٹ کے سوالات کی نوعیت اور ان کے جوابات کے لیے درکار اعلیٰ سطح کی تخلیقی صلاحیتوں سے کی جا سکتی ہے۔

کی مثال a فیس بک سے پروڈکٹ کا سوال ہو گا:

سوال: "آپ کا پسندیدہ فیس بک پروڈکٹ کیا ہے، اور آپ اسے کیسے بہتر بنائیں گے؟"

جواب: سوال کی نوعیت کی وجہ سے، ہم آپ کو خود اس کا جواب دینے دیں گے۔

جانچے گئے عمومی تصورات کا بہت زیادہ انحصار اس کمپنی پر ہوتا ہے جو آپ کا انٹرویو کر رہی ہے۔ بس اس بات کو یقینی بنائیں کہ آپ کمپنی کے کاروبار اور ان کی مصنوعات سے واقف ہیں (مثالی طور پر، آپ ان کے صارف بھی ہیں)، اور آپ ٹھیک ہو جائیں گے۔

بزنس کیس

اس زمرے میں کیس اسٹڈیز اور کاروبار سے متعلق عمومی سوالات شامل ہیں جو ڈیٹا سائنس کی مہارت کو جانچیں گے۔ یہ جاننے کی اہمیت بہت زیادہ ہو سکتی ہے کہ ان سوالوں کا جواب کیسے دیا جائے کیونکہ کچھ انٹرویو لینے والے امیدواروں کو یہ جاننا چاہیں گے کہ کمپنی کے مخصوص مسائل کو حل کرنے کے لیے ڈیٹا سائنس کے اصولوں کو کس طرح لاگو کرنا ہے ان کی خدمات حاصل کرنے سے پہلے۔

بزنس کیس سوال کی مثال

سوال کی قسم کی نوعیت کی وجہ سے، میں کسی ایک تکنیکی تصور کی نشاندہی نہیں کر سکا جو نمایاں ہو۔ چونکہ یہاں درجہ بندی کیے گئے زیادہ تر سوالات کیس اسٹڈیز ہیں، اس لیے وہ ایک خاص طریقے سے منفرد ہیں۔

تاہم، یہاں ایک مثال ہے Uber سے بزنس کیس کا سوال:

سوال: "ایسے لوگوں کا ایک تالاب ہے جنہوں نے دو شہروں سے Uber کی سواری لی جو قریب ہی تھے، مثال کے طور پر، Menlo Park اور Palo Alto، اور آپ کے خیال میں کوئی بھی ڈیٹا اکٹھا کیا جا سکتا ہے۔ آپ کون سا ڈیٹا اکٹھا کریں گے تاکہ مسافر نے جس شہر سے سفر کیا اس کا تعین کیا جا سکے؟

جواب: "شہر کا تعین کرنے کے لیے، ہمیں مقام/جغرافیائی ڈیٹا تک رسائی حاصل کرنے کی ضرورت ہے۔ جمع کردہ ڈیٹا GPS کوآرڈینیٹ، طول بلد/ عرض البلد، اور زپ کوڈ ہو سکتا ہے۔

سسٹم ڈیزائن

سسٹم ڈیزائن کے سوالات ٹیکنالوجی کے نظام کو ڈیزائن کرنے سے متعلق تمام سوالات ہیں۔ ان سے کہا جاتا ہے کہ وہ صارفین/کلائنٹس کی مدد کے لیے مسائل کو حل کرنے، سسٹم بنانے اور ڈیزائن کرنے میں امیدوار کے عمل کا تجزیہ کریں۔ ڈیٹا سائنسدان کے لیے سسٹم کے ڈیزائن کو جاننا کافی اہم ہو سکتا ہے۔ یہاں تک کہ اگر آپ کا کردار کسی نظام کو ڈیزائن کرنا نہیں ہے، تو آپ غالباً ایک قائم شدہ نظام میں اپنا کردار ادا کریں گے اور آپ کو یہ جاننے کی ضرورت ہوگی کہ آپ کا کام کرنے کے لیے یہ کیسے کام کرتا ہے۔

سسٹم ڈیزائن انٹرویو سوال کی مثال

یہ سوالات مختلف موضوعات اور کاموں کا احاطہ کرتے ہیں۔ لیکن جو باہر کھڑا ہے وہ ایک ڈیٹا بیس بنا رہا ہے۔ ڈیٹا سائنسدان روزانہ ڈیٹا بیس کے ساتھ بہت زیادہ ڈیل کرتے ہیں، اس لیے یہ سوال پوچھنا سمجھ میں آتا ہے کہ آیا آپ شروع سے ڈیٹا بیس بنا سکتے ہیں۔

یہاں ایک ہے۔ آڈیبل سے سوال کی مثال ہماری تحقیق میں انکشاف ہوا:

سوال: "کیا آپ ہمیں اس بارے میں بتا سکتے ہیں کہ آپ سفارش کا نظام کیسے بنائیں گے؟"

جواب: چونکہ اس سوال کا جواب دینے کے لیے اس طرح کے مختلف طریقے موجود ہیں، اس لیے ہم آپ کو چھوڑیں گے کہ آپ اپنا طریقہ خود بنائیں۔

ایک بار پھر، ان سوالات کا جواب دینے کے لیے، کمپنی کے کاروبار کو جاننا ضروری ہے۔ ان ڈیٹابیس کے بارے میں تھوڑا سوچیں جن کی کمپنی کو سب سے زیادہ ضرورت ہے، اور انٹرویو سے تھوڑا پہلے اپنے نقطہ نظر کو واضح کرنے کی کوشش کریں۔

ٹیکنیکل

تکنیکی سوالات وہ تمام سوالات ہیں جو ڈیٹا سائنس کے مختلف تکنیکی تصورات کی وضاحت کے بارے میں پوچھ رہے ہیں۔ تکنیکی سوالات نظریاتی ہیں اور اس ٹیکنالوجی کے علم کی ضرورت ہے جو آپ کمپنی میں استعمال کریں گے۔ فطرت کی وجہ سے، وہ کوڈنگ سوالات کی طرح لگ سکتے ہیں. آپ جو کچھ کر رہے ہیں اس کے پیچھے نظریہ جاننا کافی ضروری ہے، اس لیے اکثر انٹرویوز میں تکنیکی سوالات پوچھے جا سکتے ہیں۔

تکنیکی انٹرویو کے سوال کی مثال

سب سے زیادہ آزمائشی علاقہ Python اور SQL کا نظریاتی علم ہے۔ حیرت کی بات نہیں، کیونکہ یہ دونوں زبانیں ڈیٹا سائنس میں غالب ہیں، R کے ساتھ Python کی تکمیل کے لیے۔

کی مثال a والمارٹ سے حقیقی دنیا کا تکنیکی سوال ہو گا:

سوال"Python میں ڈیٹا ڈھانچے کیا ہیں؟"

جواب: "ڈیٹا کے ڈھانچے کو ڈیٹا ذخیرہ کرنے کے لیے استعمال کیا جاتا ہے۔ Python میں چار ڈیٹا ڈھانچے ہیں: فہرست، ڈکشنری، ٹوپل، اور سیٹ۔ وہ بلٹ ان ڈیٹا ڈھانچے ہیں۔ فہرستیں ایسی فہرستیں بنانے کے لیے استعمال کی جاتی ہیں جن میں مختلف قسم کے ڈیٹا شامل ہو سکتے ہیں۔ لغت بنیادی طور پر کلیدوں کا ایک مجموعہ ہے۔ وہ ایک کلید کے ساتھ قدر کو ذخیرہ کرنے اور اسی کلید کا استعمال کرتے ہوئے ڈیٹا حاصل کرنے کے لیے استعمال ہوتے ہیں۔ Tuples فہرستوں کے طور پر ایک ہی ہیں. فرق یہ ہے کہ ایک ٹوپل میں، ڈیٹا کو تبدیل نہیں کیا جا سکتا۔ سیٹ میں بغیر کسی ڈپلیکیٹ کے غیر ترتیب شدہ عناصر شامل ہیں۔ بلٹ ان ڈیٹا سٹرکچرز کے ساتھ ساتھ صارف کی طرف سے ڈیفینڈ ڈیٹا اسٹرکچر بھی موجود ہیں۔

یہ تمام قسم کے سوالات ہیں۔ یہ ان تمام سوالات کے لیے ایک زمرہ ہے جو صاف طور پر دوسرے زمروں میں فٹ نہیں ہو سکتے۔ اس کی وجہ سے، کوئی خاص تصورات نہیں ہیں جو زیادہ یا کم کثرت سے پائے جاتے ہیں۔

نتیجہ

یہ ڈیٹا سائنس انٹرویو گائیڈ ڈیٹا سائنس انٹرویو میں پوچھے جانے والے سوالات کی اقسام کو سمجھنے کے لیے کی گئی تحقیق کی حمایت کے لیے لکھا گیا ہے۔ انٹرویو کے سوالات کا ڈیٹا درجنوں کمپنیوں سے چار سال کی مدت میں لیا جاتا ہے اور ان کا تجزیہ کیا جاتا ہے۔ سوالات کو نو مختلف سوالات کی اقسام (الگورتھمز، بزنس کیس، کوڈنگ، ماڈلنگ، امکان، پروڈکٹ، شماریات، سسٹم ڈیزائن، اور تکنیکی سوالات) کے تحت درجہ بندی کیا گیا ہے۔

تجزیہ کے حصے کے طور پر، میں نے ہر سوال کی قسم کے کچھ سب سے عام تکنیکی تصورات کے بارے میں بات کی۔ مثال کے طور پر، سب سے زیادہ پوچھے گئے اعداد و شمار کے سوالات کا تعلق نمونے لینے اور تقسیم سے ہے۔ ہر سوال کے زمرے کی تائید حقیقی سوال کی ایک عملی مثال سے ہوتی ہے۔

مضمون کا مقصد آپ کو انٹرویو کی تیاری یا ڈیٹا سائنس کے بارے میں مزید جاننے کے لیے ایک اہم رہنما کے طور پر پیش کرنا ہے۔ مجھے امید ہے کہ میں نے ڈیٹا سائنس کے انٹرویو کے عمل کے بارے میں زیادہ آرام دہ محسوس کرنے میں آپ کی مدد کی ہے۔ آپ کے انٹرویوز کے ساتھ گڈ لک!

حقیقی. اجازت کے ساتھ دوبارہ پوسٹ کیا۔

متعلقہ:

ماخذ: https://www.kdnuggets.com/2021/08/common-data-science-interview-questions-answers.html

ٹائم اسٹیمپ:

سے زیادہ KDnuggets