آپ کے ڈیٹا کی حکمت عملی کے لیے آن لائن ڈیٹا کی مختلف اقسام کو سمجھنا

ماخذ نوڈ: 875054

آن لائن کے ساتھ ڈیٹا کے حصول عروج پر، ہم زیادہ تر نامعلوم پانیوں میں چل رہے ہیں۔ ویب سکریپنگ اور خودکار ڈیٹا اکٹھا کرنے کی دوسری شکلوں میں صنعت کے وسیع ضوابط عملی طور پر غیر موجود ہیں اور ہمیں مستقبل قریب میں شاید اس کی توقع نہیں کرنی چاہیے۔ تاہم، کافی تعداد میں دیگر اشارے موجود ہیں جو قانون اور اخلاقیات کے صحیح رخ پر رہنے میں ہماری مدد کر سکتے ہیں۔

مخصوص قانونی مقدمات کے علاوہ جہاں ویب سکریپنگ سوال میں اٹھایا گیا ہے، ہمیں خود ڈیٹا کی قسم اور شکل کی طرف دیکھنا چاہیے۔ آن لائن ڈیٹا کی درجہ بندی کرنے کے کئی طریقے ہیں حالانکہ میں انہیں 3 بنیادی اقسام میں الگ کروں گا: عوامی، غیر عوامی اور ذاتی ڈیٹا۔

(غیر) عوامی ڈیٹا

اگرچہ عوامی اعداد و شمار کی واضح تعریف پر اترنا مشکل ہو سکتا ہے، امریکی کیس قانون ہمیں اس کی اچھی جھلک دے سکتا ہے کہ یہ کیسا نظر آتا ہے۔ پیچھے اگلا، 2019 میں، امریکی عدالت برائے اپیل نے لنکڈ ان کی درخواست کو مسترد کر دیا تھا جس میں ایک تجزیاتی کمپنی HiQ کو اس کے ڈیٹا کو ختم کرنے سے روک دیا گیا تھا۔ عدالت نے پایا کہ HiQ اپنے دعوے کی خوبیوں پر کامیابی کا امکان ظاہر کرنے میں کامیاب رہا کہ عوامی ڈیٹا کا خودکار ڈیٹا اکٹھا کرنا کمپیوٹر فراڈ اینڈ ابیوز ایکٹ (CFAA) میں قائم کردہ "بغیر اجازت کے" ممانعت کے تحت نہیں آتا ہے۔ 

سب سے اہم بات یہ ہے کہ عدالت نے یہ اندازہ لگایا کہ HiQ لیبز کے ذریعے حاصل کردہ ڈیٹا تک باقاعدہ ویب براؤزر کے ذریعے کوئی بھی رسائی حاصل کر سکتا تھا اور، میری رائے میں، اس بات کا یقین ہے کہ سکریپنگ روبوٹ کا اندراج (عوامی ڈیٹا تک رسائی حاصل کرتے وقت) کوئی بھی نہیں ہے۔ کسی دوسرے ویب براؤزر سے مختلف جو انسان کے ذریعہ استعمال کیا جاتا ہے۔ یہ ہمارے لیے ایک اضافی دلیل لاتا ہے - خودکار عوامی ڈیٹا اکٹھا کرنا دستی جمع کرنے سے مختلف نہیں ہونا چاہیے، یہ کام کرنے کا صرف ایک ہوشیار اور زیادہ موثر طریقہ ہے۔

تاہم، امریکی عدالت برائے اپیل کسی بھی قسم کے آن لائن ڈیٹا اکٹھا کرنے کے دروازے بالکل نہیں کھولتی ہے۔ اگرچہ یہ واضح ہو سکتا ہے، یہ بتانے کی ضرورت ہے کہ بہت سارے قانونی قوانین اور دفاع کے لیے قانونی دلائل، جیسے کاپی رائٹ قانون، ڈیٹا بیس کے تحفظ کے حقوق، معاہدے کی خلاف ورزی وغیرہ، اپنی جگہ پر موجود ہیں۔ مثال کے طور پر، عام طور پر کاپی رائٹ شدہ ڈیٹا (یا عام طور پر مواد) کو جمع اور تجارتی مقاصد کے لیے استعمال نہیں کیا جا سکتا۔

جیسا کہ ذکر کیا گیا ہے، یہ حکم شرائط و ضوابط کو اوور رائیڈ نہیں کرتا ہے۔ جہاں بھی لاگ ان یا رجسٹریشن کی ضرورت ہو، آپ کو ممکنہ طور پر زیر بحث ویب سائٹ کو ختم کرنے سے پہلے T&C سے اتفاق کرنا پڑے گا۔ کیا زیادہ اہم ہے، اس طرح کے اعداد و شمار کو شاید اس لمحے سے غیر عوامی کے طور پر درجہ بندی کیا جا سکتا ہے. تقریباً تمام معاملات میں، ویب سائٹس خودکار ڈیٹا اکٹھا کرنے سے منع کر دیں گی۔

لہذا، عوامی ڈیٹا کو آزادانہ طور پر دستیاب معلومات کے طور پر بیان کیا جاسکتا ہے جس تک شرائط و ضوابط یا دیگر قانونی طور پر پابند دستاویزات پر دستخط کیے بغیر رسائی حاصل کی جاسکتی ہے۔ ہم باقی تمام چیزوں کو غیر عوامی ڈیٹا سمجھتے ہیں جو، اگر دیگر قانونی دلائل نافذ نہیں کیے جاتے ہیں، تو خود کار طریقے سے جمع کیے جا سکتے ہیں۔

EU میں ذاتی ڈیٹا

ذاتی ڈیٹا کو مکمل طور پر ایک مختلف زمرے کے طور پر سوچنے کے بجائے، ہم اسے ایک اضافی جہت کے طور پر سوچ سکتے ہیں۔ تمام آن لائن معلومات کو عوامی اور غیر عوامی میں الگ کیا جا سکتا ہے۔ دونوں زمروں میں سے کچھ ذاتی ڈیٹا ہوں گے۔

ذاتی ڈیٹا کے تصور کو سمجھنے کے لیے بنیادی قانونی ذرائع میں سے ایک بہت زیادہ خراب جنرل ڈیٹا پروٹیکشن ریگولیشن (GDPR) ہے۔ جبکہ وہ کاروبار جو خصوصی طور پر غیر EU ڈیٹا میں ڈیل کرتے ہیں اور EU میں قائم نہیں ہیں۔ شاید جی ڈی پی آر سے مستثنیٰ ہوں، تقریباً تمام معاملات میں اس طرح کی علیحدگی قریب قریب ناممکن ہے۔ لہذا، ہر کوئی جی ڈی پی آر کے ضوابط کی بھی پیروی کرسکتا ہے۔


خوش قسمتی سے ہمارے لیے، اس بات کی بالکل درست تعریف موجود ہے کہ ذاتی ڈیٹا کیا ہوتا ہے۔ GDPR کا آرٹیکل 4:

'ذاتی ڈیٹا' کا مطلب ہے کسی شناخت شدہ یا قابل شناخت قدرتی شخص سے متعلق کوئی بھی معلومات ('ڈیٹا سبجیکٹ')؛ قابل شناخت فطری شخص وہ ہوتا ہے جس کی شناخت بالواسطہ یا بالواسطہ طور پر کسی شناخت کنندہ جیسے نام، شناختی نمبر، مقام کا ڈیٹا، آن لائن شناخت کنندہ یا ایک یا زیادہ عوامل کے حوالے سے کی جا سکتی ہے جو جسمانی، جسمانی، اس قدرتی شخص کی جینیاتی، ذہنی، اقتصادی، ثقافتی یا سماجی شناخت؛

تعریف میں کئی اہم ٹیک ہوم نوٹس شامل ہیں۔ کوئی بھی ڈیٹا جو براہ راست یا بالواسطہ طور پر کسی شخص یا اس کی کسی بھی خوبی کی شناخت یا اس میں اضافہ کر سکتا ہے اسے ذاتی سمجھا جاتا ہے۔ اس طرح کی تعریف اس پر ایک بہت وسیع جال ڈالتی ہے جسے ذاتی ڈیٹا سمجھا جا سکتا ہے۔

مثال کے طور پر، یہاں تک کہ وہ معلومات جو بے ضرر لگ سکتی ہیں جیسے کہ اونچائی، وزن یا یہاں تک کہ کسی شخص کی گاڑی کا رنگ بھی ذاتی ڈیٹا سمجھا جا سکتا ہے۔ مزید برآں، ایسے معاملات ہو سکتے ہیں جہاں شناخت نہ کرنے والے ڈیٹا پوائنٹس ایک شناختی سیٹ میں ضم ہو جائیں۔ ان حالات میں عام طور پر کچھ کم سے کم ٹریکنگ شامل ہوتی ہے (مثلاً ایک عام جغرافیائی پوائنٹر) اور طرز عمل کی معلومات (مثلاً عام طور پر دیکھے جانے والے مقامات کا ایک سیٹ)۔

جی ڈی پی آر کے تحت، نجی ڈیٹا پر صرف اس صورت میں کارروائی کی جا سکتی ہے جب اس طرح کی پروسیسنگ کے لیے کوئی قانونی بنیاد موجود ہو۔ حقیقت میں، ڈیٹا کے حصول میں شامل ہر فرد کی رضامندی حاصل کرنا صرف داخلی جمع کرنے کے عمل میں ہی ممکن ہے۔ بیرونی ڈیٹا کے حصول (مثلاً ویب سکریپنگ) کے لیے ایسا کام اگر ناممکن نہیں تو کم از کم انتہائی ناقابل عمل ہے۔ مزید برآں، GDPR ذاتی ڈیٹا کی کئی خصوصی اقسام کی وضاحت کرتا ہے جن میں شامل ہو سکتے ہیں:

  • نسلی یا نسلی اصل
  • سیاسی آراء
  • مذہبی یا فلسفیانہ عقائد
  • ٹریڈ یونین کی رکنیت
  • جینیاتی ڈیٹا
  • بایومیٹرک ڈیٹا کسی قدرتی شخص کی منفرد شناخت کے مقصد سے
  • صحت یا قدرتی شخص کی جنسی زندگی اور/یا جنسی رجحان سے متعلق ڈیٹا

آخر میں، جی ڈی پی آر کی وضاحت کرتا ہے۔ ذاتی ڈیٹا کے حصے کے طور پر "آن لائن شناخت کنندگان". یہ صارف کے آلات، ایپلیکیشنز، ٹولز اور پروٹوکول کے ذریعے فراہم کیے جاتے ہیں جو افراد کی شناخت کر سکتے ہیں۔ آن لائن شناخت کنندگان کی مثالوں میں شامل ہو سکتے ہیں: IP اور MAC ایڈریس، کوکیز، ریڈیو فریکوئنسی شناختی ٹیگز وغیرہ۔

حساس ذاتی ڈیٹا کو جمع کرنا اور بھی زیادہ قواعد و ضوابط کے ساتھ مشروط ہے۔ عملی طور پر، ان تمام رکاوٹوں کا مطلب یہ ہے کہ GDPR ذاتی ڈیٹا کو ختم کرنے پر بہت زیادہ بوجھ ڈالتا ہے۔

امریکہ میں ذاتی معلومات

ایسا لگتا ہے کہ EU میں ذاتی ڈیٹا اکٹھا کرنے کی بہت زیادہ امید نہیں ہے۔ امریکہ کے بارے میں کیا خیال ہے؟ ذاتی معلومات پر وفاقی سطح پر کوئی قانون سازی نہیں ہے، تاہم، ریاستی سطح کے قوانین متعارف کرائے گئے ہیں۔

2021 تک، صرف کئی ریاستوں (یعنی کیلیفورنیا، ورجینیا۔ ورمونٹ میں ڈیٹا بروکر کا قانون ہے) نے ذاتی معلومات کو نشانہ بنانے والی قانون سازی متعارف کروائی ہے۔ تاہم، ان تمام قوانین کو تفصیل سے دیکھنے میں کافی وقت لگے گا۔ میں قانون سازی کے بنیادی حصے سے نمٹوں گا کیونکہ ان میں سے زیادہ تر قوانین کیلیفورنیا کنزیومر پرائیویسی ایکٹ (CCPA) کی کم و بیش کاپی کیٹس ہیں۔

جب ذاتی معلومات کی بات آتی ہے تو CCPA قانون سازی کا سب سے زیادہ حوالہ دیا جاتا ہے۔ تاہم، قانون سازی کا ایک بڑا حصہ صارفین کو جمع کیے گئے ڈیٹا کو جاننے، رسائی حاصل کرنے، آپٹ آؤٹ کرنے یا مکمل طور پر حذف کرنے کا حق فراہم کرنے کے لیے وقف ہے۔ عملی طور پر، ان معاملات میں عام طور پر کاروبار میں داخلی ڈیٹا اکٹھا کرنا شامل ہوگا۔

بالکل اسی طرح جیسے جی ڈی پی آر کے اندر، ذاتی معلومات کی تعریف شامل ہے۔ CCPA میں کافی وسیع ہے:

ذاتی معلومات" کا مطلب ہے وہ معلومات جو شناخت کرتی ہے، اس سے متعلق، بیان کرتی ہے، معقول طور پر اس قابل ہے کہ کسی خاص صارف یا گھرانے کے ساتھ براہ راست یا بالواسطہ طور پر منسلک کیا جا سکے۔ ذاتی معلومات میں مندرجہ ذیل شامل ہیں، لیکن ان تک محدود نہیں ہے، اگر یہ کسی خاص صارف یا گھرانے کے ساتھ، براہ راست یا بالواسطہ طور پر اس کی شناخت، اس سے متعلق، بیان کرنے، اس کے ساتھ منسلک ہونے، یا معقول طور پر منسلک ہونے کے قابل ہے۔

سادگی کی خاطر، ہر وہ چیز جسے GDPR کے تحت ذاتی ڈیٹا سمجھا جاتا ہے وہ بھی CCPA کے تحت آتا ہے۔ اگرچہ، ایک اہم انتباہ ہے. CCPA میں "امکانی شناخت کنندگان" کی تعریف شامل ہے:

"ممکنہ شناخت کنندہ" کا مطلب ہے کسی صارف یا ڈیوائس کی شناخت کی حد تک زیادہ امکان کی حد تک ذاتی معلومات کی کسی بھی قسم کی بنیاد پر نہیں جو کہ ذاتی معلومات کی تعریف میں درج کی گئی زمروں میں شامل ہے، یا اس سے ملتی جلتی ہے۔

عملی طور پر، امکانی شناخت کنندہ شناخت کرنے والے ڈیٹاسیٹس کے قریب آتے ہیں جن کا میں نے GDPR کے تحت پہلے ذکر کیا ہے۔ زیادہ تر معاملات میں، ایک ڈیٹا پوائنٹ جو ذاتی معلومات نہیں ہے وہ بھی ممکنہ شناخت کنندہ کے طور پر کام نہیں کرے گا۔ تاہم، متعدد ڈیٹا پوائنٹس جو ایک ڈیٹاسیٹ میں مل کر خود شناخت نہیں کر رہے ہیں، ممکنہ شناخت کنندہ بن سکتے ہیں۔

CCPA میں ایک اہم فرق ہے - رضامندی نہیں ہے براہ راست ذکر کیا. اگر جمع کیا گیا ڈیٹا فروخت کے لیے ہے، تو ہر اس شخص کو مطلع کرنے کی ضرورت ہے جس کا ڈیٹا حاصل کیا گیا ہے۔ مزید برآں، نوٹس کو "کلیکشن پر" فراہم کرنا ہوگا۔ عملی طور پر، اس کا اکثر مطلب یہ ہوتا ہے کہ واضح طور پر تجارتی مقاصد کے لیے خودکار ڈیٹا اکٹھا کرنا، ایک بار پھر، ناقابل عمل ہے۔

نتیجہ

صارفین کی رازداری اور ڈیٹا کی اخلاقیات کی قانون سازی بڑھ رہی ہے اور اچھی وجہ کے ساتھ۔ ڈیٹا اکٹھا کرنے میں بے لگام طاقت یقینی طور پر غلط استعمال کا باعث بن سکتی ہے۔ ہم ویب سکریپنگ کے بڑے پیمانے پر استعمال کی شائستہ شروعات پر ہیں اور پھر بھی، ہم اس کی ناقابل یقین صلاحیت کو پہلے ہی دیکھ سکتے ہیں۔

موجود ڈیٹا کی اقسام کو سمجھ کر، ہم واضح طور پر حد بندی کر سکتے ہیں کہ ویب سکریپنگ کے لیے منصفانہ گیم کیا ہے۔ اس کے بعد اخلاقیات کے اعلیٰ ترین معیار کو برقرار رکھنا کیک کا ٹکڑا ہو گا۔

ٹیگ لائن: اگر آپ ایک کامیاب بڑی ڈیٹا حکمت عملی کو نافذ کرنا چاہتے ہیں تو آن لائن ڈیٹا کی مختلف اقسام کو سمجھنا ضروری ہے۔

ماخذ: https://www.smartdatacollective.com/understanding-different-types-of-online-data-for-data-strategy/

ٹائم اسٹیمپ:

سے زیادہ اسمارٹ ڈیٹا کلیکٹو