Kebersihan data yang tepat sangat penting karena perusahaan berfokus pada tata kelola AI

Node Sumber: 842364

Bergabunglah dengan Transform 2021 pada 12-16 Juli ini. Daftar for acara AI tahun ini.


Algoritme kecerdasan buatan / pembelajaran mesin saat ini berjalan pada ratusan ribu, jika tidak jutaan, kumpulan data. Permintaan data yang tinggi telah melahirkan layanan yang mengumpulkan, menyiapkan, dan menjualnya.

Tetapi kenaikan data sebagai mata uang yang berharga juga membuatnya diteliti dengan lebih cermat. Di perusahaan, lebih besar Tata kelola AI harus menyertai penggunaan pembelajaran mesin yang terus berkembang.

Karena terburu-buru untuk mendapatkan data, perusahaan mungkin tidak selalu melakukan uji tuntas dalam proses pengumpulan - dan itu dapat menyebabkan dampak yang tidak menyenangkan. Menavigasi etis dan konsekuensi hukum dari pengumpulan dan penggunaan data yang tidak tepat terbukti menjadi tantangan, terutama dalam menghadapi peraturan hukum yang terus berkembang dan kesadaran konsumen yang semakin meningkat tentang privasi dan persetujuan.

Peran data dalam pembelajaran mesin

Pembelajaran mesin yang diawasi, bagian dari kecerdasan buatan, memanfaatkan kumpulan data yang luas untuk melakukan tugasnya dengan baik. Ini "mempelajari" berbagai gambar atau file audio atau jenis data lainnya.

Misalnya, algoritme pembelajaran mesin yang digunakan dalam pemeriksaan bagasi bandara mempelajari seperti apa bentuk senjata dengan melihat jutaan gambar senjata - dan jutaan tidak berisi senjata. Ini berarti perusahaan perlu menyiapkan seperangkat pelatihan gambar berlabel.

Situasi serupa terjadi dengan data audio, kata Dr. Chris Mitchell, CEO perusahaan teknologi pengenalan suara Analitik Audio. Jika sistem keamanan rumah akan bersandar pada AI, ia perlu mengenali seluruh suara termasuk kaca jendela pecah dan alarm asap, menurut Mitchell. Yang tidak kalah pentingnya, ia perlu menunjukkan informasi ini dengan benar meskipun ada potensi kebisingan latar belakang. Itu perlu memberi makan pada data target, yang merupakan suara tepat dari alarm kebakaran. Ini juga memerlukan audio non-target, yang merupakan suara yang mirip dengan - tetapi berbeda dari - alarm kebakaran.

Sakit kepala data ML

Karena algoritme ML menggunakan teks, gambar, audio, dan berbagai jenis data lainnya, kebutuhan akan kebersihan dan asal data semakin meningkat. Namun, ketika mereka mendapatkan daya tarik dan menemukan kasus penggunaan nirlaba baru di dunia nyata, asal dari kumpulan data terkait semakin berada di bawah mikroskop. Pertanyaan yang semakin perlu dipersiapkan perusahaan untuk dijawab adalah:

  • Darimana datanya?
  • Siapa pemiliknya?
  • Apakah partisipan dalam data atau produsernya telah memberikan izin untuk digunakan?

Tempat pertanyaan ini Kebutuhan tata kelola data AI pada akar masalah etika dan hukum yang terkait dengan privasi dan persetujuan. Jika sistem pengenalan wajah memindai wajah orang, bukankah seharusnya setiap orang yang wajahnya digunakan dalam algoritme harus menyetujui penggunaan semacam itu?

Hukum yang terkait dengan privasi dan masalah izin mendapatkan daya tarik. Itu Peraturan Perlindungan Data Umum Uni Eropa (GDPR) memberi hak kepada individu untuk memberikan dan menarik persetujuan untuk menggunakan data pribadi mereka, kapan saja. Sedangkan a Proposal 2021 dari Uni Eropa akan menyiapkan kerangka hukum untuk tata kelola AI yang akan melarang penggunaan beberapa jenis data dan memerlukan izin sebelum mengumpulkan data.

Bahkan membeli kumpulan data tidak memberikan kekebalan perusahaan dari tanggung jawab atas penggunaannya. Ini terlihat saat Komisi Perdagangan Federal menampar Facebook dengan denda $ 5 miliar atas privasi konsumen. Salah satu dari banyak resep adalah mandat untuk kontrol yang lebih ketat atas aplikasi pihak ketiga.

Pesan yang dibawa pulang jelas, kata Mitchell: Masalah dimulai dan dihentikan dengan perusahaan menggunakan datanya, tidak peduli asal datanya. โ€œSekarang bergantung pada perusahaan pembelajaran mesin untuk dapat menjawab pertanyaan: 'Dari mana data saya berasal?' Itu tanggung jawab mereka, โ€kata Mitchell.

Selain denda dan masalah hukum, kekuatan model AI bergantung pada data yang kuat. Jika perusahaan belum melakukan uji tuntas dalam memantau asal data, dan jika konsumen mencabut izin besok, mengekstraksi kumpulan data tersebut dapat menjadi mimpi buruk karena saluran penggunaan data AI terkenal sulit dilacak.

Lanskap persetujuan yang rumit

Meminta persetujuan adalah resep yang bagus, tetapi sulit untuk dilakukan. Untuk satu hal, penggunaan kumpulan data mungkin sangat jauh dari sumbernya sehingga perusahaan bahkan mungkin tidak tahu dari siapa harus mendapatkan persetujuan.

Konsumen juga tidak akan selalu tahu apa yang mereka setujui, kata Dr. James Giordano, direktur Program Biosecurity and Ethics di Cyber-SMART Center of Georgetown University dan co-director Program in Emerging Technology dan Global Law and Policy .

โ€œKonstruksi legal-etis dari persetujuan, minimal, dapat dilihat sebagai pelaksanaan hak penerimaan atau penolakan,โ€ kata Giordano. โ€œSaat saya setuju, saya berkata, 'Ya, Anda bisa melakukan ini.' Tapi itu akan mengasumsikan bahwa saya tahu apa 'ini'. "

Ini tidak selalu praktis. Bagaimanapun, data mungkin awalnya dikumpulkan untuk beberapa tujuan yang tidak terkait, dan konsumen dan bahkan perusahaan mungkin tidak tahu ke mana jejak data breadcrumbs sebenarnya mengarah.

"Sebagai prinsip dasar, 'Jika ragu, minta persetujuan' adalah strategi yang masuk akal untuk diikuti," kata Mitchell.

Jadi, manajer perusahaan perlu memastikan bahwa data yang kuat dan diatur dengan baik adalah dasar dari model ML. "Ini agak sederhana," kata Mitchell. "Anda harus bekerja keras. Anda tidak ingin mengambil jalan pintas."

VentureBeat

Misi VentureBeat adalah menjadi alun-alun kota digital bagi para pembuat keputusan teknis untuk mendapatkan pengetahuan tentang teknologi transformatif dan bertransaksi. Situs kami memberikan informasi penting tentang teknologi data dan strategi untuk memandu Anda saat Anda memimpin organisasi. Kami mengundang Anda untuk menjadi anggota komunitas kami, untuk mengakses:

  • informasi terkini tentang topik yang menarik bagi Anda
  • buletin kami
  • konten pemimpin pemikiran yang terjaga keamanannya dan akses diskon ke acara berharga kami, seperti Transformasi 2021: Belajarlah lagi
  • fitur jaringan, dan banyak lagi

Menjadi anggota

Sumber: https://venturebeat.com/2021/05/06/proper-data-hygiene-critical-as-enterEMENTS-focus-on-ai-governance/

Stempel Waktu:

Lebih dari VentureBeat