Sistem pelengkapan otomatis teks bertujuan untuk memudahkan hidup kita, tetapi ada risiko

Node Sumber: 1575782

Dengarkan dari CIO, CTO, dan eksekutif tingkat C dan senior lainnya tentang data dan strategi AI di Future of Work Summit 12 Januari 2022 ini. Pelajari lebih lanjut


Jika Anda baru saja menulis pesan teks atau email, kemungkinan besar AI akan menyarankan sinonim, frasa, atau cara berbeda untuk menyelesaikan kalimat. Munculnya alat sugesti otomatis yang didukung AI seperti Smart Compose dari Google bertepatan dengan transformasi digital komunikasi perusahaan, yang kini sebagian besar dilakukan secara online. Dia diperkirakan bahwa rata-rata pekerja membalas sekitar 40 email setiap hari dan mengirimkan lebih dari 200 pesan Slack per minggu.

Perpesanan mengancam untuk menghabiskan lebih banyak waktu kerja, dengan Adobe mengelompokkan jumlah waktu yang dihabiskan pekerja untuk menjawab email sebesar 15.5 jam seminggu. Peralihan tugas yang terus-menerus merupakan lonceng kematian bagi produktivitas, yang menurut penelitian menunjukkan manfaat dari pekerjaan yang tidak terganggu. Penelitian dari University of California dan Humboldt University menemukan bahwa pekerja dapat kehilangan waktu hingga 23 menit dalam mengerjakan suatu tugas setiap kali ada gangguan, pemanjangan lebih lanjut hari kerja.

Alat sugesti otomatis menjanjikan penghematan waktu dengan menyederhanakan penulisan pesan dan membalas. Balasan Cerdas Google, misalnya, menyarankan tanggapan cepat terhadap email yang biasanya membutuhkan waktu beberapa menit untuk diketik. Namun AI di balik alat-alat ini memiliki kekurangan yang dapat menimbulkan bias atau memengaruhi bahasa yang digunakan dalam pengiriman pesan dengan cara yang tidak diinginkan.

Pertumbuhan dalam saran otomatis dan pelengkapan otomatis teks

Teks prediktif bukanlah teknologi baru. Salah satu contoh pertama yang tersedia secara luas, T9, yang memungkinkan pembentukan kata hanya dengan menekan satu tombol untuk setiap huruf, menjadi standar di banyak ponsel pada akhir tahun 90an. Namun munculnya teknik AI yang lebih canggih dan terukur dalam bahasa menyebabkan lompatan dalam kualitas – dan luasnya – alat sugesti otomatis.

Pada tahun 2017, Google meluncurkan Balasan Cerdas di Gmail, yang kemudian dibawa perusahaan ke layanan Google lainnya termasuk Chat dan aplikasi pihak ketiga. Menurut Google, AI di balik Smart Reply menghasilkan saran balasan “berdasarkan konteks percakapan secara keseluruhan,” bukan hanya satu pesan – yang seolah-olah menghasilkan saran yang lebih tepat waktu dan relevan. Menulis Cerdas, yang menyarankan kalimat lengkap dalam email, hadir di Gmail setahun kemudian dan Google Dokumen segera setelah itu. Fitur serupa disebut balasan yang disarankan hadir di Microsoft Outlook pada tahun 2018 dan Teams pada tahun 2020.

Teknologi di balik teknologi baru alat sugesti otomatis (autosugesti) – yang oleh sebagian kalangan akademis disebut sebagai “komunikasi yang dimediasi AI” – jauh melampaui apa yang ada di tahun 90-an. Misalnya, model AI yang mendasari Smart Compose dibuat menggunakan miliaran contoh email dan dijalankan di cloud pada perangkat keras akselerator khusus. Sementara itu, Smart Reply — yang menjadi dasar Smart Compose — menggunakan “pendekatan hierarki” terhadap saran, yang terinspirasi oleh cara manusia memahami bahasa dan konsep.

Balasan Cerdas Microsoft

Di atas: Balasan Cerdas Outlook menggunakan model pembelajaran mendalam yang dilatih dalam Azure Machine Learning.

Kredit Gambar: Microsoft

“Isi bahasa sangat hierarkis, tercermin dalam struktur bahasa itu sendiri…” Ilmuwan riset Google Brian Strope dan direktur teknik Ray Kurzweil menjelaskan dalam postingan blog. “Pertimbangkan pesannya, 'Orang menarik di kafe yang kita sukai itu melirik saya.' … Dalam mengusulkan tanggapan yang tepat terhadap pesan ini kita mungkin mempertimbangkan arti kata 'sekilas', yang berpotensi menimbulkan ambiguitas. Apakah ini merupakan isyarat positif? Dalam hal ini, kita mungkin akan menjawab, 'Keren!' Atau apakah itu isyarat negatif? Jika ya, apakah subjeknya mengungkapkan perasaan penulis mengenai pertukaran negatif tersebut? Banyak informasi tentang dunia, dan kemampuan untuk membuat penilaian yang masuk akal, diperlukan untuk membuat perbedaan yang halus. Dengan adanya contoh bahasa yang cukup, pendekatan pembelajaran mesin dapat menemukan banyak perbedaan halus ini. ”

Namun seperti semua teknologi, bahkan alat sugesti otomatis yang paling mumpuni pun rentan terhadap kelemahan yang muncul selama proses pengembangan — dan penerapan —.

Pada bulan Desember 2016, itu terjadi mengungkapkan bahwa fitur pelengkapan otomatis Google Penelusuran menyarankan akhiran yang penuh kebencian dan menyinggung untuk frasa penelusuran tertentu, seperti “apakah orang Yahudi itu jahat?” untuk frasa “adalah orang Yahudi”. Menurut perusahaan, kesalahannya adalah sistem algoritmik yang memperbarui saran berdasarkan apa yang dicari pengguna lain baru-baru ini. Meskipun Google akhirnya menerapkan perbaikan, butuh beberapa tahun bagi perusahaan untuk memblokir saran pelengkapan otomatis pernyataan politik yang kontroversial termasuk klaim palsu mengenai persyaratan pemungutan suara dan legitimasi proses pemilu.

Balasan Cerdas telah ditemukan untuk menawarkan emoji “orang yang memakai sorban” sebagai tanggapan atas pesan yang menyertakan emoji senjata. Dan pelengkapan otomatis Apple di iOS sebelumnya hanya menyarankan emoji laki-laki untuk peran eksekutif termasuk CEO, COO, dan CTO.

Data bias

Kelemahan dalam sistem pelengkapan otomatis dan sugesti otomatis sering kali timbul dari data yang bias. Jutaan hingga miliaran contoh yang dipelajari sistem dapat dinodai dengan teks situs web beracun yang mengasosiasikan jenis kelamin, ras, etnisitas, dan agama dengan konsep yang menyakitkan. Mengilustrasikan masalahnya, Naskah kuno, model penghasil kode yang dikembangkan oleh laboratorium penelitian OpenAI, dapat diminta untuk menulis “teroris” ketika diberi kata “Islam.” Model bahasa besar lainnya dari startup AI Bersatu cenderung mengasosiasikan laki-laki dan perempuan dengan pekerjaan yang secara stereotip “laki-laki” dan “perempuan”, seperti “ilmuwan laki-laki” dan “pengurus rumah tangga perempuan.”

Smart Compose untuk Google Documents

Atas: Smart Compose untuk Google Documents.

Anotasi pada data dapat menimbulkan masalah baru — atau memperburuk masalah yang sudah ada. Karena banyak model belajar dari label yang mengomunikasikan apakah suatu kata, kalimat, paragraf, atau dokumen memiliki karakteristik tertentu, seperti sentimen positif atau negatif, perusahaan dan peneliti merekrut tim anotator manusia untuk memberi label pada contoh, biasanya dari platform crowdsourcing seperti Amazon Mechanical Turk. Para anotator ini mengemukakan perspektif — dan bias — mereka sendiri.

Dalam studi yang dilakukan oleh Allen Institute for AI, Carnegie Mellon, dan University of Washington, para ilmuwan menemukan bahwa pemberi label lebih cenderung memberi anotasi pada frasa dalam dialek African American English (AAE) yang lebih beracun dibandingkan padanan bahasa Inggris Amerika pada umumnya — meskipun frasa tersebut dipahami sebagai tidak beracun oleh speaker AAE. Gergaji ukir, organisasi yang bekerja di bawah perusahaan induk Google, Alphabet, untuk mengatasi penindasan maya dan disinformasi, telah menarik kesimpulan serupa dalam eksperimennya. Para peneliti di perusahaan tersebut telah menemukan perbedaan dalam anotasi antara pelabel yang mengidentifikasi dirinya sebagai orang Afrika-Amerika dan anggota komunitas LGBTQ+ dengan anotator yang tidak mengidentifikasi diri sebagai salah satu dari kelompok tersebut.

Kadang-kadang, bias ini memang disengaja – hanya masalah trade-off dalam bahasa sehari-hari. Misalnya, Penulis, sebuah startup yang mengembangkan asisten AI untuk pembuatan konten, mengatakan bahwa mereka memprioritaskan “Bahasa Inggris bisnis” dalam saran penulisannya. CEO May Habib memberikan contoh “habitual be” dalam AAVE, sebuah bentuk kata kerja yang tidak ada dalam gaya bahasa Inggris lainnya.

“Karena [kebiasaan be] secara tradisional tidak digunakan dalam bahasa Inggris bisnis, dan karenanya tidak muncul dalam frekuensi tinggi dalam kumpulan data kami, kami akan mengoreksi 'Kalian semua melakukan hal-hal aneh di sini' menjadi 'Y' semua melakukan hal-hal aneh di sini,'” kata Habib kepada VentureBeat melalui email. “[Meskipun demikian,] kami memastikan secara manual bahwa salam dan tanda tangan berbasis bahasa daerah tidak akan ditandai oleh Penulis. Beberapa bahasa daerah lebih netral gender dibandingkan bahasa Inggris bisnis formal, [misalnya] sehingga lebih modern dan sesuai dengan merek perusahaan.”

Mempengaruhi tulisan

Ketika bias – disengaja atau tidak – masuk ke dalam sistem pelengkapan otomatis dan sugesti otomatis, hal tersebut dapat mengubah cara kita menulis. Besarnya skala pengoperasian sistem ini membuat sistem ini sulit (bahkan tidak mungkin) untuk sepenuhnya dihindari. Balasan Cerdas tadinya tanggung jawab untuk 10% dari seluruh balasan Gmail yang dikirim dari ponsel cerdas pada tahun 2016.

Di salah satu yang lebih komprehensif audit alat pelengkapan otomatis, tim peneliti Microsoft melakukan wawancara dengan sukarelawan yang diminta untuk memberikan pendapat mereka tentang balasan yang dihasilkan secara otomatis di Outlook. Para responden menemukan bahwa beberapa jawaban yang diberikan terlalu positif, salah dalam asumsi mereka mengenai budaya dan gender, dan terlalu tidak sopan untuk konteks tertentu, seperti korespondensi perusahaan. Meski begitu, eksperimen selama penelitian menunjukkan bahwa pengguna lebih cenderung menyukai balasan singkat, positif, dan sopan yang disarankan oleh Outlook.

Google Balasan Cerdas YouTube

Sebuah studi terpisah di Harvard menemukan bahwa ketika orang yang menulis tentang sebuah restoran diberikan saran pelengkapan otomatis “positif”, ulasan yang dihasilkan cenderung lebih positif dibandingkan jika mereka diberikan saran negatif. “Sangat menarik untuk memikirkan bagaimana sistem teks prediktif di masa depan dapat membantu orang menjadi penulis yang jauh lebih efektif, namun kita juga memerlukan transparansi dan akuntabilitas untuk melindungi dari saran yang mungkin bias atau dimanipulasi,” Ken Arnold, peneliti di Harvard's School of Teknik dan Ilmu Terapan yang terlibat dalam penelitian ini, mengatakan BBC

Jika ada solusi menyeluruh terhadap masalah pelengkapan otomatis yang berbahaya, solusi tersebut belum ditemukan. Google memilih untuk memblokir saran kata ganti berbasis gender di Smart Compose karena sistem tersebut terbukti tidak mampu memprediksi jenis kelamin dan identitas gender penerima. LinkedIn milik Microsoft juga menghindari kata ganti berdasarkan gender di Balasan Cerdas, alat perpesanan prediktifnya, untuk mencegah potensi kesalahan.

Rekan penulis Microsoft belajar memperingatkan bahwa jika perancang sistem tidak secara proaktif mengatasi kekurangan dalam teknologi pelengkapan otomatis, mereka akan mengambil risiko tidak hanya menyinggung pengguna namun juga menyebabkan mereka tidak mempercayai sistem. “Perancang sistem harus mengeksplorasi strategi personalisasi pada tingkat individu dan jaringan sosial, mempertimbangkan bagaimana nilai-nilai budaya dan bias masyarakat dapat dilestarikan oleh sistem mereka, dan mengeksplorasi pemodelan interaksi sosial untuk mulai mengatasi keterbatasan dan masalah,” tulis mereka. “Temuan kami menunjukkan bahwa sistem rekomendasi teks saat ini untuk email dan teknologi lainnya masih kurang bernuansa untuk mencerminkan seluk-beluk hubungan sosial dan kebutuhan komunikasi di dunia nyata. “

VentureBeat

Misi VentureBeat adalah menjadi alun-alun kota digital bagi para pembuat keputusan teknis untuk mendapatkan pengetahuan tentang teknologi transformatif dan bertransaksi. Situs kami memberikan informasi penting tentang teknologi data dan strategi untuk memandu Anda saat Anda memimpin organisasi. Kami mengundang Anda untuk menjadi anggota komunitas kami, untuk mengakses:

  • informasi terkini tentang topik yang menarik bagi Anda
  • buletin kami
  • konten pemimpin pemikiran yang terjaga keamanannya dan akses diskon ke acara berharga kami, seperti Transformasi 2021: Belajarlah lagi
  • fitur jaringan, dan banyak lagi

Menjadi anggota

Sumber: https://venturebeat.com/2022/01/11/text-autocompletion-systems-aim-to-ease-our-lives-but-there-are-risks/

Stempel Waktu:

Lebih dari AI - VentureBeat