Hệ thống tự động hoàn thành văn bản nhằm mục đích giúp cuộc sống của chúng ta dễ dàng hơn nhưng vẫn có những rủi ro

Được xuất bản lại bởi Plato

Người theo dõi: 0

Lắng nghe từ các CIO, CTO và các giám đốc điều hành cấp C và cấp cao khác về dữ liệu và chiến lược AI tại Hội nghị thượng đỉnh về Tương lai của Công việc vào ngày 12 tháng 2022 năm XNUMX này. Tìm hiểu thêm

Nếu gần đây bạn đã viết một tin nhắn văn bản hoặc email, rất có thể AI sẽ gợi ý cho bạn các từ đồng nghĩa, cụm từ hoặc cách kết thúc câu khác nhau. Sự gia tăng của các công cụ đề xuất tự động do AI cung cấp như Smart Compose của Google diễn ra đồng thời với quá trình chuyển đổi kỹ thuật số của hoạt động truyền thông doanh nghiệp, hiện chủ yếu hoạt động trực tuyến. Của nó ước tính rằng nhân viên thông thường trả lời khoảng 40 email mỗi ngày và gửi hơn 200 tin nhắn Slack mỗi tuần.

Nhắn tin có nguy cơ chiếm phần lớn thời gian trong ngày làm việc, với Adobe pegging lượng thời gian mà người lao động dành để trả lời email là 15.5 giờ một tuần. Việc chuyển đổi nhiệm vụ liên tục là một hồi chuông báo tử cho năng suất, mà các nghiên cứu cho thấy lợi ích từ công việc không bị gián đoạn. Nghiên cứu từ Đại học California và Đại học Humboldt đã phát hiện ra rằng nhân viên có thể mất tới 23 phút cho một nhiệm vụ mỗi khi họ bị gián đoạn, kéo dài thêm ngày làm việc.

Các công cụ tự động gợi ý hứa hẹn sẽ tiết kiệm thời gian bằng cách hợp lý hóa việc viết và trả lời tin nhắn. Ví dụ: Trả lời thông minh của Google đề xuất phản hồi nhanh cho các email thường mất vài phút để nhập. Nhưng AI đằng sau những công cụ này có những thiếu sót có thể gây ra những thành kiến hoặc ảnh hưởng đến ngôn ngữ được sử dụng trong việc nhắn tin theo những cách không mong muốn.

Sự phát triển trong đề xuất tự động và tự động hoàn thành văn bản

Tiên đoán văn bản không phải là một công nghệ mới. Một trong những ví dụ phổ biến đầu tiên, T9, cho phép các từ được hình thành chỉ bằng một lần nhấn phím cho mỗi chữ cái, đã trở thành tiêu chuẩn trên nhiều điện thoại di động vào cuối những năm 90. Nhưng sự ra đời của các kỹ thuật AI tinh vi hơn, có thể mở rộng hơn trong ngôn ngữ đã dẫn đến những bước nhảy vọt về chất lượng — và bề rộng — của các công cụ tự động gợi ý.

Năm 2017, Google ra mắt Trả lời thông minh trong Gmail, công ty này sau đó đã mang đến các dịch vụ khác của Google bao gồm Trò chuyện và các ứng dụng của bên thứ ba. Theo Google, AI đằng sau tính năng Trả lời thông minh tạo ra các đề xuất trả lời “dựa trên ngữ cảnh đầy đủ của một cuộc trò chuyện”, chứ không chỉ một tin nhắn — có vẻ như dẫn đến các đề xuất kịp thời và phù hợp hơn. Soạn thư thông minh, gợi ý các câu hoàn chỉnh trong email, đã xuất hiện trong Gmail một năm sau đó và Google Tài liệu sẽ sớm thôi sau đó. Một tính năng tương tự được gọi là đề nghị trả lời đã đến với Microsoft Outlook vào năm 2018 và Teams vào năm 2020.

Công nghệ đằng sau loạt công cụ tự động gợi ý mới — mà một số giới học thuật gọi là “giao tiếp qua trung gian AI” — là bước nhảy vượt xa những gì đã tồn tại trong thập niên 90. Ví dụ: mô hình AI làm nền tảng cho Soạn thư thông minh đã được tạo bằng cách sử dụng hàng tỷ mẫu email và chạy trên đám mây trên phần cứng tăng tốc tùy chỉnh. Trong khi đó, Trả lời thông minh — được dùng làm nền tảng cho Soạn thư thông minh — sử dụng “cách tiếp cận theo thứ bậc” đối với các đề xuất, lấy cảm hứng từ cách con người hiểu các ngôn ngữ và khái niệm.

Phía trên: Trả lời thông minh của Outlook sử dụng các mô hình học sâu được đào tạo trong Azure Machine Learning.

Tín dụng hình ảnh: Microsoft

“Nội dung của ngôn ngữ được phân cấp sâu sắc, được phản ánh trong chính cấu trúc của ngôn ngữ…” Brian Strope, nhà khoa học nghiên cứu của Google và giám đốc kỹ thuật Ray Kurzweil giải thích trong một bài đăng trên blog. “Hãy xem xét tin nhắn, 'Người thú vị đó ở quán cà phê mà chúng ta thích đã liếc nhìn tôi.' … Khi đề xuất một phản hồi thích hợp cho thông báo này, chúng tôi có thể xem xét nghĩa của từ 'liếc qua', nghĩa này có khả năng mơ hồ. Đó có phải là một cử chỉ tích cực? Trong trường hợp đó, chúng tôi có thể trả lời, 'Tuyệt!' Hay đó là một cử chỉ tiêu cực? Nếu vậy, chủ đề có nói gì về cảm giác của người viết về sự trao đổi tiêu cực không? Rất nhiều thông tin về thế giới và khả năng đưa ra những đánh giá hợp lý là cần thiết để tạo ra những sự khác biệt tinh tế. Với đủ ví dụ về ngôn ngữ, phương pháp học máy có thể phát hiện ra nhiều điểm khác biệt tinh tế này. ”

Nhưng như với tất cả các công nghệ, ngay cả những công cụ đề xuất tự động có khả năng nhất cũng dễ mắc phải các lỗi phát sinh trong quá trình phát triển — và triển khai —.

Vào tháng 2016 năm XNUMX, đó là tiết lộ rằng tính năng tự động hoàn thành của Google Tìm kiếm đã đề xuất các kết thúc thù địch và xúc phạm cho các cụm từ tìm kiếm cụ thể, chẳng hạn như “người Do Thái có xấu xa không?” cho cụm từ "là người Do Thái". Theo công ty, lỗi là do một hệ thống thuật toán cập nhật các đề xuất dựa trên những gì người dùng khác đã tìm kiếm gần đây. Mặc dù Google cuối cùng đã triển khai bản sửa lỗi, nhưng phải mất vài năm nữa công ty mới chặn được các đề xuất tự động hoàn thành cho tuyên bố chính trị gây tranh cãi bao gồm cả những tuyên bố sai sự thật về các yêu cầu bỏ phiếu và tính hợp pháp của quy trình bầu cử.

Trả lời thông minh đã được tìm thấy để cung cấp biểu tượng cảm xúc "người đội khăn xếp" để phản hồi tin nhắn có biểu tượng cảm xúc súng. Và tính năng tự động hoàn thành của Apple trên iOS trước đây chỉ đề xuất biểu tượng cảm xúc nam cho các vai trò điều hành bao gồm CEO, COO và CTO.

Dữ liệu sai lệch

Các lỗi trong hệ thống tự động hoàn thành và tự động đề xuất thường phát sinh từ dữ liệu sai lệch. Hàng triệu đến hàng tỷ ví dụ mà hệ thống học được từ đó có thể bị nhiễm độc bằng văn bản từ trang web độc hại liên quan đến một số giới tính, chủng tộc, sắc tộc, và các tôn giáo với quan niệm gây tổn thương. Minh họa vấn đề, Sách thuốc, một mô hình tạo mã do phòng thí nghiệm nghiên cứu OpenAI phát triển, có thể được nhắc viết “khủng bố” khi được cung cấp từ “Hồi giáo”. Một mô hình ngôn ngữ lớn khác từ startup AI Mạch lạc có xu hướng gắn đàn ông và phụ nữ với những công việc theo khuôn mẫu là “nam” và “nữ”, như “nhà khoa học nam” và “nữ quản gia”.

Trên đây: Soạn thư thông minh cho Google Tài liệu.

Các chú thích trong dữ liệu có thể đưa ra các vấn đề mới — hoặc làm trầm trọng thêm các vấn đề hiện có. Do nhiều mô hình học hỏi từ các nhãn cho biết một từ, câu, đoạn văn hoặc tài liệu có các đặc điểm nhất định, chẳng hạn như cảm xúc tích cực hay tiêu cực, nên các công ty và nhà nghiên cứu tuyển dụng các nhóm người chú thích là con người để gắn nhãn các ví dụ, điển hình là từ các nền tảng cung cấp dịch vụ cộng đồng như Amazon Mechanical Turk. Những người chú thích này đưa ra các quan điểm — và thành kiến của riêng họ — để bàn.

Trong một nghiên cứu từ Viện AI Allen, Carnegie Mellon và Đại học Washington, các nhà khoa học phát hiện ra rằng những người dán nhãn có nhiều khả năng chú thích các cụm từ trong phương ngữ tiếng Anh của người Mỹ gốc Phi (AAE) độc hại hơn so với các từ tương đương trong tiếng Anh Mỹ thông thường — mặc dù chúng được hiểu như không độc hại bởi loa AAE. Jigsaw, tổ chức làm việc dưới quyền công ty mẹ của Google là Alphabet để giải quyết nạn bắt nạt trên mạng và thông tin sai lệch, đã đưa ra kết luận tương tự trong các thử nghiệm của mình. Các nhà nghiên cứu tại công ty đã phát hiện ra sự khác biệt trong chú thích giữa những người gắn nhãn tự nhận mình là người Mỹ gốc Phi và thành viên của cộng đồng LGBTQ+ so với những người chú thích không xác định là một trong những nhóm đó.

Đôi khi, sự thiên vị là cố ý - một vấn đề đánh đổi ngôn ngữ bản địa. Ví dụ, nhà văn, một công ty khởi nghiệp đang phát triển trợ lý AI để tạo nội dung, cho biết họ ưu tiên “tiếng Anh thương mại” trong các đề xuất viết của mình. CEO May Habib đã đưa ra ví dụ về “habitual be” trong AAVE, một động từ không tồn tại trong bất kỳ phong cách tiếng Anh nào khác.

“Vì [thói quen be] theo truyền thống không được sử dụng trong tiếng Anh thương mại và do đó không xuất hiện với tần suất cao trong tập dữ liệu của chúng tôi, nên chúng tôi sẽ sửa 'Các bạn đang làm một số điều kỳ lạ ở đây' thành 'Y' tất cả đều đang làm một số điều kỳ lạ ở đây'”, Habib nói với VentureBeat qua email. “[Điều đó nói lên rằng] chúng tôi đã đảm bảo theo cách thủ công rằng lời chào và lời đăng xuất dựa trên tiếng địa phương sẽ không bị Writer gắn cờ. Một số ngôn ngữ bản địa mang tính trung lập về giới tính hơn so với tiếng Anh thương mại trang trọng, [ví dụ], do đó, nó hiện đại hơn và mang tính thương hiệu hơn cho các công ty.”

Ảnh hưởng đến văn bản

Khi những thành kiến - cố ý hay không - biến nó thành hệ thống tự động hoàn thành và tự động gợi ý, chúng có thể thay đổi cách chúng ta viết. Quy mô khổng lồ mà các hệ thống này vận hành khiến chúng khó tránh khỏi hoàn toàn (nếu không muốn nói là không thể). Trả lời thông minh cũ là chịu trách nhiệm cho 10% tổng số thư trả lời Gmail được gửi từ điện thoại thông minh vào năm 2016.

Trong một trong những toàn diện hơn kiểm toán của các công cụ tự động hoàn thành, một nhóm các nhà nghiên cứu của Microsoft đã tiến hành phỏng vấn các tình nguyện viên được yêu cầu đưa ra suy nghĩ của họ về các câu trả lời được tạo tự động trong Outlook. Những người được phỏng vấn nhận thấy một số câu trả lời là quá tích cực, sai lầm trong giả định của họ về văn hóa và giới tính, và quá bất lịch sự trong một số bối cảnh nhất định, chẳng hạn như thư từ của công ty. Thậm chí, các thử nghiệm trong quá trình nghiên cứu cho thấy rằng người dùng có nhiều khả năng sẽ thích các câu trả lời ngắn gọn, tích cực và lịch sự hơn do Outlook đề xuất.

Google Trả lời thông minh YouTube

Một nghiên cứu riêng của Harvard đã phát hiện ra rằng khi những người viết về một nhà hàng được đưa ra các đề xuất tự động hoàn thành “tích cực”, kết quả là các bài đánh giá có xu hướng tích cực hơn so với khi họ được đưa ra các đề xuất tiêu cực. Ken Arnold, nhà nghiên cứu tại Trường Harvard's School of Khoa học Kỹ thuật và Ứng dụng, người đã tham gia vào nghiên cứu, nói với đài BBC.

Nếu có một giải pháp toàn diện cho vấn đề tự động hoàn thành có hại, thì nó vẫn chưa được khám phá. Google đã chọn chỉ chặn các đề xuất đại từ dựa trên giới tính trong Soạn thư thông minh vì hệ thống này tỏ ra là một công cụ dự đoán kém về giới tính và bản dạng giới của người nhận. LinkedIn của Microsoft cũng tránh các đại từ giới tính trong Trả lời thông minh, công cụ nhắn tin dự đoán của nó, để ngăn chặn những sai lầm tiềm ẩn.

Các đồng tác giả của Microsoft nghiên cứu cảnh báo rằng nếu các nhà thiết kế hệ thống không chủ động giải quyết những thiếu sót trong công nghệ tự động hoàn thành, họ sẽ có nguy cơ không chỉ xúc phạm người dùng mà còn khiến họ không tin tưởng vào hệ thống. “Các nhà thiết kế hệ thống nên khám phá các chiến lược cá nhân hóa ở cấp độ cá nhân và mạng xã hội, xem xét hệ thống của họ có thể duy trì các giá trị văn hóa và thành kiến xã hội như thế nào, đồng thời khám phá mô hình tương tác xã hội để bắt đầu giải quyết các hạn chế và vấn đề,” họ viết. “[O]những phát hiện của bạn chỉ ra rằng các hệ thống đề xuất văn bản hiện tại dành cho email và các công nghệ [như] khác vẫn chưa đủ sắc thái để phản ánh sự tinh tế của các mối quan hệ xã hội trong thế giới thực và nhu cầu giao tiếp. “

VentureBeat

Nhiệm vụ của VentureBeat là trở thành một quảng trường thành phố kỹ thuật số cho những người ra quyết định kỹ thuật có được kiến thức về công nghệ chuyển đổi và giao dịch. Trang web của chúng tôi cung cấp thông tin cần thiết về công nghệ và chiến lược dữ liệu để hướng dẫn bạn khi bạn lãnh đạo tổ chức của mình. Chúng tôi mời bạn trở thành thành viên của cộng đồng của chúng tôi, để truy cập:

thông tin cập nhật về các chủ đề mà bạn quan tâm
bản tin của chúng tôi
nội dung dẫn dắt tư tưởng được kiểm soát và giảm giá quyền truy cập vào các sự kiện được đánh giá cao của chúng tôi, chẳng hạn như Chuyển đổi 2021: Tìm hiểu thêm
các tính năng mạng và hơn thế nữa

Trở thành thành viên

Nguồn: https://vojibeat.com/2022/01/11/text-autocompletion-systems-aim-to-ease-our-lives-but-there-are-risks/

Dấu thời gian: 11 Tháng một, 2022