OpenAI, phòng thí nghiệm nghiên cứu trí tuệ nhân tạo có ảnh hưởng đằng sau các công cụ đột phá như ChatGPT và Sora, đã gặp khó khăn sau cuộc phỏng vấn gần đây với Giám đốc Công nghệ, Mira Murati.
Phỏng vấn, được thực hiện bởi phóng viên Joanna Stern của Wall Street Journal, tập trung vào hệ thống tạo hình ảnh, hay đúng hơn là video, mới nhất của OpenAI, Sora.
Những lo ngại xoay quanh khả năng lạm dụng tác phẩm có bản quyền để đào tạo các mô hình AI và thiếu minh bạch từ OpenAI liên quan đến hoạt động dữ liệu của nó.
Dữ liệu đào tạo của Sora đang bị nghi ngờ
Trọng tâm của cuộc tranh cãi nằm ở vấn đề dữ liệu huấn luyện, các bộ dữ liệu khổng lồ được sử dụng để đào tạo các mô hình AI.
Khi được hỏi về nguồn dữ liệu được sử dụng cho Sora, Murati đưa ra câu trả lời tiêu chuẩn: mô hình đã được đào tạo về “dữ liệu được cấp phép và có sẵn công khai".
Tuy nhiên, việc thăm dò sâu hơn cho thấy sự do dự và không chắc chắn của Murati về các chi tiết cụ thể của bộ dữ liệu này.
Phản ứng này có giương cao cờ đỏ giữa các nghệ sĩ, nhiếp ảnh gia và chuyên gia sở hữu trí tuệ. Hệ thống tạo hình ảnh AI phụ thuộc rất nhiều vào việc nhập số lượng lớn hình ảnh, nhiều hình ảnh trong số đó có thể được bảo vệ bản quyền. Sự thiếu rõ ràng xung quanh dữ liệu đào tạo của Sora đặt ra câu hỏi về việc liệu OpenAI có bảo vệ đầy đủ quyền của người sáng tạo nội dung hay không.
Việc sử dụng Shutterstock được thừa nhận sau này
Đổ thêm dầu vào lửa là việc ban đầu Murati từ chối giải quyết liệu hình ảnh Shutterstock có phải là một phần trong tập dữ liệu huấn luyện của Sora hay không. Chỉ sau cuộc phỏng vấn, trong một chú thích được Wall Street Journal thêm vào, Murati mới xác nhận việc sử dụng thư viện hình ảnh của Shutterstock.
Xác nhận này mâu thuẫn với quan điểm đối mặt với công chúng của OpenAI về “dữ liệu được cấp phép và có sẵn công khai” và gợi ý một nỗ lực nhằm che giấu các hoạt động tìm nguồn cung ứng có thể có vấn đề.
Shutterstock và OpenAI đã thành lập một quan hệ đối tác cấp quyền cho OpenAI sử dụng thư viện hình ảnh của Shutterstock trong việc đào tạo các mô hình tạo hình ảnh như DALL-E 2 và có thể là Sora.
Đổi lại, những người đóng góp cho Shutterstock (các nhiếp ảnh gia và nghệ sĩ có hình ảnh trên nền tảng) sẽ nhận được tiền bồi thường khi tác phẩm của họ được sử dụng để phát triển các mô hình AI này.
Cơn ác mộng PR bắt đầu
Có thể nói rằng hầu hết những người làm quan hệ công chúng sẽ không coi cuộc phỏng vấn này là một kiệt tác PR.
Sự thiếu rõ ràng của Murati đến vào thời điểm nhạy cảm đối với OpenAI, đã phải đối mặt với các vụ kiện bản quyền lớn, bao gồm cả một thông tin quan trọng được đăng bởi New York Times.
Công chúng đang xem xét kỹ lưỡng các hoạt động như việc OpenAI bị cáo buộc bí mật sử dụng các video trên YouTube để đào tạo người mẫu. báo cáo trước đây của The Information. Với các bên liên quan từ nghệ sĩ đến chính trị gia đang yêu cầu trách nhiệm giải trình, sự né tránh của Murati chỉ đổ thêm dầu vào lửa.
Cách tiếp cận không rõ ràng của OpenAI đang phản tác dụng một cách ngoạn mục, biến cuộc phỏng vấn Sora thành thảm họa PR.
OpenAI CTO Mira Murati cho biết Sora đã được đào tạo về dữ liệu được cấp phép và có sẵn công khai pic.twitter.com/rf7pZ0ZX00
- Tsarathustra (@tsarnick) 13 Tháng ba, 2024
Minh bạch không phải là chủ đề được thảo luận nhiều nhất
Sự việc này nhấn mạnh một sự thật quan trọng: tiết lộ sự thật là điều tối quan trọng trong thế giới AI. Những phản ứng vấp ngã của OpenAI đã làm suy yếu nghiêm trọng niềm tin của công chúng và làm dấy lên những câu hỏi về thực tiễn đạo đức của nó. Cuộc tranh cãi về Sora làm nổi bật điệp khúc ngày càng lớn đòi hỏi trách nhiệm cao hơn trong ngành AI.
Murati miễn cưỡng tiết lộ chi tiết cụ thể về dữ liệu huấn luyện của Sora ngờ vực và tạo tiền lệ nguy hiểm.
Nếu không có sự rõ ràng mà các nghệ sĩ, người sáng tạo và công chúng đang đòi hỏi, các cuộc tranh luận về đạo đức và khả năng hành động pháp lý sẽ chỉ tăng cường.
Không có thiên thần ở vùng đất này
Mặc dù phần lớn sự giám sát hiện nay đều tập trung vào OpenAI, nhưng điều quan trọng cần nhớ là họ không phải là người chơi duy nhất trong trò chơi.
Nghiên cứu AI của Facebook mô hình LLaMA và Song Tử của Google cũng phải đối mặt với cáo buộc về nguồn dữ liệu đào tạo có vấn đề.
Điều này không có gì đáng ngạc nhiên, vì Báo cáo nội bộ doanh nghiệp mà Meta đã thừa nhận sử dụng bài đăng trên Instagram và Facebook để đào tạo các mô hình AI của mình. Ngoài ra, Sự kiểm soát của Google trên phạm vi rộng lớn của Internet mang lại cho họ quyền truy cập tuyệt vời vào dữ liệu đào tạo tiềm năng, gây ra những lo ngại về mặt đạo đức tương tự về sự đồng ý và bản quyền.
Tình huống với Sora của OpenAI là chỉ là một mảnh của câu đố lớn hơn. Toàn bộ lĩnh vực phát triển AI đang phải đối mặt với sự giám sát kỹ lưỡng liên quan đến hoạt động xử lý dữ liệu và các tác động đạo đức tiềm ẩn.
Tín dụng hình ảnh nổi bật: Freepik.
- Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
- PlatoData.Network Vertical Generative Ai. Trao quyền cho chính mình. Truy cập Tại đây.
- PlatoAiStream. Thông minh Web3. Kiến thức khuếch đại. Truy cập Tại đây.
- Trung tâmESG. Than đá, công nghệ sạch, Năng lượng, Môi trường Hệ mặt trời, Quản lý chất thải. Truy cập Tại đây.
- PlatoSức khỏe. Tình báo thử nghiệm lâm sàng và công nghệ sinh học. Truy cập Tại đây.
- nguồn: https://dataconomy.com/2024/03/15/openai-sora-training-data-controversy/
- : có
- :là
- :không phải
- 1
- 11
- 13
- 2%
- 500
- 6
- a
- Giới thiệu
- truy cập
- trách nhiệm
- Hoạt động
- thêm
- Ngoài ra
- địa chỉ
- đầy đủ
- thừa nhận
- Sau
- chương trình nghị sự
- AI
- Mô hình AI
- Cảnh báo
- Lời cáo buộc
- cáo buộc
- Đã
- Ngoài ra
- trong số
- an
- và
- thiên thần
- bất kì
- phương pháp tiếp cận
- LÀ
- xung quanh
- nhân tạo
- trí tuệ nhân tạo
- Nghệ sĩ
- AS
- hỏi
- At
- nỗ lực
- có sẵn
- BE
- được
- sau
- by
- Trung tâm
- ChatGPT
- chánh
- Giám đốc Công nghệ
- rõ ràng
- đến
- Bồi thường
- thành phần
- giấu
- Mối quan tâm
- thực hiện
- Xác nhận
- xác nhận
- đồng ý
- Hãy xem xét
- nội dung
- người tạo nội dung
- đóng góp
- điều khiển
- tranh cãi
- quyền tác giả
- người sáng tạo
- quan trọng
- chỉ trích
- quan trọng
- CTO
- Current
- dall's
- Nguy hiểm
- dữ liệu
- Cơ sở dữ liệu
- bộ dữ liệu
- cuộc tranh luận
- yêu cầu
- phụ thuộc
- chi tiết
- Phát triển
- phát triển
- ĐÃ LÀM
- tiết lộ
- thảo luận
- Toàn bộ
- đạo đức
- các chuyên gia
- phải đối mặt
- khuôn mặt
- phải đối mặt với
- Ngã
- lĩnh vực
- nộp
- Lửa
- tập trung
- tiếp theo
- Trong
- hình thành
- tìm thấy
- từ
- Nhiên liệu
- nhiên liệu
- xa hơn
- thế hệ
- cho
- cấp
- lớn hơn
- đột phá
- Phát triển
- có
- Có
- Trái Tim
- nặng nề
- Cao
- nổi bật
- NÓNG BỨC
- HTTPS
- hình ảnh
- thế hệ hình ảnh
- hình ảnh
- hàm ý
- in
- sự cố
- Bao gồm
- Có ảnh hưởng
- ban đầu
- Insider
- trí tuệ
- sở hữu trí tuệ
- Sự thông minh
- tăng cường
- Phỏng vấn
- trong
- vấn đề
- ITS
- chính nó
- tạp chí
- jpg
- phòng thí nghiệm
- Thiếu sót
- lớn hơn
- một lát sau
- mới nhất
- Hợp pháp
- Hành động pháp lý
- Thư viện
- Cấp phép
- nằm
- Lượt thích
- dài
- chính
- nhiều
- lớn
- kiệt tác
- max-width
- Có thể..
- Siêu dữ liệu
- sử dụng sai
- kiểu mẫu
- mô hình
- hầu hết
- nhiều
- Mới
- Newyork
- Bán Chạy Nhất của Báo New York Times
- Không
- of
- Nhân viên văn phòng
- chính thức
- on
- ONE
- có thể
- đục
- OpenAI
- or
- kết thúc
- Paramount
- một phần
- mảnh
- nền tảng
- plato
- Thông tin dữ liệu Plato
- PlatoDữ liệu
- máy nghe nhạc
- Các chính trị gia
- tiềm năng
- có khả năng
- pr
- thực hành
- tài sản
- bảo vệ
- cung cấp
- công khai
- Quan hệ công chúng
- lòng tin của công
- công khai
- công bố
- số lượng
- Câu hỏi
- tăng giá
- nâng cao
- khác nhau,
- hơn
- nhận
- gần đây
- đỏ
- từ chối
- về
- quan hệ
- miễn cưỡng
- nhớ
- Báo cáo
- phóng viên
- nghiên cứu
- phản ứng
- phản ứng
- trở lại
- Tiết lộ
- quyền
- s
- an toàn
- được bảo vệ
- nói
- nói
- giám sát
- Bí mật
- nhạy cảm
- bộ
- nghiêm trọng
- shutterstock
- có ý nghĩa
- tương tự
- tình hình
- nguồn
- Tìm nguồn cung ứng
- riêng
- chi tiết cụ thể
- các bên liên quan
- lập trường
- Tiêu chuẩn
- đường phố
- vấp
- Gợi ý
- thật ngạc nhiên
- hệ thống
- hệ thống
- Công nghệ
- việc này
- Sản phẩm
- The New York Times
- The Wall Street Journal
- thế giới
- cung cấp their dịch
- Them
- Kia là
- điều này
- thời gian
- thời gian
- đến
- công cụ
- chủ đề
- Train
- đào tạo
- Hội thảo
- Minh bạch
- đúng
- NIỀM TIN
- Sự thật
- Không chắc chắn
- gạch
- chưa từng có
- hé lộ
- Sử dụng
- sử dụng
- đã sử dụng
- tận dụng
- Lớn
- Video
- Video
- Tường
- Wall Street
- Wall Street Journal
- Phóng viên Wall Street Journal
- là
- Nước
- là
- khi nào
- liệu
- cái nào
- có
- sẽ
- với
- ở trong
- Công việc
- thế giới
- sẽ
- WSJ
- york
- youtube
- zephyrnet