Quy mô AI tham gia vào trò chơi dữ liệu tổng hợp

Nút nguồn: 1599948

Con đường trở thành công ty trị giá 7.3 tỷ đô la của Scale AI được mở bằng dữ liệu thực tế từ hình ảnh, văn bản, giọng nói và video. Bây giờ, nó đang sử dụng nền tảng đó để tham gia vào trò chơi dữ liệu tổng hợp, một trong những danh mục nóng hơn và mới nổi trong AI.

Hôm thứ Tư, họ đã công bố một chương trình truy cập sớm để Quy mô tổng hợp, một sản phẩm mà các kỹ sư học máy có thể sử dụng để nâng cao các tập dữ liệu trong thế giới thực hiện có của họ, theo công ty. Scale đã thuê hai giám đốc điều hành để xây dựng bộ phận kinh doanh mới này của mình. Scale đã thuê Joel Kronander, người trước đây đứng đầu bộ phận học máy tại Nines và là cựu kỹ sư thị giác máy tính tại Apple làm việc về lập bản đồ 3D, làm trưởng bộ phận dữ liệu tổng hợp mới của hãng. Công ty cũng đã thuê Vivek Raju Muppalla làm giám đốc dịch vụ tổng hợp. Muppalla trước đây là giám đốc kỹ thuật cho AI và mô phỏng tại Unity Technologies.

Dữ liệu tổng hợp đúng như âm thanh: dữ liệu giả được tạo ra bởi các thuật toán máy học chứ không phải sử dụng thông tin từ thế giới thực. Nó có thể là một công cụ mạnh mẽ và tiện dụng để tạo dữ liệu - như hình ảnh y tế - khi quyền riêng tư là mối quan tâm hàng đầu. Các nhà phát triển có thể sử dụng dữ liệu tổng hợp để tăng thêm độ phức tạp cho mô hình đào tạo của họ và giúp loại bỏ các thành kiến ​​thường có trong các tập dữ liệu thế giới thực được thu thập.

Quy mô ban đầu kết hợp phần mềm với hình ảnh thực, dữ liệu văn bản, giọng nói và video được mọi người gắn nhãn để cung cấp cho các công ty xe tự hành dữ liệu được gắn nhãn cần thiết để đào tạo các mô hình học máy nhằm phát triển và triển khai robotaxis, xe tải tự lái và bot tự động được sử dụng trong nhà kho và trên- giao hàng theo yêu cầu. Kể từ đó, công ty khởi nghiệp này đã trở thành một công ty nền tảng quản lý dữ liệu với khách hàng bao gồm các ngành chính phủ, tài chính, thương mại điện tử, xe tự hành và doanh nghiệp.

Người sáng lập kiêm Giám đốc điều hành Alexandr Wang mô tả sản phẩm mới của mình là một phương pháp tiếp cận dữ liệu kết hợp, tương tự như thịt nuôi trong phòng thí nghiệm.

Ông nói với TechCrunch: “Chúng tôi bắt đầu với dữ liệu thực, giống như cách thịt được nuôi trong phòng thí nghiệm bắt đầu từ tế bào động vật thực, sau đó phát triển, lặp lại và xây dựng sản phẩm từ đó. Bằng cách sử dụng dữ liệu trong thế giới thực làm cơ sở để tạo ra dữ liệu tổng hợp, công ty có thể cung cấp một ưu đãi thực sự độc đáo và mạnh mẽ cho khách hàng, Wang nói và nói thêm rằng đây là một lỗ hổng mà họ đã nhìn thấy trên thị trường.

Quy mô khách hàng cũng nhìn thấy khoảng cách đó. Wang nói với TechCrunch, việc công ty đẩy mạnh dữ liệu tổng hợp là để đáp ứng nhu cầu của khách hàng. Nhà phát triển công nghệ xe tự hành Kodiak Robotics, Tractable AI và Bộ Quốc phòng Hoa Kỳ đều đã khai thác Quy mô cho sản phẩm dữ liệu tổng hợp mới của mình, Wang cho biết.

Quy mô, ngày nay sử dụng khoảng 450 nhân viên, xem dữ liệu tổng hợp là ưu tiên hàng đầu vào năm 2022 và là lĩnh vực mà họ sẽ tiếp tục đầu tư khi phát triển dòng sản phẩm của mình. Nhưng điều đó không có nghĩa là nó sẽ tiếp quản công việc kinh doanh dữ liệu thực của mình. Wang coi dữ liệu tổng hợp là một công cụ bổ sung sẽ giúp các nhà phát triển “kiếm được nhiều tiền hơn từ các thuật toán của họ và các AI khác, đặc biệt là với các trường hợp tiên tiến.

Ví dụ, các công ty xe tự hành thường sử dụng mô phỏng để tạo lại các tình huống từ thế giới thực và phát lại để xem hệ thống tự hành sẽ xử lý nó như thế nào. Nhưng dữ liệu trong thế giới thực có thể không cung cấp kịch bản mà họ đang tìm kiếm.

Wang giải thích: “Bạn không thường xuyên gặp phải các tình huống trong thế giới thực ở nơi có thể có 100 người đi xe đạp băng qua cùng một lúc. “Chúng tôi có thể bắt đầu từ dữ liệu trong thế giới thực và sau đó thêm tổng hợp tất cả những người đi xe đạp hoặc tất cả mọi người và theo cách đó, bạn có thể đào tạo thuật toán đúng cách.”

Nguồn: https://techcrunch.com/2022/02/02/scale-ai-gets-into-the-synthetic-data-game/

Dấu thời gian:

Thêm từ Techcrunch