AI Weekly : AlphaCode de DeepMind, vérification automatique de l'âge et nouveau modèle de langage ouvert

Nœud source: 1601380

Rejoignez les principaux dirigeants d'aujourd'hui en ligne lors du Data Summit le 9 mars. S'inscrire ici.


Cette semaine dans AI, DeepMind a détaillé un nouveau système de génération de code, code alpha, qui, selon elle, est en concurrence avec les meilleurs programmeurs humains. Les chaînes de supermarchés du Royaume-Uni ont annoncé qu'elles commenceraient à tester des systèmes de vérification automatique de l'âge pour estimer l'âge des clients lors de l'achat d'alcool. Et EleutherAI, un groupe de recherche axé sur l'open source des systèmes d'IA hautement performants, a publié GPT-NeoX-20B, un modèle de langage parmi les plus importants du genre.

AlphaCode est l'un des exemples les plus sophistiqués de programmation de machines ou d'outils qui automatisent les processus de développement et de maintenance de logiciels. DeepMind affirme qu'il peut écrire du code "au niveau de la compétition", obtenant un classement moyen parmi les 54.3 % les plus performants sur 10 concours récents sur la plate-forme de défi de programmation Codeforces.

Les applications de la programmation machine sont vastes, ce qui explique pourquoi il y a de l'enthousiasme autour d'elle. Selon une étude de l'Université de Cambridge, au moins la moitié des efforts des développeurs sont consacrés au débogage, ce qui coûte à l'industrie du logiciel environ 312 milliards de dollars par an. Même la migration d'une base de code vers un langage plus efficace peut commander une somme princière. Par exemple, la Commonwealth Bank of Australia dépensé environ 750 millions de dollars sur cinq ans pour convertir sa plate-forme de COBOL à Java.

Les outils de génération de code basés sur l'IA comme AlphaCode promettent de réduire les coûts de développement tout en permettant aux codeurs de se concentrer sur des tâches créatives et moins répétitives. Mais AlphaCode n'est pas parfait. en plus d'être cher à maintenir, il ne produit pas toujours un code correct et pourrait - si des systèmes similaires sont une indication - contenir des problèmes biais. De plus, s'il est rendu public, des acteurs malveillants pourraient l'utiliser à mauvais escient pour créer des logiciels malveillants, contourner tests de programmation, et tromper chercheurs en cybersécurité.

"[B]ien que l'idée de donner le pouvoir de programmer à des personnes qui ne savent pas programmer soit passionnante, nous avons beaucoup de problèmes à résoudre avant d'en arriver là", a déclaré Mike Cook, chercheur en IA à l'Université Queen Mary de Londres.

Vérification automatique de l'âge

Trois chaînes de supermarchés au Royaume-Uni – Asada, Co-op et Morrisons – utilisent des caméras pour estimer l'âge des clients dans le cadre d'un test effectué par le Home Office, le département britannique responsable de l'immigration, de la sécurité et de la loi et de l'ordre. La technologie, qui était déjà utilisée dans l'emplacement sans caisse d'Aldi à Londres, devine l'âge des clients qui consentent à l'aide d'algorithmes formés sur "une base de données de visages anonymes". selon à la BBC. S'il décide qu'ils ont moins de 25 ans, ils devront présenter une pièce d'identité à un membre du personnel.

Yoti - la société qui fournit la technologie - affirme qu'elle a été testée sur plus de 125,000 2.2 visages et qu'elle a estimé son âge à moins de XNUMX ans. Mais alors que Yoti dit qu'il n'effectue pas de reconnaissance faciale ou ne conserve pas les images prises, le système soulève des préoccupations éthiques.

Les systèmes d'estimation de l'âge, comme les autres systèmes d'IA, pourraient amplifier tout biais dans les données utilisées pour développer les systèmes. Une étude met en évidence l'effet du maquillage, qui peut couvrir les signes de l'âge comme les taches de vieillesse et les rides, et constate que les logiciels d'estimation de l'âge ont tendance à être plus précis pour les hommes. La même recherche a révélé que le logiciel surestime l'âge des jeunes non-caucasiens et sous-estime l'âge des personnes âgées asiatiques et noires, et peut même être influencé par le fait que quelqu'un sourit ou non.

Dans une interview avec Wired, le cofondateur et PDG de Yoti, Robin Tombs, a admis que la société n'était pas sûre des traits du visage que son IA utilise pour déterminer l'âge des gens. Bien qu'il ait souligné que l'ensemble de données de formation de Yoti composé de "centaines de milliers" de visages était "représentatif à travers les tons de peau, les âges et le sexe" et que ses recherches internes ont montré des taux d'erreur similaires à travers les données démographiques, le littérature académique semblerait suggérer le contraire. Le propre livre blanc de Yoti montre que la technologie est la moins précise pour les femmes âgées à la peau plus foncée.

Une mauvaise estimation de l'âge au supermarché pourrait n'être rien de plus qu'un inconvénient (et peut-être de l'embarras). Mais cela pourrait normaliser la technologie, conduisant à des applications plus problématiques ailleurs. Daniel Leufer, un analyste des politiques européennes spécialisé dans l'IA au sein du groupe des libertés civiles Access Now, a déclaré à Wired que les régulateurs devraient examiner qui ces systèmes échoueraient probablement lorsqu'ils envisagent les cas d'utilisation. "Généralement, cette réponse est celle des personnes qui sont régulièrement rejetées par d'autres systèmes", a-t-il déclaré.

Modèle de langage open source

EleutherAI mercredi libéré son nouveau modèle de langage, GPT-NeoX-20B, dans le cadre de sa mission d'élargir l'accès à une IA génératrice de texte hautement performante. Disponible dès maintenant via une API et la semaine prochaine en open source, GPT-NeoX-20B surpasse les autres modèles de langage public dans plusieurs domaines tout en étant généralement moins cher à déployer, selon EleutherAI.

GPT-NeoX-20B - qui a été développé sur une infrastructure fournie par CoreWeave, un fournisseur de cloud spécialisé - a été formé sur l'ensemble de données textuelles de 825 Go d'EleutherAI et contient 20 milliards de paramètres, soit environ 9 fois moins que le GPT-3 d'OpenAI. Dans l'apprentissage automatique, les paramètres sont la partie du modèle qui est apprise à partir des données d'entraînement historiques. D'une manière générale, dans le domaine du langage, la corrélation entre le nombre de paramètres et la sophistication a remarquablement bien résisté.

EleutherAI ne prétend pas que GPT-NeoX-20B résout l'un des problèmes majeurs qui affligent les modèles de langage actuels, y compris des aspects tels que les biais et la toxicité. Mais le groupe soutient que les avantages de la publication du modèle - et d'autres similaires - l'emportent sur les risques. Les modèles de langage peuvent coûter jusqu'à des millions de dollars pour s'entraîner à partir de zéro, et l'inférence - (c'est-à-dire, exécuter réellement le modèle formé) est un autre obstacle. Une estimation fixe le coût d'exécution de GPT-3 sur une seule instance Amazon Web Services à un minimum de 87,000 XNUMX $ par an.

"Du spam et de l'astroturfing à la dépendance aux chatbots, l'utilisation de ces modèles peut déjà manifester des dommages évidents dès aujourd'hui, et nous nous attendons à ce que l'alignement des futurs modèles soit d'une importance cruciale. Nous pensons que l'accélération de la recherche sur la sécurité est extrêmement importante », a déclaré le cofondateur d'EleutherAI, Connor Leahy, dans un communiqué.

Les modèles précédents d'EleutherAI ont déjà engendré de toutes nouvelles startups AI-as-a-service. Si l'histoire est une indication, GPT-NeoX-20B fera de même.

Pour la couverture de l'IA, envoyez des conseils d'actualités à Kyle Wiggers - et assurez-vous de vous abonner au Bulletin hebdomadaire AI et ajoutez notre chaîne IA à vos favoris, La Machine.

Merci pour la lecture,

Kyle Wiggers

Rédacteur principal de l'IA

La mission de VentureBeat est d'être une place publique numérique permettant aux décideurs techniques d'acquérir des connaissances sur la technologie d'entreprise transformatrice et d'effectuer des transactions. En savoir plus

Source : https://venturebeat.com/2022/02/04/ai-weekly-deepminds-alphacode-automatic-age-verification-and-a-new-open-language-model/

Horodatage:

Plus de AI - VentureBeat