Обучение с нулевым выстрелом, объяснение

Переиздано Платоном

Читают: 0

Обучение с нулевым выстрелом, объяснение
Брюс Уоррингтон через Unsplash

Причина, по которой модели машинного обучения в целом становятся умнее, заключается в их зависимости от использования помеченных данных, которые помогают им различать два похожих объекта.

Однако без этих помеченных наборов данных вы столкнетесь с серьезными препятствиями при создании наиболее эффективной и надежной модели машинного обучения. Помеченные наборы данных на этапе обучения модели важны.

Глубокое обучение широко используется для решения таких задач, как компьютерное зрение с использованием обучения с учителем. Однако, как и во многих других вещах в жизни, здесь есть ограничения. Классификация с учителем требует большого количества и качества помеченных обучающих данных для создания надежной модели. Это означает, что модель классификации не может обрабатывать невидимые классы.

И все мы знаем, сколько вычислительной мощности, переобучения, времени и денег требуется для обучения модели глубокого обучения.

Но может ли модель различать два объекта без использования обучающих данных? Да, это называется обучением с нуля. Обучение с нулевым выстрелом — это способность модели выполнять задачу, не получая и не используя какие-либо обучающие примеры.

Люди естественным образом способны к обучению с нуля, не прилагая особых усилий. Наш мозг уже хранит словари и позволяет нам различать объекты, глядя на их физические свойства, благодаря нашей текущей базе знаний. Мы можем использовать эту базу знаний, чтобы увидеть сходства и различия между объектами и найти связь между ними.

Например, предположим, что мы пытаемся построить модель классификации видов животных. Согласно с НашМирИнДанные, в 2.13 году было рассчитано 2021 миллиона видов. Следовательно, если мы хотим создать наиболее эффективную модель классификации видов животных, нам потребуется 2.13 миллиона различных классов. Также понадобится много данных. Трудно найти большое количество и качественные данные.

Так как же обучение с нулевым выстрелом решает эту проблему?

Поскольку обучение с нулевым выстрелом не требует, чтобы модель изучила обучающие данные и как классифицировать классы, это позволяет нам меньше полагаться на потребность модели в помеченных данных.

Ниже показано, из чего должны состоять ваши данные, чтобы продолжить обучение с нуля.

Просмотренные классы

Он состоит из классов данных, которые ранее использовались для обучения модели.

Невидимые классы

Он состоит из классов данных, которые НЕ использовались для обучения модели, и новая модель обучения с нулевым выстрелом будет обобщаться.

Вспомогательная информация

Поскольку данные в невидимых классах не помечены, для обучения с нулевым выстрелом потребуется дополнительная информация для обучения и поиска корреляций, связей и свойств. Это может быть в форме встраивания слов, описаний и семантической информации.

Методы обучения с нулевым выстрелом

Обучение с нулевым выстрелом обычно используется в:

Методы на основе классификатора
Методы на основе экземпляра

Стажировки

Обучение с нулевым выстрелом используется для построения моделей для классов, которые не обучаются с использованием помеченных данных, поэтому для него требуются следующие два этапа:

1. Обучение

Стадия обучения — это процесс метода обучения, который пытается получить как можно больше знаний о качествах данных. Мы можем рассматривать это как этап обучения.

2. Вывод

На этапе вывода все полученные знания на этапе обучения применяются и используются для классификации примеров в новый набор классов. Мы можем рассматривать это как фазу прогнозирования.

Как это работает?

Знания из видимых классов будут переданы невидимым классам в многомерном векторном пространстве; это называется семантическим пространством. Например, при классификации изображений семантическое пространство вместе с изображением пройдет два этапа:

1. Совместное пространство для заделки

Именно сюда проецируются семантические векторы и векторы визуального признака.

2. Максимальное сходство

Здесь функции сопоставляются с функциями невидимого класса.

Чтобы помочь понять процесс с двумя этапами (обучение и вывод), давайте применим их при использовании классификации изображений.

Обучение

Обучение с нулевым выстрелом, объяснение
Яри Хитонен через Unsplash

Как человек, если бы вы прочитали текст справа на изображении выше, вы бы сразу предположили, что в коричневой корзине 4 котенка. Но допустим, вы понятия не имеете, что такое «котенок». Предположим, что есть коричневая корзина с 4 вещами внутри, которые называются «котятами». Как только вы встретите больше изображений, содержащих что-то похожее на «котенка», вы сможете отличить «котенка» от других животных.

Вот что происходит, когда вы используете Предварительное обучение контрастному языку-образу (CLIP) от OpenAI для обучения с нуля при классификации изображений. Это так называемая вспомогательная информация.

Вы можете подумать: «Ну, это просто помеченные данные». Я понимаю, почему вы так думаете, но это не так. Вспомогательная информация — это не метки данных, а форма наблюдения, помогающая модели учиться на этапе обучения.

Когда модель обучения с нулевым выстрелом увидит достаточное количество пар изображение-текст, она сможет различать и понимать фразы и то, как они соотносятся с определенными шаблонами на изображениях. Используя метод «контрастного обучения» CLIP, модель обучения с нулевым выстрелом смогла накопить хорошую базу знаний, чтобы иметь возможность делать прогнозы по задачам классификации.

Это краткое изложение подхода CLIP, в котором они обучают кодировщик изображения и кодировщик текста вместе, чтобы предсказать правильные пары пакета обучающих примеров (изображение, текст). Пожалуйста, посмотрите на изображение ниже:

Обучение с нулевым выстрелом, объяснение
Изучение переносимых визуальных моделей из наблюдения за естественным языком

вывод

После того, как модель прошла стадию обучения, она имеет хорошую базу знаний о сопряжении изображения и текста и теперь может использоваться для прогнозирования. Но прежде чем мы сможем приступить к прогнозированию, нам нужно настроить задачу классификации, создав список всех возможных меток, которые может вывести модель.

Например, придерживаясь задачи классификации изображений по видам животных, нам понадобится список всех видов животных. Каждая из этих меток будет закодирована, T? к Т? с использованием предварительно обученного кодировщика текста, который возник на этапе обучения.

После того, как метки закодированы, мы можем вводить изображения через предварительно обученный кодировщик изображений. Мы будем использовать косинусное сходство метрики расстояния, чтобы вычислить сходство между кодировкой изображения и каждой кодировкой текстовой метки.

Классификация изображения производится на основе метки с наибольшим сходством с изображением. И именно так достигается обучение с нулевым выстрелом, особенно в классификации изображений.

Нехватка данных

Как упоминалось ранее, трудно получить большое количество и качественные данные. В отличие от людей, которые уже обладают способностью к обучению с нуля, машинам требуются входные помеченные данные для обучения, а затем они могут адаптироваться к отклонениям, которые могут возникнуть естественным образом.

Если мы посмотрим на пример с видами животных, их было очень много. И поскольку количество категорий продолжает расти в различных областях, потребуется много работы, чтобы не отставать от сбора аннотированных данных.

Из-за этого обучение с нуля стало для нас более ценным. Все больше и больше исследователей интересуются автоматическим распознаванием атрибутов, чтобы компенсировать недостаток доступных данных.

Маркировка данных

Еще одним преимуществом обучения с нулевым выстрелом являются его свойства маркировки данных. Разметка данных может быть трудоемкой и очень утомительной, и из-за этого может привести к ошибкам в процессе. Для маркировки данных требуются эксперты, например медицинские работники, которые работают с набором биомедицинских данных, что требует больших затрат и времени.

Обучение с нулевым выстрелом становится все более популярным из-за вышеупомянутых ограничений данных. Есть несколько статей, которые я бы порекомендовал вам прочитать, если вы заинтересованы в его возможностях:

Ниша Арья является специалистом по данным и внештатным техническим писателем. Она особенно заинтересована в предоставлении карьерных советов или учебных пособий по науке о данных, а также теоретических знаний по науке о данных. Она также хочет изучить различные способы, которыми искусственный интеллект может способствовать долголетию человеческой жизни. Страстная ученица, стремящаяся расширить свои технические знания и навыки письма, одновременно помогая другим.