Брюс Воррінгтон через Unsplash
Причина, чому моделі машинного навчання загалом стають розумнішими, полягає в їх залежності від використання мічених даних, які допомагають їм розрізняти два схожі об’єкти.
Однак без цих позначених наборів даних ви зіткнетеся з серйозними перешкодами під час створення найефективнішої та надійної моделі машинного навчання. Позначені набори даних на етапі навчання моделі важливі.
Глибоке навчання широко використовується для вирішення таких завдань, як комп’ютерне бачення, за допомогою навчання під наглядом. Однак, як і багато в чому в житті, тут є обмеження. Контрольована класифікація вимагає великої кількості та якості маркованих навчальних даних для створення надійної моделі. Це означає, що модель класифікації не може обробляти невидимі класи.
І всі ми знаємо, скільки обчислювальної потужності, перенавчання, часу та грошей потрібно для навчання моделі глибокого навчання.
Але чи все-таки модель може розрізняти два об’єкти без використання навчальних даних? Так, це називається нульовим навчанням. Безпосереднє навчання — це здатність моделі виконувати завдання без отримання або використання будь-яких навчальних прикладів.
Люди від природи здатні навчатися без особливих зусиль. Наш мозок уже зберігає словники та дозволяє нам розрізняти об’єкти, дивлячись на їхні фізичні властивості завдяки нашій поточній базі знань. Ми можемо використовувати цю базу знань, щоб побачити подібності та відмінності між об’єктами та знайти зв’язок між ними.
Наприклад, скажімо, ми намагаємося побудувати модель класифікації видів тварин. Відповідно до OurWorldInData, у 2.13 році було підраховано 2021 мільйона видів. Тому, якщо ми хочемо створити найефективнішу модель класифікації видів тварин, нам знадобиться 2.13 мільйона різних класів. Також буде потрібно багато даних. Важко знайти дані великої кількості та якості.
Отже, як нульове навчання вирішує цю проблему?
Оскільки нульове навчання не вимагає, щоб модель вивчала навчальні дані та те, як класифікувати класи, це дозволяє нам менше покладатися на потребу моделі в позначених даних.
Нижче наведено те, з чого повинні складатися ваші дані, щоб продовжити безпосереднє навчання.
Переглянуті класи
Він складається з класів даних, які раніше використовувалися для навчання моделі.
Невидимі класи
Він складається з класів даних, які НЕ використовувалися для навчання моделі, і нова модель навчання з нульовим випадком буде узагальнюватися.
Допоміжна інформація
Оскільки дані в невидимих класах не позначені, для нульового навчання знадобиться допоміжна інформація для навчання та пошуку кореляцій, зв’язків і властивостей. Це може бути у формі вбудованих слів, описів і семантичної інформації.
Методи нульового навчання
Навчання з нульовим ударом зазвичай використовується в:
- Методи на основі класифікатора
- Методи на основі екземплярів
стажування
Zero-shot training використовується для побудови моделей для класів, які не навчаються з використанням мічених даних, тому вимагає цих двох етапів:
1. Навчання
Етап навчання – це процес навчання, який намагається отримати якомога більше знань про якість даних. Ми можемо розглядати це як етап навчання.
2. Умовивід
Під час етапу логічного висновку всі знання, отримані на етапі навчання, застосовуються та використовуються для класифікації прикладів у новий набір класів. Ми можемо розглядати це як фазу прогнозування.
Як це працює?
Знання з видимих класів будуть передані в невидимі класи у високовимірному векторному просторі; це називається семантичним простором. Наприклад, у класифікації зображень семантичний простір разом із зображенням проходитиме два етапи:
1. Спільний закладний простір
Сюди проектуються семантичні вектори та вектори візуальних ознак.
2. Найвища схожість
Тут функції зіставляються з функціями невидимого класу.
Щоб допомогти зрозуміти процес із двома етапами (навчання та висновки), давайте застосуємо їх до використання класифікації зображень.
Навчання
Ярі Гітонен через Unsplash
Як людина, якби ви прочитали текст праворуч на зображенні вище, ви б миттєво припустили, що в коричневому кошику є 4 кошеняти. Але припустімо, ви не маєте уявлення про те, що таке «кошеня». Ви припустите, що є коричневий кошик із 4 речами всередині, які називаються «кошенята». Коли ви натрапите на більше зображень, які містять щось схоже на «кошеня», ви зможете відрізнити «кошеня» від інших тварин.
Це те, що відбувається, коли ви використовуєте Попередня підготовка контрастного мовного образу (CLIP) від OpenAI для нульового навчання класифікації зображень. Вона відома як допоміжна інформація.
Ви можете подумати: «це просто позначені дані». Я розумію, чому ви так думаєте, але це не так. Допоміжна інформація не є мітками даних, це форма спостереження, яка допомагає моделі навчатися на етапі навчання.
Коли навчальна модель нульового удару бачить достатню кількість пар зображення та тексту, вона зможе диференціювати та розуміти фрази та те, як вони співвідносяться з певними шаблонами на зображеннях. Використовуючи техніку «контрастного навчання» CLIP, модель нульового навчання змогла накопичити хорошу базу знань, щоб мати можливість робити прогнози щодо завдань класифікації.
Це стислий виклад підходу CLIP, коли вони разом навчають кодувальник зображень і кодувальник тексту, щоб передбачити правильні пари для групи прикладів навчання (зображення, текст). Перегляньте зображення нижче:
Вивчення переносних візуальних моделей із нагляду за природною мовою
Висновок
Після того, як модель пройшла стадію навчання, вона має хорошу базу знань про поєднання зображень і тексту, і тепер її можна використовувати для прогнозування. Але перш ніж ми зможемо відразу приступити до прогнозування, нам потрібно налаштувати завдання класифікації, створивши список усіх можливих міток, які може вивести модель.
Наприклад, дотримуючись завдання класифікації зображень видів тварин, нам знадобиться список усіх видів тварин. Кожна з цих міток буде закодована, T? до Т? за допомогою попередньо навченого текстового кодувальника, який стався на етапі навчання.
Після кодування міток ми можемо вводити зображення через попередньо навчений кодувальник зображень. Ми будемо використовувати метричну косинусну подібність відстані, щоб обчислити подібність між кодуванням зображення та кодуванням кожної текстової мітки.
Класифікація зображення здійснюється на основі мітки з найбільшою схожістю із зображенням. І саме так досягається нульове навчання, зокрема в класифікації зображень.
Дефіцит даних
Як згадувалося раніше, отримати дані великої кількості та якості важко. На відміну від людей, які вже володіють здатністю до нульового навчання, машинам потрібні вхідні дані з мітками, щоб навчатися, а потім мати можливість адаптуватися до відхилень, які можуть виникнути природним чином.
Якщо ми подивимося на приклад видів тварин, то їх було дуже багато. І оскільки кількість категорій продовжує зростати в різних доменах, потрібно буде багато працювати, щоб не відставати від збору анотованих даних.
Завдяки цьому нульове навчання стало для нас більш цінним. Все більше і більше дослідників зацікавлені в автоматичному розпізнаванні атрибутів, щоб компенсувати брак доступних даних.
Маркування даних
Ще однією перевагою нульового навчання є його властивості маркування даних. Позначення даних може бути трудомістким і дуже виснажливим, і через це може призвести до помилок під час процесу. Для маркування даних потрібні експерти, наприклад медичні працівники, які працюють над набором біомедичних даних, що є дуже дорогим і трудомістким.
Навчання з нульовим ударом стає все більш популярним через зазначені вище обмеження даних. Є кілька документів, які я б рекомендував вам прочитати, якщо ви зацікавлені в його здібностях:
Ніша Арья є дослідником даних і позаштатним технічним автором. Вона особливо зацікавлена в наданні порад щодо кар'єри в галузі Data Science або підручників та теоретичних знань із Data Science. Вона також хоче дослідити різні способи, якими штучний інтелект є/може сприяти довговічності людського життя. Захоплено навчається, прагне розширити свої технічні знання та навички письма, водночас допомагаючи орієнтувати інших.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- Платоблокчейн. Web3 Metaverse Intelligence. Розширені знання. Доступ тут.
- джерело: https://www.kdnuggets.com/2022/12/zeroshot-learning-explained.html?utm_source=rss&utm_medium=rss&utm_campaign=zero-shot-learning-explained
- 2021
- a
- здібності
- здатність
- Здатний
- МЕНЮ
- вище
- За
- Накопичуватися
- досягнутий
- через
- пристосовувати
- рада
- проти
- ВСІ
- дозволяє
- вже
- кількість
- та
- тварина
- тварини
- прикладної
- Застосовувати
- підхід
- навколо
- штучний
- штучний інтелект
- автоматичний
- доступний
- база
- заснований
- кошик
- ставати
- становлення
- перед тим
- буття
- нижче
- користь
- між
- біомедичні
- розширити
- будувати
- розрахований
- званий
- Може отримати
- не може
- здатний
- захоплення
- кар'єра
- категорії
- певний
- клас
- класів
- класифікація
- Класифікувати
- Збір
- Приходити
- повний
- обчислювальна потужність
- обчислення
- комп'ютер
- Комп'ютерне бачення
- триває
- може
- створювати
- створення
- Поточний
- дані
- наука про дані
- вчений даних
- набори даних
- глибокий
- глибоке навчання
- Залежність
- Відмінності
- різний
- диференціювати
- відстань
- домени
- під час
- кожен
- Ефективний
- зусилля
- помилки
- приклад
- Приклади
- дорогий
- experts
- пояснені
- дослідити
- особливість
- риси
- кілька
- знайти
- після
- форма
- позаштатний
- від
- Загальне
- отримати
- добре
- найбільший
- Рости
- керівництво
- обробляти
- Руки
- відбувається
- Жорсткий
- має
- допомога
- допомогу
- Високий
- найвищий
- дуже
- Як
- How To
- Однак
- HTTPS
- людина
- Людей
- ідея
- зображення
- Класифікація зображень
- зображень
- важливо
- in
- інформація
- вхід
- Інтелект
- зацікавлений
- IT
- Кін
- тримати
- Знати
- знання
- відомий
- етикетка
- маркування
- етикетки
- відсутність
- мова
- вести
- УЧИТЬСЯ
- вчений
- вивчення
- життя
- недоліки
- LINK
- зв'язку
- список
- довговічність
- подивитися
- шукати
- ВИГЛЯДИ
- серія
- машина
- навчання за допомогою машини
- Машинки для перманенту
- основний
- зробити
- Робить
- багато
- засоби
- медичний
- згаданий
- метод
- методика
- метрика
- може бути
- мільйона
- модель
- Моделі
- гроші
- більше
- найбільш
- Природний
- Необхідність
- Нові
- номер
- об'єкти
- перешкодами
- сталося
- ONE
- OpenAI
- порядок
- Інше
- інші
- спаровування
- спаровування
- документи
- особливо
- моделі
- фаза
- фрази
- фізичний
- plato
- Інформація про дані Платона
- PlatoData
- будь ласка
- популярний
- це можливо
- влада
- передбачати
- Прогнози
- раніше
- Проблема
- процес
- виробляти
- професіонали
- прогнозовані
- властивості
- забезпечення
- put
- якості
- якість
- кількість
- Читати
- причина
- отримано
- визнання
- рекомендувати
- вимагати
- Вимагається
- Дослідники
- Обмеження
- міцний
- наука
- вчений
- пошук
- бачить
- комплект
- аналогічний
- схожість
- навички
- розумнішими
- So
- ВИРІШИТИ
- що в сім'ї щось
- Простір
- конкретно
- Стажування
- етапи
- заходи
- прилипання
- Як і раніше
- зберігати
- такі
- достатній
- РЕЗЮМЕ
- нагляд
- Приймати
- приймає
- Завдання
- завдання
- технології
- технічний
- Команда
- їх
- отже
- речі
- Мислення
- через
- час
- трудомісткий
- до
- разом
- поїзд
- Навчання
- передані
- заслуговуючий довіри
- навчальні посібники
- типово
- розуміти
- us
- використання
- використовувати
- Цінний
- через
- вид
- бачення
- способи
- Що
- який
- У той час як
- ВООЗ
- широко
- волі
- без
- слово
- Work
- робочий
- б
- письменник
- лист
- вашу
- зефірнет
- Zero-Shot Навчання