Лучшие статьи по машинному обучению для чтения в 2023 году

Переиздано Платоном

Читают: 0

Лучшие статьи по машинному обучению для чтения в 2023 году
Изображение на pc.vector on Freepik

Машинное обучение — это большая область, в которой часто появляются новые исследования. Это горячая область, где научные круги и промышленность продолжают экспериментировать с новыми вещами, чтобы улучшить нашу повседневную жизнь.

В последние годы генеративный ИИ меняет мир благодаря применению машинного обучения. Например, ChatGPT и Stable Diffusion. Даже с учетом того, что в 2023 году доминирует генеративный ИИ, мы должны знать о многих других прорывах в области машинного обучения.

Вот лучшие статьи по машинному обучению, которые стоит прочитать в 2023 году, чтобы вы не пропустили грядущие тенденции.

1) Изучение красоты в песнях: Улучшение голоса нейронного пения

Улучшение певческого голоса (SVB) — это новая задача в области генеративного ИИ, цель которой — превратить любительский певческий голос в красивый. Это как раз и есть цель исследования Liu et al. (2022) когда они предложили новую генеративную модель под названием Neural Singing Voice Beautifier (NSVB).

NSVB — это полуконтролируемая модель обучения, использующая алгоритм скрытого отображения, который действует как корректор высоты тона и улучшает тон голоса. Работа обещает улучшить музыкальную индустрию, и ее стоит проверить.

2) Символическое открытие алгоритмов оптимизации

Модели глубоких нейронных сетей стали больше, чем когда-либо, и было проведено много исследований, чтобы упростить процесс обучения. Недавнее исследование, проведенное командой Google (Чен и др. (2023)) предложил новую оптимизацию для нейронной сети под названием Lion (EvoLved Sign Momentum). Метод показывает, что алгоритм более эффективно использует память и требует меньшей скорости обучения, чем Адам. Это отличное исследование, которое показывает много обещаний, которые вы не должны пропустить.

3) TimesNet: Моделирование временных 2D-вариаций для общего анализа временных рядов

Анализ временных рядов является распространенным вариантом использования во многих компаниях; Например, прогнозирование цен, обнаружение аномалий и т. д. Однако существует множество проблем с анализом временных данных только на основе текущих данных (одномерных данных). Поэтому Ву и др. (2023) предложить новый метод под названием TimesNet для преобразования данных 1D в данные 2D, который обеспечивает высокую производительность в эксперименте. Вам следует прочитать статью, чтобы лучше понять этот новый метод, так как он поможет в анализе временных рядов в будущем.

4) OPT: открытые предварительно обученные языковые модели Transformer

В настоящее время мы живем в эпоху генеративного ИИ, когда многие крупные языковые модели интенсивно разрабатывались компаниями. В основном такого рода исследования не выпускали свою модель или были только коммерчески доступными. Однако исследовательская группа Meta AI (Zhang et al. (2022)) пытается сделать обратное, публично выпустив модель Open Pre-trained Transformers (OPT), которая может быть сопоставима с GPT-3. Документ является отличным началом для понимания модели OPT и деталей исследования, поскольку группа записывает все детали в документ.

5) REaLTabFormer: создание реалистичных реляционных и табличных данных с использованием преобразователей

Генеративная модель не ограничивается только генерацией текста или изображений, но также и табличных данных. Эти сгенерированные данные часто называют синтетическими данными. Было разработано много моделей для создания синтетических табличных данных, но почти не было моделей для создания реляционных табличных синтетических данных. Это как раз и есть цель Солаторио и Дюприез (2023) исследовать; создание модели под названием REaLTabFormer для синтетических реляционных данных. Эксперимент показал, что результат точно близок к существующей синтетической модели, которую можно расширить для многих приложений.

6) Является ли обучение с подкреплением (не) для обработки естественного языка?: контрольные показатели, базовые показатели и строительные блоки для оптимизации политики естественного языка

Концептуально обучение с подкреплением — отличный выбор для задачи обработки естественного языка, но так ли это? Это вопрос, который Рамамурти и др. (2022) попробуй ответить. Исследователь представляет различные библиотеки и алгоритмы, которые показывают, где методы обучения с подкреплением имеют преимущество по сравнению с контролируемым методом в задачах НЛП. Это рекомендуемая статья для чтения, если вам нужна альтернатива для вашего набора навыков.

7) Tune-A-Video: однократная настройка моделей распространения изображений для преобразования текста в видео

Генерация текста в изображение была большой в 2022 году, а в 2023 году прогнозируется возможность преобразования текста в видео (T2V). Исследования Ву и др. (2022) показывает, как T2V может быть расширен во многих подходах. В исследовании предлагается новый метод Tune-a-Video, который поддерживает задачи T2V, такие как изменение субъекта и объекта, передача стиля, редактирование атрибутов и т. д. Это отличная статья для чтения, если вы заинтересованы в исследовании преобразования текста в видео.

8) PyGlove: эффективный обмен идеями машинного обучения в виде кода

Эффективное сотрудничество является ключом к успеху в любой команде, особенно в условиях растущей сложности областей машинного обучения. Воспитывать эффективность, Пэн и др. (2023) представить библиотеку PyGlove, чтобы легко делиться идеями машинного обучения. Концепция PyGlove заключается в том, чтобы зафиксировать процесс исследования машинного обучения с помощью списка правил исправления. Затем этот список можно повторно использовать в любой сцене экспериментов, что повышает эффективность команды. Это исследование, которое пытается решить проблему машинного обучения, которую многие еще не сделали, поэтому ее стоит прочитать.

8) Насколько близок ChatGPT к экспертам-людям? Корпус сравнения, оценка и обнаружение

ChatGPT так сильно изменил мир. Можно с уверенностью сказать, что отсюда тенденция пойдет вверх, поскольку общественность уже выступает за использование ChatGPT. Однако как текущий результат ChatGPT сравнивается с результатами Human Experts? Это именно тот вопрос, который Guo et al. (2023) попробуй ответить. Команда попыталась собрать данные от экспертов и подсказать результаты ChatGPT, которые они сравнили. Результат показывает, что неявные различия между ChatGPT и экспертами были. Я чувствую, что это исследование будет востребовано в будущем, поскольку модель генеративного ИИ будет расти с течением времени, поэтому его стоит прочитать.

2023 год — отличный год для исследований в области машинного обучения, о чем свидетельствует текущая тенденция, особенно генеративный ИИ, такой как ChatGPT и Stable Diffusion. Есть много многообещающих исследований, которые, я думаю, мы не должны пропустить, потому что они показали многообещающие результаты, которые могут изменить текущий стандарт. В этой статье я показал вам 9 лучших статей по машинному обучению для чтения, начиная от генеративной модели, модели временных рядов и заканчивая эффективностью рабочего процесса. Я надеюсь, что это помогает.

Корнелиус Юдха Виджая является помощником менеджера по науке о данных и автором данных. Работая полный рабочий день в Allianz Indonesia, он любит делиться советами по Python и данным в социальных сетях и в печатных СМИ.