Июнь 2022
By Джеймс Нёртон, внештатный писатель
Как включить сложные искусственный интеллект (AI) при соблюдении конфиденциальности и защите интеллектуальной собственности активов данных? Стартап из Берлина считает, что федеративное обучение дает ответ.
В своем вступительном слове на четвертой сессии беседы ВОИС об ИС и передовых технологиях в сентябре 2021 г. (см. Данные: топливо, преобразующее мировую экономику), Генеральный директор ВОИС Дарен Танг назвал данные «топливом», обеспечивающим цифровизацию. Алгоритмы машинного обучения требуют больших объемов данных для обучения, но что происходит, когда поток топлива прерывается, другими словами, когда данные не могут быть переданы по причинам конфиденциальности, безопасности или интеллектуальная собственность (IP) защита?
Одно из решений этой проблемы известно как федеративное обучение, при котором данные никогда не выходят из-под контроля владельца данных. Скорее, алгоритмы машинного обучения обучаются на данных локально, без их совместного использования. В простом примере конфиденциальные данные, такие как истории болезни пациентов из больницы, могут использоваться фармацевтической компанией при разработке нового лекарства, при этом больница не обязана раскрывать какие-либо данные. В более сложных случаях данные из нескольких источников могут использоваться для обучения одного и того же алгоритма, что дает преимущества как в объеме, так и в разнообразии.
Федеративное обучение требует, чтобы доверенная третья сторона объединила алгоритм и владельцев данных. Берлинский стартап Apheris, запущенный в 2019 году, является одной из таких компаний. В Apheris работает команда из примерно 20 разработчиков, экспертов по конфиденциальности и специалистов по данным, которые обеспечивают безопасную платформу для безопасного обмена данными. Глава юридического отдела Люси Арнц недавно говорила с Журнал ВОИС о бизнес-модели компании, защите данных и безопасности.
Преимущества федеративного обучения
Г-жа Арнц присоединилась к Apheris летом 2020 года, став первым сотрудником, не являющимся ученым, и отвечает за обеспечение надлежащей правовой базы, защиту прав клиентов и надзор за контрактами. Она говорит, что федеративное обучение основано на убеждении, что «конфиденциальные данные лучше всего хранить локально и под контролем контроллера данных» и что оно дает результаты, которые «так же хороши, как если бы у вас были все данные на ваших собственных серверах». .
До сих пор преимущества были наиболее очевидны в секторе здравоохранения, где методы искусственного интеллекта развиты и существуют серьезные опасения по поводу конфиденциальных и конфиденциальных данных пациентов. Но г-жа Арнц отмечает, что федеративное обучение дает преимущества даже в тех случаях, когда данные не являются конфиденциальными в отношении информации, позволяющей установить личность (PII). Например, Apheris сейчас работает над проектом для производителя химикатов, который включает данные о продуктах и клиентах, которые являются конфиденциальными и секретными с коммерческой точки зрения. Федеративное обучение также может применяться в тех случаях, когда определенные данные защищены правами ИС.
«Централизация данных устаревает», — говорит г-жа Арнц, добавляя, что многие компании владеют большими объемами ценных данных, которые не используются из-за опасений по поводу совместного использования: «У вас может быть много данных, которые могут быть очень важны для кого-то другого, но не для вас, поэтому без партнерства с кем-то эти данные вообще не имеют никакой ценности».
В некоторых случаях ценность данных может быть очевидна только тогда, когда они объединяются с данными из других источников посредством федеративного обучения. Например, медицинские данные пациентов в США можно было бы дополнить данными из Африки или Азии, что привело бы к более разнообразному набору данных клинических испытаний. «Вы можете масштабировать его настолько, насколько захотите, и вот тут-то все и станет волшебным», — говорит г-жа Арнц.
Но она добавляет, что потенциал федеративного обучения, вероятно, еще не реализован через три года. Одной из причин является необходимость большей стандартизации сбора и форматирования данных. Хотя увеличенная вычислительная мощность позволяет обрабатывать большие объемы данных, для достижения оптимальных результатов данные должны быть хорошо структурированы, чтобы обеспечить безопасное совместное использование данных. Здесь снова сектор здравоохранения лидирует, но другие сектора догоняют. Г-жа Арнц выделяет автомобильную промышленность, где разработка частично и полностью автономных транспортных средств зависит от анализа большого количества данных из различных источников, включая водителей, транспортные средства, дорожные службы, правоохранительные органы и страховые компании. «Автомобильная промышленность очень сосредоточена на внедрении этой стандартизации, — говорит она. «Существует большой интерес к возможности совместной работы над этими данными, и предпринимаются усилия по объединению крупных производителей для стандартизации. Это особенно интересная область, поскольку она предполагает взаимодействие как государственного, так и частного секторов». В автомобильном секторе решение, скорее всего, будет добровольным и ориентированным на промышленность, но на его разработку потребуется время.
Хотя увеличенная вычислительная мощность позволяет обрабатывать большие объемы данных, для достижения оптимальных результатов данные должны быть хорошо структурированы, чтобы обеспечить безопасное совместное использование данных.
Загадка анонимизации
Одной из больших проблем при разработке инструментов ИИ является уровень анонимности. Понятно, что люди заботятся о защите своих личных данных (будь то медицинская или семейная история, финансовая информация или другие личные данные), но, как говорит г-жа Арнц, «чем более анонимны данные, тем менее актуальными они становятся. Анонимизация — это не будущее машинного обучения». Эффективная разработка и тестирование лекарств, например, должны учитывать возраст, этническую принадлежность, аллергию, лекарства и другие факторы; Самоуправляемым автомобилям нужна информация о том, куда вы едете, на каком транспортном средстве вы едете и с какой скоростью вы хотите ехать. Г-жа Арнц считает, что федеративное обучение может помочь обеспечить баланс и показать, что «конфиденциальность и инновации не являются конфликтом».
Для преодоления таких проблем требуется сочетание технологических и правовых решений: технология может обеспечить безопасность данных с помощью процессов, которые являются строгими и тщательно проверенными, а закон позволяет заключать контракты, которые определяют, кто контролирует данные, кто может получать результаты и какой уровень детализации. они получают.
Сравнение централизованного и федеративного обучения
Как на самом деле защищаются данные, остается сложным вопросом: в то время как авторское право закон и своем роде такие инструменты, как права на базы данных в ЕС, могут обеспечить некоторую защиту, границы не ясны, и большинство организаций, вероятно, предпочтут хранить данные в безопасности, полагаясь на договорные положения и защиту в соответствии с торговые секреты или законы о конфиденциальной информации. Но г-жа Арнц говорит, что вопрос о том, защищены ли данные и каким образом, не должен быть проблемой: «Если у вас есть данные, вы, вероятно, думаете, что они важны и должны быть защищены. Для федеративного обучения не имеет значения, защищены данные формально или нет. Мы ошибаемся на всякий случай».
По ее мнению, более насущным вопросом является «широкое согласие». GDPR признает, что научные исследователи не всегда могут определить все цели, для которых собираются данные. Таким образом, им, возможно, не нужно так подробно рассказывать о своих планах в других областях, но, тем не менее, они должны предоставлять варианты, чтобы субъекты данных могли дать информированное согласие на использование в будущих исследованиях. «Нам нужно более четкое руководство о том, что такое «цели исследования». В настоящее время существует неопределенность для университетов и исследователей, что ограничивает инновации», — говорит она.
Проливая свет на справедливое регулирование
Г-жа Арнц считает, что GDPR является примером законодательства, которое «много критикуют, но и очень любят»: оно обеспечивает прочную основу для защиты данных, но его необходимо будет обновлять по мере изменения технологий. «Прежде всего нам нужна ясность: даже если руководство состоит в том, что вы не можете что-то сделать, по крайней мере, хорошо иметь четкую линию».
Она также утверждает, что GDPR является примером того, как регион — в данном случае ЕС — может «пролить свет» для содействия справедливому регулированию: по ее словам, данные не могут регулироваться только на национальном уровне, поэтому необходимы многонациональные или международные решения — даже если на этом пути приходится идти на компромиссы. Она с оптимизмом смотрит на новые инициативы ЕС, такие как недавно принятая Закон об управлении данными и предложенный Закон об ИИ, внесет дополнительную ясность: «Политика всегда должна быть открыта для оптимизации. Нам нужно будет адаптировать его в будущем и пересмотреть то, чего мы пытаемся достичь».
Однако она предупреждает, что процесс должен быть инклюзивным и междисциплинарным: слишком часто деловые, юридические, политические и технические эксперты не находятся в одной комнате или даже не говорят на одном языке, а голос стартапов и малого и среднего бизнеса не всегда слышен. «Правительства много разговаривают с крупными корпорациями, но если они не разговаривают со стартапами, они не слышат об инновационных технологиях», — объясняет г-жа Арнц.
По ее словам, разговор важен, потому что технологии становятся все более и более изощренными, и для новых продуктов и услуг, созданных на основе ИИ и анализа данных, доступно достаточное финансирование. Важность данных очевидна во всем: от борьбы с пандемией COVID-19 до оценки воздействия изменения климата. «Мы увидим значительный рост в анализе данных, и политика должна будет измениться в ответ», — говорит г-жа Арнц.
Положение о защите данных Общие (ВВП): GDPR 2016 заменил Директиву ЕС о защите данных и регулирует обработку персональных данных субъектов данных в Европейской экономической зоне. Его придерживаются во многих других странах и регионах, например, в Калифорнийском законе о конфиденциальности потребителей (2018 г.).
Закон об управлении данными: Закон был принят Европейским парламентом 6 апреля 2022 года. Европейский парламент провозгласил его шагом, который «будет стимулировать инновации и поможет стартапам и предприятиям использовать большие данные». Правила принесут пользу бизнесу, снизив стоимость данных и барьеры для входа на рынок. Потребители получат выгоду, например, от доступа к более разумному потреблению энергии и снижению выбросов. Правила также предназначены для укрепления доверия, упрощая и делая более безопасным обмен данными, обеспечивая их соответствие законодательству о защите данных. Они также облегчат повторное использование определенных категорий данных государственного сектора, повысят доверие к посредникам данных и будут способствовать альтруизму данных (обмен данными на благо общества). Закон создаст «процессы и структуры», облегчающие обмен данными для компаний, частных лиц и государственного сектора. Он должен быть принят всеми странами ЕС в Совете, прежде чем он станет законом.
Закон ЕС о данных: Закон, также известный как Предлагаемое положение о гармонизированных правилах справедливого доступа к данным и их использования, был принят Европейской комиссией в феврале 2022 года и является ключевым элементом европейской стратегии обработки данных. В нем разъясняется, кто может создавать ценность из данных, и условия, при которых они могут это делать.
Закон об искусственном интеллекте: Предложение о Регламенте AI, устанавливающем гармонизированные правила для ЕС, является частью решения Европейской комиссии. Пакет ИИ опубликовано в апреле 2021 года. Это первая попытка «ввести горизонтальное регулирование ИИ». и призван превратить Европу в глобальный центр ориентированного на человека и надежного ИИ.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- Платоблокчейн. Интеллект метавселенной Web3. Расширение знаний. Доступ здесь.
- Источник: https://www.wipo.int/wipo_magazine/en/2022/02/article_0001.html
- 1
- 2016
- 2018
- 2019
- 2020
- 2021
- 2022
- 7
- a
- в состоянии
- О нас
- доступ
- Учетная запись
- Достигать
- Действие (Act):
- на самом деле
- приспосабливать
- Добавляет
- принял
- продвинутый
- Африка
- агентствах
- AI
- Регулирование AI
- алгоритм
- алгоритмы
- Все
- Аллергии
- всегда
- суммы
- анализ
- анализировать
- и
- ответ
- очевидный
- Применить
- апрель
- ПЛОЩАДЬ
- области
- Утверждает
- Азия
- Активы
- Власти
- автомобильный
- автомобильная промышленность
- автономный
- автономные транспортные средства
- доступен
- Баланс
- барьеры
- основанный
- основа
- , так как:
- становится
- становление
- до
- не являетесь
- вера
- считает,
- польза
- Преимущества
- ЛУЧШЕЕ
- большой
- Big Data
- Границы
- Коробка
- приносить
- Приведение
- строить
- строить доверие
- бизнес
- Бизнес-модель
- бизнес
- Калифорния
- Закон о конфиденциальности потребителей в Калифорнии
- не могу
- Пропускная способность
- легковые автомобили
- случаев
- случаев
- категории
- централизованная
- определенный
- вызов
- проблемы
- изменение
- изменения
- химических веществ
- ясность
- Очистить
- понятнее
- климат
- Изменение климата
- Клинический
- клинические испытания
- сотрудничать
- сотрудничество
- лыжных шлемов
- сочетании
- в промышленных масштабах
- комиссии
- Компании
- Компания
- Компании
- вычисление
- обеспокоенный
- Обеспокоенность
- Условия
- конфликт
- согласие
- потребитель
- конфиденциальность потребителя
- Потребители
- потребление
- контрактов
- контроль
- контроллер
- контрольная
- Разговор
- Корпорации
- Цена
- может
- Совет
- страны
- Covid-19.
- COVID-19 пандемия
- Создайте
- клиент
- данные клиентов
- данным
- анализ данных
- конфиденциальность данных
- защита данных
- обмен данными
- стратегия данных
- База данных
- обеспечивает
- зависит
- Производный
- описано
- предназначенный
- подробность
- подробнее
- развивать
- застройщиков
- Развитие
- трудный
- дигитализация
- директор
- Раскрывать
- Разное
- Разнообразие
- Dont
- вниз
- управлять
- драйверы
- наркотик
- разработки лекарств
- легче
- EC
- Экономические
- Эффективный
- усилия
- Выбросы
- Сотрудник
- включить
- позволяет
- энергетика
- Энергопотребление
- принуждение
- обеспечивать
- обеспечение
- запись
- Эфир (ETH)
- EU
- Европа
- Европе
- Европейская кухня
- Европейская комиссия
- Европейские данные
- Европейский парламент
- Даже
- НИКОГДА
- многое
- пример
- эксперты
- Объясняет
- содействовал
- факторы
- ярмарка
- семья
- БЫСТРО
- в пользу
- финансовый
- Во-первых,
- поток
- внимание
- следует
- Формально
- Год основания
- Четвертый
- внештатно
- от
- Граница
- топливо
- полностью
- фундаментальный
- финансирование
- далее
- будущее
- GDPR
- Общие
- получить
- получающий
- Дайте
- Глобальный
- Go
- будет
- хорошо
- управление
- большой
- Рост
- происходит
- имеющий
- здравоохранение
- услышанный
- помощь
- здесь
- Шоссе
- история
- горизонтальный
- Больница
- Как
- HTML
- HTTPS
- хаб
- идентифицирует
- определения
- Влияние
- значение
- важную
- in
- В других
- В том числе
- включительно
- Увеличение
- расширились
- лиц
- промышленность
- информация
- сообщил
- инициативы
- Инновации
- инновационный
- страховщики
- интеллектуальный
- интеллектуальная собственность
- Интеллекта
- взаимодействие
- интерес
- интересный
- посредников
- Мультиязычность
- прерванный
- IP
- вопрос
- IT
- присоединился
- хранение
- Основные
- Вид
- известный
- язык
- большой
- больше
- запустили
- закон
- правоохранительной
- Законодательство
- вести
- ведущий
- УЧИТЬСЯ
- изучение
- Юр. Информация
- Законодательство
- уровень
- легкий
- Вероятно
- линия
- локальным
- в местном масштабе
- серия
- машина
- обучение с помощью машины
- сделать
- Создание
- ПРОИЗВОДИТЕЛЬ
- Производители
- многих
- рынок
- Вопрос
- основным медицинским
- медицинские данные
- лечение
- просто
- может быть
- модель
- момент
- БОЛЕЕ
- самых
- двигаться
- MS
- многонациональный
- с разными
- в национальном
- Необходимость
- необходимый
- потребности
- Тем не менее
- Новые
- новые продукты
- предлагают
- Предложения
- ONE
- открытый
- открытие
- оптимальный
- Оптимистический
- Оптимизировать
- Опции
- организации
- Другое
- собственный
- владелец
- Владельцы
- пандемия
- парламент
- часть
- особенно
- Стороны
- партнеринг
- вечеринка
- пациент
- данные пациента
- пациентов
- личного
- личные данные
- Лично
- в Фармацевтической отрасли
- PII
- мародерство
- Часть
- Планы
- Платформа
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- пунктов
- политика
- возможное
- потенциал
- полномочия
- политикой конфиденциальности.
- частная
- частный сектор
- вероятно
- Проблема
- процесс
- Процессы
- обработка
- Продукт
- Продукция
- Продукты и услуги
- Проект
- продвижении
- правильный
- собственность
- рассматривается
- предложило
- ( изучите наши патенты),
- для защиты
- защищенный
- защищающий
- защиту
- обеспечивать
- приводит
- что такое варган?
- опубликованный
- целей
- вопрос
- Читать
- причина
- причины
- Получать
- недавно
- признает
- учет
- область
- районы
- регулируемых брокеров
- "Регулирование"
- соответствующие
- остатки
- требовать
- требуется
- исследованиям
- исследователи
- относительно
- ответ
- ответственный
- в результате
- Итоги
- правые
- тщательный
- Комната
- условиями,
- безопасный
- безопаснее
- то же
- Шкала
- Ученый
- Ученые
- Secret
- сектор
- Сектора юридического права
- безопасный
- безопасно
- безопасность
- самостоятельное вождение
- чувствительный
- сентябрь
- Услуги
- Сессия
- Поделиться
- общие
- разделение
- должен
- показывать
- просто
- умнее
- МСП
- So
- Общество
- Решение
- Решения
- Решение
- некоторые
- Кто-то
- удалось
- сложный
- Звук
- Источники
- конкретный
- речь
- ввод в эксплуатацию
- Стартапы
- Области
- По-прежнему
- Стратегия
- структурированный
- такие
- лето
- супер
- SVG
- взять
- Говорить
- говорить
- команда
- Технический
- снижения вреда
- технологический
- технологии
- Технологии
- Тестирование
- Ассоциация
- Будущее
- их
- следовательно
- В третьих
- три
- Через
- время
- в
- вместе
- слишком
- инструменты
- Train
- специалистов
- превращение
- испытания
- Доверие
- надежных
- заслуживающий доверия
- ОЧЕРЕДЬ
- Неопределенность
- под
- По вполне понятным причинам
- Объединенный
- США
- Университеты
- обновление
- использование
- ценный
- ценностное
- разнообразие
- различный
- автомобиль
- Транспорт
- Режимы
- объем
- тома
- стремятся
- предупреждает
- Что
- будь то
- , которые
- в то время как
- КТО
- будете
- без
- слова
- работает
- лет
- ВАШЕ
- зефирнет