작성자 : John P. Desmond (AI 트렌드 편집자)
오늘날 AI 시스템이 누군가가 일자리를 얻거나 대출을 받을 수 있는지 여부를 결정함에 따라 AI 시스템을 운영하는 회사는 기본 데이터 세트가 너무 편향되어 결론에 오류가 발생하지 않도록 하는 것이 중요합니다.
2018년 연구의 저자 Joy Buolamwini와 Timnit Gebru의 연구와 같이 편향된 결과로 이어지는 편향된 데이터의 사례가 문서화되어 있습니다. 시간의. 법 집행 기관이 이러한 시스템을 사용하여 용의자를 식별하는 경우 심각한 문제가 발생할 수 있습니다.
AI 시스템이 의존하는 편향된 데이터 세트를 줄이기 위한 진지한 노력이 필요한 단계입니다. 의 최고신탁책임자인 Alexandra Ebert는 “지금이 기회입니다. 대부분 AI, 비엔나에 기반을 둔 합성 데이터에 중점을 둔 신생 기업, 최근 계정에서 인용 IEEE 스펙트럼. 기업, 데이터 과학자 및 엔지니어는 사회 개선을 위해 AI 데이터 세트 및 알고리즘에서 편견을 제거하는 방법에 집중하기 시작했습니다.
훈련 데이터 세트는 소수 그룹의 데이터가 부족할 수 있으며 아시아계 미국인이 외국인으로 분류되는 경우와 같이 여성의 낮은 급여 또는 인종 편견과 같은 역사적 불평등을 반영할 수 있습니다. 편향된 훈련 데이터에서 학습하는 모델은 동일한 편향을 나타냅니다. 균형 잡히고 포괄적인 고품질 데이터를 수집하려면 약간의 비용이 들 수 있습니다.
바로 여기에서 Mostly AI와 같은 합성 데이터 공급업체가 기회를 봅니다. 예를 들어, 그들은 존재하지 않았을 수도 있지만 인종, 수입, 교육 배경과 같은 기존 데이터의 패턴에 맞는 사람을 만들 수 있습니다. Ebert는 새로운 개인이 "소득이 높은 여성처럼 행동하여 그 사람의 모든 데이터 포인트가 일치하고 의미가 있도록 할 것"이라고 말했습니다. 합성 데이터는 정확도를 약간 떨어뜨릴 수 있지만 여전히 통계적으로 높은 대표성을 나타냅니다.
또 다른 합성 데이터 시작은 합성, 런던에 기반을 두고 있으며 창립자는 케임브리지 대학의 기계 학습 연구원이었습니다. 이 회사는 데이터 과학자에게 서비스를 제공하는 데 중점을 둡니다. Ebert는 대부분 AI와 다른 여러 회사가 합성 데이터에 대한 IEEE 표준 그룹의 출범을 위해 노력하고 있다고 말했습니다.
툴킷, 데이터 세트의 편향을 줄이는 데 도움이 되는 프레임워크 등장
개발자는 AI의 편견을 줄이는 데 도움이 되는 도구를 만들고 있습니다. 여기에는 다음의 도구가 포함됩니다. 애퀴 타스 업로드된 데이터 세트의 편향을 측정하고 테미스-ml 편향 완화 알고리즘을 통해 데이터 세트를 배치하는
IBM의 팀은 AI 공정성 360, 데이터 세트 및 기계 학습 모델에서 원치 않는 편향을 감지하고 줄이는 데 도움이 됩니다. 지난 14년 동안 컴퓨터 과학자들이 개발한 XNUMX개의 다양한 편향 완화 알고리즘을 조합하고 직관적인 사용을 목표로 합니다. 프로젝트의 리더이자 뉴욕주 요크타운 하이츠에 있는 IBM Research AI의 연구 관리자인 Kush Varshney는 "이 아이디어는 작업 전문가가 이러한 도구를 사용할 수 있도록 하는 공통 인터페이스를 갖는 것입니다."라고 말했습니다. IEEE 스펙트럼.
도구는 데이터를 마사지하기 위해 다양한 기술을 구현합니다. 예를 들어, 재평가는 혜택이 없는 그룹에 더 긍정적인 결과를 제공하는 입력/출력 쌍에 더 높은 가중치를 부여합니다. 일부는 데이터가 적은 그룹 A 또는 B에 대해 최적화하고 그룹 간에 보다 공정한 결과를 제공하기 위해 머신 러닝 알고리즘을 조정하는 작업을 합니다.
AI 공정성의 근간에는 데이터세트가 있습니다. Varshney는 "이 알고리즘이 공정성 문제나 데이터 세트에 가장 잘 작동할 것이라고 선험적으로 말할 수는 없습니다."라고 말했습니다. "어떤 알고리즘이 데이터에 가장 적합한지 알아내야 합니다." 그는 개발자들이 편향 감소 툴킷을 사용하는 법을 배우는 것을 보았습니다. "미묘한 뉘앙스가 있지만 편견을 완화하기로 마음먹으면 할 수 있습니다."라고 그는 말했습니다.
개발자 세계관이 데이터 세트에 영향을 미치는지 확인
AI 엔지니어링 관리자는 AI 엔지니어가 자신의 편견을 자신이 개발하는 시스템에 전달하고 있는지 여부를 알아야 합니다. Iterate.ai의 애플리케이션 기계 학습 및 플랫폼 엔지니어링 관리자인 Shomron Jacob은 최근 계정에서 "AI 애플리케이션의 성공은 본질적으로 교육 데이터와 관련이 있습니다."라고 말했습니다. VentureBeat. Iterate.ai는 산호세에 기반을 둔 스타트업으로 스타트업이 대기업에 참여하는 데 부분적으로 도움이 되는 AI 플랫폼을 구축하고 있습니다.
"엔지니어가 자신의 세계관과 가정이 데이터 세트에 영향을 미치도록 허용한다면(아마도 특정 인구 통계 또는 초점에만 제한된 데이터를 제공하는 경우) AI 문제 해결에 의존하는 애플리케이션은 유사하게 편향되고 부정확하며 그다지 유용하지 않을 것입니다.” 야곱은 말했습니다. “AI가 상대적으로 초기 단계의 기술에서 완전히 유비쿼터스한 기술로의 급속한 전환을 계속하면서 편향 조사가 증가할 것으로 예상합니다. 그러나 그 현실을 진정으로 달성하려면 인간의 편견을 무시해야 합니다.”
AI 개발 조직은 AI 편향을 인식하고 완화하기 위해 효과적인 프레임워크, 툴킷, 프로세스 및 정책을 사용해야 합니다. 사용 가능한 오픈 소스 도구는 데이터의 사각 지대를 찾는 데 도움이 될 수 있습니다.
AI 프레임워크는 견제와 균형을 도입하여 AI 편향의 위험으로부터 조직을 보호하도록 설계되었습니다. Jacob은 이러한 프레임워크를 사용하여 신뢰할 수 있고 편향 없는 관행에 대한 벤치마크를 자동화하고 제품에 내재화할 수 있다고 조언했습니다.
그는 다음과 같은 예시 AI 프레임워크를 제안했습니다.
롤스로이스의 Aletheia 프레임워크 정확하고 신중하게 관리되는 AI 애플리케이션을 설계하기 위한 32단계 프로세스를 제공합니다.
딜로이트의 AI 프레임워크 AI 보호 장치 및 윤리적 관행을 구현하기 위한 XNUMX가지 필수 차원을 강조합니다.
그리고 Naveen Joshi의 프레임워크 신뢰할 수 있는 AI 개발을 위한 초석 사례를 자세히 설명합니다. 설명 가능성, 기계 학습 무결성, 의식적인 개발, 재현성 및 스마트 규정의 필요성에 중점을 둡니다.
그리고 Jacob은 이전에 언급한 AI Fairness 360을 포함하여 다음과 같은 예시 AI 툴킷을 제안했습니다.
IBM 왓슨 오픈스케일 실시간 편향 감지 및 완화를 제공하고 AI 예측을 신뢰할 수 있고 투명하게 만드는 데 도움이 되는 자세한 설명을 가능하게 합니다.
Google의 What-If 도구 기계 학습 모델 동작의 시각화를 제공하여 편향을 근절하기 위해 기계 학습 공정성 메트릭에 대해 학습된 모델을 더 쉽게 테스트할 수 있습니다.
한 팀이 커뮤니티 기반 시스템 역학을 실천합니다.
한 AI 엔지니어는 AI 프로젝트의 초기 정의에서 많은 이해 관계자를 결합하는 접근 방식을 중요하게 생각합니다. 팀은 구현의 사회적 의미를 고려해야 한다고 BairesDev의 운영 부사장인 Damian Scalerandi가 제안합니다. 포브스. 샌프란시스코에 기반을 둔 BairesDev는 고객에게 AI 소프트웨어 개발 서비스를 제공합니다.
AI 개발에는 사각지대가 있을 수 있습니다. Scalerandi는 "이를 찾아 패치할 수 있는 가장 좋은 기회는 사회 맥락 자체에 가장 가까운 사람들, 즉 사회학자, 행동 과학자 및 인문학 전문가와 협력하는 것입니다."라고 말했습니다.
일부 엔지니어는 이 접근 방식을 CBSD(커뮤니티 기반 시스템 역학)라고 하며, Peter S. Hovmand의 저서에서 2013년에 소개한 용어입니다.
Scalerandi는 "함께 특정 알고리즘이 작동하는 방식과 윈-윈 시나리오를 가장 잘 보장할 수 있는 방법에 대한 공유 가설을 형성할 수 있습니다."라고 말했습니다. "결국 이것은 모두에게 공정하고 안전하며 유익한 기술 혁신을 지원하는 것입니다.”
소스 기사 및 정보 읽기 in IEEE 스펙트럼, in VentureBeat 으로 혹은 포브스.
- 계정
- AI
- AI 바이어스
- 연산
- 알고리즘
- All
- 어플리케이션
- 어플리케이션
- 기사
- 작성자
- 자동
- 자동화
- BEST
- 개량
- 검정
- 건물
- 사업
- 캠브리지
- 확인하는 것이 좋다.
- 주요한
- 클라이언트
- 공통의
- 회사
- 계속
- 만들기
- 신용
- 데이터
- 딜로이트
- 인구 통계
- Detection System
- 개발
- 개발자
- 개발자
- 개발
- 교육
- 유효한
- 기사
- 엔지니어링
- 엔지니어
- 설명 가능성
- 얼굴
- 공정한
- 그림
- 초점
- 포브스
- 형태
- 설립자
- 뼈대
- GitHub의
- 좋은
- 그룹
- 높은
- 방법
- How To
- HTTPS
- IBM
- 생각
- 확인
- IEEE
- 포함
- 포함
- 수입
- 증가
- 영향
- 관심
- IT
- 일
- 넓은
- 시작
- 법
- 법 집행
- 리드
- 지도
- 배우다
- 배우기
- 제한된
- 차관
- 런던
- 기계 학습
- 유튜브 영상을 만드는 것은
- 경기
- 측정
- 통계
- 소수
- 모델
- 돈
- 뉴욕
- 제공
- 장교
- 열 수
- 오픈 소스
- 행정부
- 기회
- 조직
- 기타
- 패치
- 무늬
- 사람들
- 플랫폼
- 정책
- 인구
- 예측
- 제품
- 전문가
- 프로젝트
- 보호
- 품질
- 품질 데이터
- 경주
- 실시간
- 현실
- 감소
- 규정
- 연구
- 결과
- 롤
- 달리는
- 가장 안전한 따뜻함
- 급여
- 산
- 산 호세
- 과학자
- 감각
- 서비스
- 피복재
- 세트
- 공유
- 짧은
- SIX
- 스마트 한
- So
- 사회적
- 사회
- 소프트웨어
- 소프트웨어 개발
- 후원
- 단계
- 기준
- 시작
- 신생
- 교육과정
- 성공
- 공급 업체
- 공급
- 합성 데이터
- 체계
- 시스템은
- Technology
- test
- 소스
- 시간
- 생각하는
- 트렌드
- 믿어
- 대학
- 캠브리지 대학교
- 심상
- 왓슨
- 백서
- 누구
- 여성 컬렉션
- 작업