수학자가 술집으로 걸어 들어갑니다 (허위 정보)

플라톤에 의해 재발행

팔로워 : 0

잘못된 정보, 잘못된 정보, 인포테인먼트, 알고와(algowars) — 지난 수십 년 동안 미디어의 미래에 대한 논쟁이 의미가 있었다면 적어도 영어에 날카로운 흔적을 남겼습니다. 개인의 심리학과 신경학에서부터 민주주의 사회의 힘에 대한 광범위한 우려에 이르기까지 소셜 미디어가 우리에게 하는 일에 대해 많은 모욕과 두려움이 있었습니다. 조셉 번스타인이 최근에 말했듯이, "군중의 지혜"에서 "허위 정보"로의 전환은 참으로 갑작스러운 일이었습니다.

허위정보란? 그것이 존재하고 존재한다면 어디에 있으며 우리가 그것을 보고 있는지 어떻게 알 수 있습니까? 우리가 가장 좋아하는 플랫폼의 알고리즘이 우리의 주의를 끌기 위해 애쓰는 동안 우리에게 무엇을 보여주는지 관심을 가져야 합니까? 그런 종류의 복잡한 수학 및 사회 과학 질문들이 노아 지안시라쿠사 주제에 관심이 있습니다.

보스턴에 있는 Bentley University의 교수인 Giansiracusa는 수학 교육을 받았지만(대수 기하학과 같은 분야에 집중적으로 연구) 대법원에 전산 기하학. 가장 최근에 "라는 책을 출간했다.알고리즘이 가짜 뉴스를 만들고 방지하는 방법" 오늘날 미디어 환경과 기술이 이러한 추세를 악화시키고 개선하는 방법에 대한 몇 가지 도전적인 질문을 탐구합니다.

나는 최근에 Twitter Space에서 Giansiracusa를 주최했고, Twitter는 이후에 이러한 대화를 듣기 쉽게 만들지 않았기 때문에(임시!), 나는 당신과 후손을 위해 우리 대화의 가장 흥미로운 부분을 뽑아낼 것이라고 생각했습니다.

이 인터뷰는 명확성을 위해 편집 및 정리되었습니다.

대니 크리 튼: 어떻게 가짜뉴스를 조사하고 이 책을 쓰기로 결심하셨나요?

노아 지안시라쿠사: 내가 알아차린 한 가지는 가짜 뉴스와 이런 종류의 것들에 대한 정말 흥미로운 사회학적, 정치학 토론이 많다는 것입니다. 그리고 기술적인 면에서는 Mark Zuckerberg가 AI가 이 모든 문제를 해결할 것이라고 말하는 것과 같은 말을 듣게 될 것입니다. 그 간극을 메우기가 조금 어려울 것 같았습니다.

최근 바이든이 한 말을 누구나 한 번쯤은 들어보셨을 것입니다.사람들을 죽이고 있어," SNS상의 잘못된 정보에 대해 그래서 우리는 정치인들이 알고리즘 측면을 실제로 파악하기 어려운 이러한 것들에 대해 이야기하고 있습니다. 그런 다음 세부 사항에 대해 정말 깊은 컴퓨터 과학 사람들이 있습니다. 그래서 저는 그 사이에 앉아 있는 것입니다. 저는 진정한 하드코어 컴퓨터 공학 사람이 아닙니다. 그래서 그냥 뒤로 물러나서 조감도를 보는 것이 조금 더 쉬운 것 같아요.

하루가 끝날 무렵, 나는 일이 복잡해지고 수학이 그렇게 깨끗하지 않은 사회와의 더 많은 상호 작용을 탐구하고 싶다고 느꼈습니다.

크라이튼: 수학적 배경을 바탕으로 많은 사람들이 다양한 각도에서 글을 써온 논쟁의 여지가 있는 영역에 진입하고 있습니다. 사람들이 이 영역에서 올바르게 이해하고 있는 것은 무엇이며 사람들이 뉘앙스를 놓쳤을 수 있는 것은 무엇입니까?

지안시라쿠사: 놀라운 저널리즘이 많이 있습니다. 나는 많은 저널리스트들이 꽤 기술적인 것들을 다룰 수 있다는 사실에 놀랐습니다. 하지만 그들이 틀리지 않았을 수도 있다는 한 가지 말을 하고 싶습니다. 하지만 저를 놀라게 한 것은 학술 논문이 나오는 경우가 많거나 Google, Facebook 또는 이러한 기술 회사 중 하나에서 발표가 나오기도 합니다. 그들은 일종의 언급을 할 것이고 기자는 인용문을 추출하고 그것을 설명하려고 할 것입니다. 그러나 그들은 실제로 그것을 보고 이해하려고 하는 것을 약간 두려워하는 것 같습니다. 그리고 나는 그들이 할 수 없었다고 생각하지 않습니다. 그것은 실제로 더 많은 협박과 두려움처럼 보입니다.

내가 수학 교사로서 엄청난 경험을 한 것은 사람들이 잘못된 말을 하거나 실수를 하는 것을 너무 두려워한다는 것입니다. 그리고 이것은 기술적인 것에 대해 글을 써야 하는 기자들에게 해당되며, 그들은 잘못된 것을 말하고 싶지 않습니다. 따라서 Facebook의 보도 자료를 인용하거나 전문가의 말을 인용하는 것이 더 쉽습니다.

순수 수학에 대해 매우 재미있고 아름다운 한 가지는 틀리는 것에 대해 정말로 걱정하지 않고 아이디어를 시도하고 아이디어가 어디로 이끄는지 확인하고 이러한 모든 상호 작용을 볼 수 있다는 것입니다. 논문을 작성하거나 발표할 준비가 되면 세부 사항을 확인합니다. 그러나 대부분의 수학은 탐구하는 이 창의적인 과정이며 아이디어가 상호 작용하는 방식을 보고 있습니다. 당신이 생각하는 수학자로서의 나의 훈련은 내가 실수를 저지르는 것에 대해 두려워하고 매우 정확할 것이라고 생각하지만, 그것은 일종의 반대 효과를 가져왔습니다.

두 번째로, 이러한 알고리즘의 많은 부분은 보이는 것만큼 복잡하지 않습니다. 나는 거기에 앉아서 구현하는 것이 아니라 프로그래밍하는 것이 어렵다고 확신합니다. 그러나 큰 그림, 오늘날의 이러한 모든 알고리즘, 이 많은 것들이 딥 러닝에 기반하고 있습니다. 그래서 당신은 약간의 신경망을 가지고 있습니다. 그들이 어떤 아키텍처를 사용하고 있는지는 외부인으로서 저에게 정말로 중요하지 않습니다. 정말로 중요한 것은 예측자가 무엇입니까? 기본적으로 이 기계 학습 알고리즘에 제공하는 변수는 무엇입니까? 그리고 무엇을 출력하려고 합니까? 누구나 이해할 수 있는 내용입니다.

크라이튼: 이러한 알고리즘을 분석할 때 생각하는 가장 큰 문제 중 하나는 투명성의 부족입니다. 예를 들어, 문제를 해결하기 위해 노력하는 학자들의 커뮤니티인 순수한 수학 세계와 달리, 이러한 회사 중 다수는 실제로 더 넓은 커뮤니티에 데이터와 분석을 제공하는 데 상당히 적대적일 수 있습니다.

지안시라쿠사: 겉모습만 가지고 추론할 수 있는 것에는 한계가 있는 것 같다.

YouTube가 좋은 예입니다. 학계 팀은 YouTube 추천 알고리즘이 사람들을 극단주의의 음모 이론 토끼굴로 보내는지 여부를 조사하고자 했습니다. 문제는 이것이 추천 알고리즘이기 때문에 딥 러닝을 사용하고 검색 기록, 인구 통계, 시청한 기타 동영상 및 시청 시간을 기반으로 하는 수백 개의 예측 변수를 기반으로 한다는 것입니다. 그것은 당신과 당신의 경험에 매우 맞춤화되어 있어서 내가 찾을 수 있었던 모든 연구는 시크릿 모드를 사용합니다.

따라서 그들은 기본적으로 검색 기록도 정보도 없는 사용자이며 동영상으로 이동한 다음 첫 번째 추천 동영상을 클릭하고 다음 동영상을 클릭합니다. 알고리즘이 사람들을 어디로 데려가는지 봅시다. 그것은 역사가 있는 실제 인간 사용자와는 매우 다른 경험입니다. 그리고 이것은 정말 어려웠습니다. 아무도 외부에서 YouTube 알고리즘을 알고리즘적으로 탐색하는 좋은 방법을 알아내지 못했다고 생각합니다.

솔직히 말하면, 당신이 할 수 있다고 생각하는 유일한 방법은 자원 봉사자를 모집하고 컴퓨터에 추적기를 놓고 "이봐, 그냥 인생을 살아라. 일반적으로 기록과 모든 것을 처리하고 보고 있는 비디오를 알려주세요." 따라서 이러한 알고리즘의 대부분, 거의 모두가 개별 데이터에 너무 많이 기반하고 있다는 사실을 극복하기가 어려웠습니다. 우리는 그것을 종합적으로 연구하는 방법을 모릅니다.

그리고 우리에게 데이터가 없기 때문에 문제가 있는 것은 저나 외부의 다른 누군가가 아닙니다. 알고리즘을 구축하고 문서에서 알고리즘이 어떻게 작동하는지 알고 있지만 실제로 어떻게 작동할지는 모르는 회사 내 사람들입니다. 마치 프랑켄슈타인의 괴물 같습니다. 그들은 이것을 만들었지만 어떻게 작동할지 모릅니다. 그래서 제 생각에 당신이 그것을 정말로 연구할 수 있는 유일한 방법은 그 데이터를 가지고 있는 내부 사람들이 방해가 되지 않고 그것을 연구하기 위해 시간과 자원을 소비하는 것입니다.

크라이튼: 잘못된 정보를 평가하고 플랫폼에 대한 참여를 결정하는 데 사용되는 메트릭이 많이 있습니다. 수학적 배경을 바탕으로 이러한 측정값이 강력하다고 생각하십니까?

지안시라쿠사: 사람들은 잘못된 정보를 폭로하려고 합니다. 그러나 그 과정에서 댓글을 달거나 리트윗하거나 공유할 수 있으며 이는 참여로 간주됩니다. 따라서 이러한 참여 측정의 많은 부분이 실제로 긍정적인 결과를 보고 있습니까 아니면 모든 참여를 보고 있습니까? 알다시피, 그것은 일종의 덩어리로 뭉쳐져 있습니다.

이것은 학술 연구에서도 발생합니다. 인용은 연구가 얼마나 성공적인지를 나타내는 보편적인 척도입니다. 글쎄요, Wakefield의 원래 자폐증과 백신 논문과 같은 정말 가짜는 많은 인용을 얻었습니다. 그들 중 많은 사람들이 그것이 옳다고 생각했기 때문에 그것을 인용한 사람들이었습니다. 말하자면, 우리는 이 이론이 틀렸음을 보여줍니다. 그러나 어떻게 든 인용은 인용입니다. 따라서 모든 것이 성공 지표에 포함됩니다.

그래서 저는 그것이 약혼과 관련하여 일어나는 일이라고 생각합니다. 내 댓글에 "이봐, 그건 미친 짓이야"라는 글을 게시하면 알고리즘이 내가 지원하는지 여부를 어떻게 알 수 있습니까? 그들은 시도하기 위해 약간의 AI 언어 처리를 사용할 수 있지만 그것이 있는지 확실하지 않으며 그렇게 하려면 많은 노력이 필요합니다.

크라이튼: 마지막으로 GPT-3와 합성미디어와 가짜뉴스에 대한 우려에 대해 이야기 하고자 합니다. AI 봇이 잘못된 정보로 미디어를 압도할 것이라는 두려움이 많습니다. 우리는 얼마나 두려워해야 할까요?

지안시라쿠사: 내 책은 실제로 경험을 바탕으로 했기 때문에 공정성을 유지하고 사람들에게 정보를 제공하고 스스로 결정을 내리도록 하고 싶었습니다. 나는 그 논쟁을 중단하고 양쪽이 실제로 말할 수 있도록 하기로 결정했습니다. 나는 뉴스피드 알고리즘과 인식 알고리즘이 많은 유해한 것들을 증폭시키고 사회에 파괴적이라고 생각합니다. 그러나 알고리즘을 생산적이고 성공적으로 사용하여 가짜 뉴스를 제한하는 놀라운 발전도 많이 있습니다.

AI가 모든 것을 고칠 것이라고 말하는 테크노 유토피아가 있습니다. 진실 말하기, 사실 확인, 잘못된 정보를 감지하고 제거할 수 있는 알고리즘이 있을 것입니다. 약간의 진전이 있지만 그 일은 일어나지 않을 것이며 결코 완전히 성공하지 못할 것입니다. 항상 사람에 의존해야 합니다. 그러나 우리가 가지고 있는 또 다른 것은 일종의 비이성적인 두려움입니다. 이런 종류의 쌍곡선 AI 디스토피아가 있습니다. 알고리즘이 너무 강력해서 우리를 파괴할 특이점 유형과 같은 것입니다.

2018년에 딥 페이크가 처음 뉴스에 나왔을 때 GPT-3가 몇 년 전에 출시되었을 때 "오 젠장, 이것이 가짜 뉴스와 진실을 이해하는 모든 문제를 만들 것입니다. 세상이 훨씬, 훨씬 더 어렵습니다.” 그리고 이제 우리에게 거리가 몇 년 남았다고 생각합니다. 우리는 그들이 그것을 조금 더 어렵게 만들었지만 우리가 기대했던 것만큼 크게 중요하지는 않다는 것을 알 수 있습니다. 그리고 주요 문제는 무엇보다 심리적이고 경제적입니다.

그래서 GPT-3의 원저자들은 알고리즘을 소개하는 연구 논문을 가지고 있습니다. 그들이 한 일 중 하나는 텍스트를 붙여넣고 기사로 확장한 다음 일부 자원 봉사자가 평가하고 추측하게 하는 테스트였습니다. 는 알고리즘으로 생성된 것이고 어떤 기사는 사람이 생성한 것입니다. 그들은 50%에 매우 가까운 정확도를 얻었다고 보고했습니다. 그래서 놀랍고 무섭게 들립니다.

그러나 세부 사항을 보면 텍스트 단락에 한 줄의 헤드라인처럼 확장되어 있습니다. 대서양 길이나 뉴요커 길이의 전체 기사를 작성하려고 하면 불일치가 보이기 시작하고 생각이 흐트러질 것입니다. 이 논문의 저자들은 이것을 언급하지 않았습니다. 그들은 그저 일종의 실험을 하고 "이봐, 얼마나 성공적인지 봐"라고 말했습니다.

그래서 그들은 이러한 인상적인 기사를 만들 수 있습니다. 그러나 이것이 왜 GPT-3가 가짜 뉴스와 잘못된 정보, 그리고 이 모든 것들에 관한 한 그렇게 변혁적이지 못했는지에 대한 주된 이유입니다. 가짜뉴스가 대부분 쓰레기이기 때문이다. 글도 형편없고, 품질도 낮고, 너무 저렴하고 빠르게 만들 수 있습니다. 16살짜리 조카에게 돈을 주고 몇 분 안에 가짜 뉴스 기사를 만들 수 있습니다.

수학이 내가 이것을 보는 데 도움이 된 것은 그리 많지 않습니다. 어쨌든 우리가 수학에서 하려고 하는 주된 일은 회의적이라는 것입니다. 그래서 당신은 이러한 것들에 의문을 제기하고 약간 회의적이어야 합니다.

출처: https://techcrunch.com/2021/08/20/a-mathematician-walks-into-a-bar-of-disinformation/

타임 스탬프 : 2021 년 8 월 20 일

타임 스탬프 : 22년 2021월 XNUMX일

BigPanda는 190억 XNUMX천만 달러의 신규 자본을 확보한 후 뿔뿔이 흩어졌습니다.

소스 클러스터 :

테크 크런치 (TechCrunch)

소스 노드 : 1577197

타임 스탬프 : 12년 2022월 XNUMX일

금융 컨시어지 스타트업 Zeni는 중소기업에 실시간으로 재정 상황을 보여주기 위해 34만 달러를 투자했습니다.

소스 클러스터 :

테크 크런치 (TechCrunch)

소스 노드 : 1859384

타임 스탬프 : 4년 2021월 XNUMX일

플라톤에 의해 재발행

Breinify, 마케팅 팀에 데이터 과학을 제공 할 $ 11M 시드 발표

메타 연구원은 시각적, 서면 또는 음성 자료에서 똑같이 잘 학습하는 AI를 구축합니다.

Applied XL은 실시간 데이터를 추적하는 '편집 알고리즘'을 구축하기 위해 1.5 만 달러를 모금했습니다.

모든 작은 문제를 해결하려면 일상적인 Little AI를 살펴보세요.

Zingtree는 복잡한 고객 서비스 프로세스를 명확한 실행 계획으로 전환합니다.

Fleksy, 10배 성장 후 Series A로 키보드 SDK 사업 확장

Shelf.io는 작년에 52.5배의 ARR 성장을 기록한 후 4만 달러 규모의 시리즈 B를 마감했습니다.

Tailor Brands, 50천만 달러 모금

BigPanda는 190억 XNUMX천만 달러의 신규 자본을 확보한 후 뿔뿔이 흩어졌습니다.

금융 컨시어지 스타트업 Zeni는 중소기업에 실시간으로 재정 상황을 보여주기 위해 34만 달러를 투자했습니다.

회사 소개

수직 검색 및 인공 지능

플랫폼

연결 유지

계정

더보기 테크 크런치 (TechCrunch)

회사 소개

수직 검색 및 인공 지능

플랫폼

연결 유지

계정