OpenAI는 더 나은 정확도로 GPT-4를 출시하고 SAT에서 인간의 90%를 이길 수 있다고 주장합니다.

OpenAI는 더 나은 정확도로 GPT-4를 출시하고 SAT에서 인간의 90%를 이길 수 있다고 주장합니다.

소스 노드 : 2010327

4월에 ChatGpT를 성공적으로 출시한 후 OpenAI는 오늘 주요 대규모 언어 모델인 GPT-4의 최신 버전 출시를 발표했습니다. OpenAI는 이전 모델과 달리 새로운 GPT-4는 더 큰 정확도로 어려운 문제를 해결할 수 있는 대형 멀티모달 모델이며 GPT-XNUMX는 현재까지 회사에서 가장 발전된 시스템으로 더 안전하고 유용한 응답을 생성한다고 덧붙였습니다.

마이크로소프트가 지원하는 AI 스타트업인 이 스타트업은 광범위한 일반 지식과 문제 해결 능력 덕분에 새로운 GPT-4가 많은 전문 테스트에서 "인간 수준의 성능"을 보인다고 말했습니다. 한 테스트에서 OpenAI는 GPT-4가 모의 변호사 시험에서 90번째 백분위수, SAT 수학 시험에서 89번째 백분위수, SAT 읽기 시험에서 93번째 백분위수를 수행했다고 주장했습니다.

회사는 또한 소셜 미디어를 통해 새 릴리스를 발표했습니다.

ChatGPT-4는 또한 이전 버전보다 "더 큽니다". 즉, 더 큰 데이터 세트에서 훈련되었고 모델 파일에 더 많은 가중치가 있으므로 실행 비용도 더 많이 듭니다. 마이크로소프트는 화요일 Bing의 AI 챗봇도 GPT-4를 사용한다고 밝혔다.

안에 블로그 게시물 또한 웹사이트에서 OpenAI는 ChatGPT와 GPT-4를 나란히 비교하여 고급 추론 기능에서 GPT-4가 ChatGPT를 능가하는 방법을 보여주었습니다.

OpenAI는 또한 Microsoft Azure를 사용하여 모델을 훈련했다고 설명했습니다. 우리가 여러 차례 보고한 바와 같이, 레드몬드에 본사를 둔 Microsoft는 1년에 2019억 달러를 받고 회사 지분 10%를 대가로 49억 달러를 더 받았습니다.

출시 후 불과 두 달 만에 ChatGPT는 모호한 AI 도구에서 100월에 XNUMX억 명의 월간 활성 사용자에 도달하여 역사상 가장 빠르게 성장하는 소비자 애플리케이션이 되었습니다. ChatGPT의 갑작스러운 성공은 Google, Baidu 및 Alibaba를 포함한 다른 기술 회사에 자체 ChatGPT와 유사한 도구를 출시하도록 더 많은 압력을 가했습니다.

3년 전 OpenAI는 수요에 따라 인간과 유사한 텍스트를 생성하기 위해 딥 러닝을 사용하는 자동 회귀 언어 예측 모델인 Generative Pre-trained Transformer 3(일반적으로 GPT-XNUMX으로 알려짐)를 출시하여 세상을 놀라게 했습니다.

OpenAI 최초로 기술된 GPT-3 2020년 175월에 발표된 연구 논문에서. 800GB의 스토리지가 필요한 무려 3억 개의 훈련 가능한 매개변수를 갖춘 GPT-3는 지금까지 가장 강력한 언어 모델로 불립니다. 그 이후로 GPT-XNUMX는 다음과 같은 AI 콘텐츠 플랫폼의 기본 백본 역할을 했습니다. 재스퍼.AI, 크리에이터가 독창적인 콘텐츠와 이미지를 사람보다 10배 빠르게 만들 수 있습니다.

GPT(Generative Pre-training Transformer)는 OpenAI에서 개발한 일종의 언어 모델입니다. 그것은 앞에 오는 단어를 기반으로 시퀀스에서 다음 단어를 예측하여 인간과 유사한 텍스트를 생성하도록 훈련된 신경망 기반 모델입니다. ChatGPT 및 기타 생성 AI 도구는 대규모 언어 모델(LLM) 기술을 사용하여 채팅과 같은 또는 대화 스타일로 텍스트를 생성합니다.

OpenAI ChatGPT의 인기는 이제 생성적 인공 지능(AI) 채택의 붐으로 이어졌으며 대기업과 소규모 신생 기업 모두 이를 제품에 통합하기 위해 경쟁하고 있습니다. ChatGPT는 XNUMX월에 출시된 이후 쓰기 능력, 소프트웨어 코딩, 복잡한 작업 처리 능력 및 사용 편의성으로 많은 전문가들에게 깊은 인상을 남겼습니다.

OpenAI는 새로운 모델이 사실적으로 오답을 적게 생성할 것이며 경우에 따라 많은 표준화된 테스트에서 인간보다 더 잘 수행할 것이라고 말합니다. 그러나 OpenAI는 새로운 소프트웨어가 가능성을 보여주지만 완벽하지는 않으며 여러 시나리오에서 인간의 능력에 미치지 못한다고 경고합니다.

소프트웨어의 중요한 문제는 조작된 정보를 생성하는 경향을 나타내는 "환각"입니다. 또한 소프트웨어는 사실의 정확성 측면에서 일관되게 신뢰할 수 없으며 잘못된 것으로 판명된 경우에도 계속해서 정확성을 주장할 수 있습니다.

GPT-4는 사회적 편견, 환각, 적대적 프롬프트 등 우리가 해결하기 위해 노력하고 있는 많은 알려진 한계를 여전히 가지고 있습니다.

“평범한 대화에서 GPT-3.5와 GPT-4의 차이는 미묘할 수 있습니다. 작업의 복잡성이 충분한 임계값에 도달하면 차이가 나타납니다. GPT-4는 GPT-3.5보다 더 안정적이고 창의적이며 훨씬 더 미묘한 지침을 처리할 수 있습니다.”라고 OpenAI는 덧붙였습니다.


타임 스탬프 :

더보기 테크스타트업