당신은 그들에게 관심이 있습니까? OFFERS? 쿠폰을 사용하여 저장하세요 WHATSAPP o 전보!

신경망 훈련을 방해하는 큰 문제가 있습니다

4월 2 2024

역동적인 세계에서지성 인공, 선도적인 기술 기업은 혁신 속도를 늦출 수 있는 예상치 못한 과제에 직면해 있습니다. 데이터 찾기 어려움 모델 학습 품질이 우수합니다. 이러한 데이터 부족은 다음과 같은 첨단 기술 개발에 영향을 미치고 있습니다. GPT-5, Microsoft 및 OpenAI와 같은 기업은 이러한 장애물을 극복하기 위해 혁신적인 솔루션을 모색합니다.

AI 훈련 과제: 데이터에 대한 갈망이 있어 진행 속도가 느려집니다.

전례 없는 컴퓨팅 성능의 증가와 머신러닝 기술의 발전으로 특징지어지는 시대에 OpenAI와 그 동류는 다음과 같은 과제에 직면해 있습니다. 역설: 풍부한 온라인 데이터가 자동으로 AI 훈련에 사용 가능한 리소스로 변환되지 않습니다. 그만큼 정확한 데이터가 필요하다특히 계획된 GPT-5와 같이 점점 더 복잡해지는 모델을 교육하는 경우에는 관련성과 최신성이 그 어느 때보다 중요합니다.

GPT-4에서 GPT-5로의 전환은 데이터 수요의 기하급수적인 증가를 보여줍니다. 전자는 "단지" 12조 개의 토큰이 필요했지만 후임자에 대한 추정치는 대략 비슷합니다. 60~100조. 고품질 데이터의 가용성과 필요성 사이의 불일치는 상당한 장애물로 나타납니다. 10조에서 20조 개의 토큰이 부족할 수 있음.

이러한 품질 데이터 부족은 AI 발전의 실질적인 병목 현상으로 이어집니다. 웹에 널리 퍼져 있는 오래되거나 품질이 낮은 데이터는 심각한 문제를 나타냅니다. 머신러닝의 효율성 한계. 또한 대규모 플랫폼의 데이터 액세스로 인한 제한은 문제를 더욱 악화시킬 뿐이며 교육에 사용할 수 있는 리소스를 더욱 제한합니다. 언어 모델.

이러한 과제에 대응하여 채택된 전략은 기술 혁신부터 전략적 파트너십까지 다양합니다. 예를 들어 OpenAI는Whispe 음성 인식 도구를 통해 오디오 및 비디오 데이터 사용r, 사용 가능한 데이터 풀을 확장하기 위해. 동시에 회사는 다음과 같은 가능성을 탐색합니다. 합성 데이터 생성 기존의 격차를 메울 수 있는 품질입니다.