당신은 그들에게 관심이 있습니까? OFFERS? 쿠폰을 사용하여 저장하세요 WHATSAPP o 전보!

ChatGPT는 이제 보고 듣고 말할 수 있는 도우미입니다.

25 9월 2023

ChatGPTOpenAI가 개발한 는 음성과 이미지를 통해 상호 작용할 수 있는 새로운 기능을 도입하여 직관적인 인터페이스와 ChatGPT를 일상 생활에 통합할 수 있는 더 많은 방법을 제공합니다. OpenAI는 최근 자사 웹사이트를 통해 이러한 새로운 기능을 미리 공개하기로 결정했습니다. 마찬가지로 그는 성장하는 AI 시장에서 이들이 가져오는 이점과 과제에 대해서도 강조했습니다.

이 문서의 주제:

ChatGPT: 음성 상호작용

새로운 음성 기능을 통해 사용자는 ChatGPT와의 대화형 대화. 이를 통해 이동 중에도 어시스턴트를 사용할 수 있어 챗봇의 잠재력이 높아집니다. 예를 들어, 사용자는 이동 중에도 ChatGPT에 동화 이야기를 들려달라고 요청하여 더욱 즐겁게 만들 수 있습니다.

챗봇이 만들어가는 이야기

또는 친구들과의 저녁 식사 중에 특정 주제에 대한 토론이 나타날 수도 있습니다. 이 경우 사용자는 봇을 사용하여 정확한 정보를 얻고 토론을 건설적으로 해결할 수 있습니다.

ChatGPT의 음성 기술은 고급 텍스트 음성 변환 모델. 전문 성우와의 협력을 통해 이 모델은 텍스트와 짧은 음성 샘플에서 인간형 오디오를 생성할 수 있어 ChatGPT와의 상호 작용이 더욱 자연스럽고 직관적이게 됩니다. 또한 덕분에 속삭임OpenAI가 개발한 오픈소스 음성 인식 시스템인 음성 단어는 매우 정밀하게 텍스트로 옮겨졌습니다., 챗봇이 사용자 요청을 효과적으로 이해하고 응답할 수 있도록 합니다.

ChatGPT: 시각적 상호작용

위와 같이 AI 모델은 이제 하나 이상의 이미지 분석, 사용자는 문제를 해결하고, 식사를 계획하고, 복잡한 그래프를 분석할 수 있습니다. 예를 들어 사용자는 냉장고 내용물의 사진을 제출할 수 있습니다. 따라서 챗봇을 사용해야 합니다. 존재하는 음식을 분석하고 이러한 재료를 기반으로 요리법을 제안합니다. 또한 준비를 위한 단계별 지침도 제공합니다.

또한 읽기 : GPT-4: 제미니는 구글의 라이벌이 될 것이다. 차이점은 다음과 같습니다.

또한, 사용자가 이미지의 특정 요소에 집중해야 하는 경우, ChatGPT의 모바일 앱에는 그리기 도구가 포함되어 있습니다. 이를 통해 이미지의 특정 영역을 강조할 수 있어 의사소통과 분석이 더욱 정확하고 개인화될 수 있습니다.

이미지 이해는 GPT-3.5 및 GPT-4 다중 모드 모델을 통해 제공됩니다. 이러한 고급 모델 사진, 스크린샷, 문서 등 다양한 이미지에 자신의 언어 능력을 적용합니다. 텍스트와 이미지가 모두 포함되어 ChatGPT가 시각적 컨텍스트를 정확하고 자세하게 이해하고 해석할 수 있습니다.

다음부터 언급할 가치가 있습니다. poco OpenAI는 그뿐만 아니라 Canva 뿐만 아니라 ChatGPT의 DALL-E 3, 또는 생성 이미지 모델.