당신은 그들에게 관심이 있습니까? OFFERS? 쿠폰을 사용하여 저장하세요 WHATSAPP o 전보!

ChatGPT 및 Bard 탈옥이 가능하고 쉽습니다.

12월 29 2023

의 진화 언어 모델 큰 차원의 기술은 의사소통과 인공지능 분야에 새로운 지평을 열었지만 중대한 과제와 윤리적 문제를 가져왔습니다. 최근 연구 싱가포르 난양 기술 대학교 에스플로라 새로운 알고리즘, 마스터키, "탈옥"하거나 다음과 같은 다른 신경망에 부과된 제한을 극복하도록 설계되었습니다. ChatGPT e 구글 음유 시인, 인공 지능 기술 사용에 있어 안전과 윤리에 관한 중요한 질문을 제기합니다.

ChatGPT 및 Bard와 같은 챗봇의 보안을 연구하는 Masterkey의 혁신적이고 간단한 접근 방식

최근 싱가포르 난양기술대학교(Nanyang Technological University)에서 실시한 연구에서는 이러한 한계를 해결하고 극복하기 위한 혁신적인 접근 방식이 도입되었습니다. Masterkey로 알려진 알고리즘은 다음과 같이 설계되었습니다. 정교한 탈옥 기술을 통해 다른 신경망에 부과된 제한을 우회합니다. (Apple 생태계에서 사용되는 용어). 이는 기존 언어 모델의 잠재적인 취약성을 강조할 뿐만 아니라 보안과 효율성을 향상시킬 수 있는 새로운 방법의 길을 열어줍니다.

Masterkey는 다음을 통해 작동합니다. 특정 문자 요청이는 ChatGPT와 같은 모델이 비윤리적인 것으로 간주되는 방식으로 통신하거나 보안 필터를 우회하는 등 예상치 못한 방식으로 작동하도록 할 수 있습니다. 이러한 탈옥 기술은 모델을 테스트하고 강화하는 데 유리해 보일 수도 있지만 양날의 검, 악의적인 목적으로 사용될 수 있기 때문입니다.

연구팀 그는 분석했다 특히 다국어 인지 부하, 가려진 표현 및 인과관계 추론에 직면했을 때 언어 모델의 보안 취약성. 이러한 공격은, 인지과부하'로 정의된다., 모델 아키텍처에 대한 심층적인 지식이나 수행할 가중치에 대한 액세스가 필요하지 않기 때문에 특히 교활하므로 효과적인 블랙박스 공격이 가능합니다.

또한 읽기 : ChatGPT에서 더 나은 응답을 얻는 방법: 완벽한 팁 방법

구체적으로 연구팀은 다음과 같은 전략을 채택했다. 리버스 엔지니어링 인공지능 시스템의 방어를 완전히 이해하고 이를 극복할 수 있는 혁신적인 방법을 개발합니다. 이 접근 방식의 결과는 다음을 위해 설계된 일종의 프레임워크인 모델인 “Masterkey”였습니다. 보안 메커니즘을 우회하는 프롬프트를 자동으로 생성.

결과는 상당했습니다. Masterkey에 의해 생성된 프롬프트는 다음과 같은 비율을 보여주었습니다. 평균 성공률 21,58%, 기존 방식의 7,33%보다 훨씬 높다. 그들의 기술의 예에는 추가가 포함됩니다. 키워드 감지 시스템을 피하기 위해 문자 사이에 추가 공백 ChatGPT 및 Bard에서. 대규모 언어 모델의 복잡성을 생각해보면 정말 "어리석은" 전략입니다.

이러한 결과에 직면하여 이러한 공격에 저항하기 위해 언어 모델을 어떻게 개선할 수 있는지뿐만 아니라 다음의 중요성도 고려하는 것이 중요합니다. 인공지능 사용에 대한 윤리적 규제. 이 연구는 기술 발전이 사회의 영향 관리 능력을 앞지르지 않도록 하기 위해 보다 강력한 방어 전략과 개발자, 연구원 및 정책 입안자 간의 지속적인 대화의 시급성을 강조합니다.