- 총 세 가지 탈옥 기법 통해 딥시크에서 데이터 탈취 도구 개발, 키로거(keylogger) 생성, 발화 장치 제작 등과 관련된 유해한 콘텐츠를 생성하며 보안 취약점 발견

 

팔로알토 네트웍스, ‘딥시크’ 보안 취약점 발견…“안전한 AI 활용 위해 AI에 특화된 보안 솔루션 필요”.PNG

팔로알토 네트웍스(Palo Alto Networks)는 위협 연구 기관 유닛42(Unit42)’의 조사를 바탕으로 딥시크가 탈옥(jailbreaking)’ 공격에 취약하며, 전문 지식이나 경험이 없는 사용자도 악성 콘텐츠를 생성할 수 있다는 조사 결과를 발표했다.

 

팔로알토 네트웍스의 유닛42 연구진은 딥시크가 악성 소프트웨어 생성, 악의적인 스크립팅 등 유해한 콘텐츠를 생성할 수 있는 가능성을 우려하여 총 세 가지 탈옥 기법을 통해 취약점을 집중적으로 테스트했다.

 

이번 연구에는 디셉티브 딜라이트(Deceptive Delight)’, ‘배드 리커트 저지(Bad Likert Judge)’, ‘크레센도(Crescendo)’ 등의 단일 또는 다단계 탈옥 기법이 활용되었으며, 딥시크의 가드레일을 성공적으로 우회하여 데이터 탈취 도구 개발, 키로거(keylogger) 생성, 발화 장치 제작 등과 관련된 유해한 콘텐츠를 생성했다. 탈옥은 AI 모델에 내장된 가드레일을 우회하여 AI가 유해한 콘텐츠를 생성하거나 부적절한 답변 등을 출력하도록 유도하는 행위를 의미한다. 이를 통해 누구나 허위 정보 또는 조작된 콘텐츠를 확산하거나 범죄 행위 등에 악용할 수 있다.

 

유닛42는 연구 과정에서 딥시크의 초기 응답은 대체적으로 무해했으나 정교하게 설계된 프롬프트를 단계적으로 입력했을 때 높은 우회 및 탈옥 성공률을 보이며 딥시크의 보안 취약점이 드러났으며, 이번 연구에 활용된 세 가지 탈옥 기법이 성공적으로 작동한 것은 아직 발견되지 않은 다른 새로운 탈옥 기법들이 있을 수 있음을 시사한다고 언급했다.

 

특정 LLM에 대한 모든 탈옥 기법을 완벽히 차단하는 것은 어려울 수 있지만, 기업의 LLM 활용에 있어서 적절한 가이드라인 설정 및 승인되지 않은 제3LLM 활용에 대한 모니터링 강화 등의 보안 대책이 필요하다.

 

팔로알토 네트웍스는 프리시전 AI(Precision AI) 기반 보안 솔루션 포트폴리오를 통해 기업이 생성형 AI 애플리케이션 사용으로 인한 위험을 차단하는 동시에 AI 혁신을 가속화할 수 있도록 지원한다. 또한, 유닛42가 제공하는 AI 보안 평가를 통해 기업은 보안을 강화하고 비즈니스 생산성을 향상시킬 수 있다.

 

팔로알토 네트웍스는 이번 유닛42의 연구 결과를 사이버위협연합(CTA) 회원사들과 공유했으며, 향후에도 기업들이 신속한 보안 조치를 적용하고 사이버 범죄 피해를 체계적으로 방지할 수 있도록 지원할 예정이다.

 

팔로알토 네트웍스 유닛42 일본·아시아·태평양(JAPAC) 부사장 필리파 콕스웰(Philippa Cogswell)이번 딥시크를 대상으로 연구를 진행한 결과, LLM이 의도한 대로 작동한다고 신뢰할 수 없으며, 조작 가능하다는 사실을 확인했다. 기업들은 오픈소스 LLM을 비즈니스 프로세스에 도입할 때 이러한 취약점을 반드시 고려해야 하며, LLM의 보호 장치가 무력화될 가능성을 염두에 두고 조직 차원의 보완책을 마련해야 한다고 강조했다.

 

또한 기업들이 LLM 모델을 적극 활용하는 것과 동시에, 사이버 공격자들도 이를 악용해 공격의 속도, 규모, 정교함을 높일 가능성이 크다. 이미 국가 지원 해커들이 오픈AI와 제미나이를 활용해 공격을 수행하고, 피싱 기법을 정교화하며, 악성코드를 개발하는 사례가 확인됐다. 향후 공격자들은 AI LLM 기술을 더욱 정교하게 발전시키고, 궁극적으로 AI 기반 공격 에이전트까지 개발할 것으로 예상된다고 경고했다.

 

#팔로알토네트웍스#AI#LLM#탈옥#바이패스#

 
 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
3798 IAR, 제퍼(Zephyr) 프로젝트에 실버 멤버로 참여…“오픈소스 협업에 대한 의지 재확인” file newsit 2025.02.17 244
3797 지멘스, 일본 이화학연구소(RIKEN)에 에뮬레이션 및 상위수준 합성(HLS) 플랫폼 공급 file newsit 2025.02.17 264
3796 캐논코리아, “국내 잉크젯 프린터 전체 시장 점유율 2년 연속 1위” file newsit 2025.02.17 124
» 팔로알토 네트웍스, ‘딥시크’ 보안 취약점 발견…“안전한 AI 활용 위해 AI에 특화된 보안 솔루션 필요” file newsit 2025.02.17 133
3794 MSI, ‘지포스 RTX 5080 게이밍 트리오 OC 화이트’ 출시 file newsit 2025.02.14 113
3793 어플라이드 머티어리얼즈, 2025년 1분기 실적 발표…“매출 71억7000만 달러,전년 동기 대비 7% 증가” file newsit 2025.02.14 288
3792 마우저, 노르딕 세미컨덕터의 「nRF54L15-DK」 개발 키트 공급…“무선 기기의 신속한 프로토타이핑 지원” file newsit 2025.02.14 188
3791 타포, 2K 고화질 현관 비디오 도어벨 「Tapo D210」 출시 file newsit 2025.02.14 140
3790 지멘스, 컴퓨트 마리타임과 협력…“생성형 AI 활용한 선박 설계 혁신” file newsit 2025.02.14 280
3789 테스토코리아, 산업용 내시경 카메라 ‘testo 318’ 발표…“보일러 및 환기 시스템 검사” file newsit 2025.02.14 184
3788 카스퍼스키, 2024년 ‘스토킹 방지 인식 가이드’ 발표…디지털 관계 ‘배려과 통제 구별법’ 소개 file newsit 2025.02.14 141
3787 라바웨이브-법무법인 이유, 디지털 범죄 피해자 법률지원 강화 업무협약 체결 file newsit 2025.02.14 340
3786 스파이런트, ‘5G 전망보고서’ 발표…“5G 시대 후반전 돌입” file newsit 2025.02.13 106
3785 와콤, 플래그십 펜 타블렛 새로운 인튜어스 프로 발표…“탁월한 워크플로우 제공” file newsit 2025.02.13 109
3784 다쏘시스템, 제품수명주기관리(PLM) 컨설팅사 피앤피어드바이저리와 전략적 파트너십 체결 file newsit 2025.02.13 317
3783 ST, 하이텍 EDV 시스템과 SDV 구현 협력 file newsit 2025.02.13 218
3782 마우저, ADI의 AD-GMSL2ETH-SL 엣지 컴퓨팅 플랫폼 공급…“자율로봇 및 자율주행차량의 머신 비전용” file newsit 2025.02.13 209
3781 HPE, 보안∙AI 자동화∙고성능의 차세대 프로라이언트 컴퓨트 G12 서버 출시 file newsit 2025.02.13 100
3780 가민, 올인원 다이빙 컴퓨터 ‘디센트 G2’ 출시 file newsit 2025.02.13 135
3779 티맥스소프트, 강화된 ‘하이퍼프레임 매니저’ 발표…“안전하고 간편한 오픈소스 관리 지원” file newsit 2025.02.13 372
Board Pagination Prev 1 ... 72 73 74 75 76 77 78 79 80 81 ... 266 Next
/ 266
CLOSE