- 총 세 가지 탈옥 기법 통해 딥시크에서 데이터 탈취 도구 개발, 키로거(keylogger) 생성, 발화 장치 제작 등과 관련된 유해한 콘텐츠를 생성하며 보안 취약점 발견

 

팔로알토 네트웍스, ‘딥시크’ 보안 취약점 발견…“안전한 AI 활용 위해 AI에 특화된 보안 솔루션 필요”.PNG

팔로알토 네트웍스(Palo Alto Networks)는 위협 연구 기관 유닛42(Unit42)’의 조사를 바탕으로 딥시크가 탈옥(jailbreaking)’ 공격에 취약하며, 전문 지식이나 경험이 없는 사용자도 악성 콘텐츠를 생성할 수 있다는 조사 결과를 발표했다.

 

팔로알토 네트웍스의 유닛42 연구진은 딥시크가 악성 소프트웨어 생성, 악의적인 스크립팅 등 유해한 콘텐츠를 생성할 수 있는 가능성을 우려하여 총 세 가지 탈옥 기법을 통해 취약점을 집중적으로 테스트했다.

 

이번 연구에는 디셉티브 딜라이트(Deceptive Delight)’, ‘배드 리커트 저지(Bad Likert Judge)’, ‘크레센도(Crescendo)’ 등의 단일 또는 다단계 탈옥 기법이 활용되었으며, 딥시크의 가드레일을 성공적으로 우회하여 데이터 탈취 도구 개발, 키로거(keylogger) 생성, 발화 장치 제작 등과 관련된 유해한 콘텐츠를 생성했다. 탈옥은 AI 모델에 내장된 가드레일을 우회하여 AI가 유해한 콘텐츠를 생성하거나 부적절한 답변 등을 출력하도록 유도하는 행위를 의미한다. 이를 통해 누구나 허위 정보 또는 조작된 콘텐츠를 확산하거나 범죄 행위 등에 악용할 수 있다.

 

유닛42는 연구 과정에서 딥시크의 초기 응답은 대체적으로 무해했으나 정교하게 설계된 프롬프트를 단계적으로 입력했을 때 높은 우회 및 탈옥 성공률을 보이며 딥시크의 보안 취약점이 드러났으며, 이번 연구에 활용된 세 가지 탈옥 기법이 성공적으로 작동한 것은 아직 발견되지 않은 다른 새로운 탈옥 기법들이 있을 수 있음을 시사한다고 언급했다.

 

특정 LLM에 대한 모든 탈옥 기법을 완벽히 차단하는 것은 어려울 수 있지만, 기업의 LLM 활용에 있어서 적절한 가이드라인 설정 및 승인되지 않은 제3LLM 활용에 대한 모니터링 강화 등의 보안 대책이 필요하다.

 

팔로알토 네트웍스는 프리시전 AI(Precision AI) 기반 보안 솔루션 포트폴리오를 통해 기업이 생성형 AI 애플리케이션 사용으로 인한 위험을 차단하는 동시에 AI 혁신을 가속화할 수 있도록 지원한다. 또한, 유닛42가 제공하는 AI 보안 평가를 통해 기업은 보안을 강화하고 비즈니스 생산성을 향상시킬 수 있다.

 

팔로알토 네트웍스는 이번 유닛42의 연구 결과를 사이버위협연합(CTA) 회원사들과 공유했으며, 향후에도 기업들이 신속한 보안 조치를 적용하고 사이버 범죄 피해를 체계적으로 방지할 수 있도록 지원할 예정이다.

 

팔로알토 네트웍스 유닛42 일본·아시아·태평양(JAPAC) 부사장 필리파 콕스웰(Philippa Cogswell)이번 딥시크를 대상으로 연구를 진행한 결과, LLM이 의도한 대로 작동한다고 신뢰할 수 없으며, 조작 가능하다는 사실을 확인했다. 기업들은 오픈소스 LLM을 비즈니스 프로세스에 도입할 때 이러한 취약점을 반드시 고려해야 하며, LLM의 보호 장치가 무력화될 가능성을 염두에 두고 조직 차원의 보완책을 마련해야 한다고 강조했다.

 

또한 기업들이 LLM 모델을 적극 활용하는 것과 동시에, 사이버 공격자들도 이를 악용해 공격의 속도, 규모, 정교함을 높일 가능성이 크다. 이미 국가 지원 해커들이 오픈AI와 제미나이를 활용해 공격을 수행하고, 피싱 기법을 정교화하며, 악성코드를 개발하는 사례가 확인됐다. 향후 공격자들은 AI LLM 기술을 더욱 정교하게 발전시키고, 궁극적으로 AI 기반 공격 에이전트까지 개발할 것으로 예상된다고 경고했다.

 

#팔로알토네트웍스#AI#LLM#탈옥#바이패스#

 
 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
3902 MSI, ‘지포스 RTX 5080/5070 벤투스 화이트’ 출시 file newsit 2025.03.13 168
3901 티피링크, <SECON 2025> 참가…“차세대 통합 보안 감시 솔루션 공개” file newsit 2025.03.13 154
3900 TI, 세계에서 가장 작은 MCU 출시…“초소형 애플리케이션에서 혁신 실현” file newsit 2025.03.13 281
3899 티맥스티베로, 차세대 DB어플라이언스 ‘ZetaData7’ 공개 및 GS인증 1등급 획득 file newsit 2025.03.13 521
3898 세일즈포스, ‘2025 에이전트포스 파트너 서밋’ 성료…“동반성장 견인할 AI 생태계 구축 목표” file newsit 2025.03.13 424
3897 샥즈, ‘2025 서울마라톤’에서 최신 오픈형 이어폰 체험 부스 운영 file newsit 2025.03.13 147
3896 포티넷, ‘OT 보안 플랫폼’ 업데이트 공개…“중요 인프라 보호 강화” file newsit 2025.03.13 174
3895 하이크비전, 산업 보안 국제표준 ‘IEC 62443-4-1’ 인증 획득 file newsit 2025.03.13 183
3894 IAR, 임베디드 월드 2025에서 클라우드 기반 최신 플랫폼 서비스 공개 file newsit 2025.03.12 290
3893 온세미, 업계 최초 실시간 iToF센서 ‘하이퍼럭스 ID’ 제품군 출시 file newsit 2025.03.12 274
3892 NXP, S32K5 차량용 MCU 제품군 출시…“자동차 업계 최초 MRAM 탑재” file newsit 2025.03.12 256
3891 알리바바 클라우드, 혁신적인 '3단계 분리 아키텍처'로 TPC-C 벤치마크 세계 신기록 달성 file newsit 2025.03.12 441
3890 퓨어스토리지, '플래시블레이드//EXA' 공개…“AI·고성능 컴퓨팅 위한 업계 최강 데이터 스토리지 플랫폼” file newsit 2025.03.12 137
3889 미르, 모바일 로봇간 상호 운용성 지원 어댑터 MiR VDA 5050 출시…“브랜드 상관없이 상호 연결과 유연한 자동화 확보“ file newsit 2025.03.12 707
3888 카스퍼스키, 정보탈취 ‘인포스틸러 악성코드 위협 현황 보고서’ 발표…“다크웹에 230만개 은행카드 유출 확인” file newsit 2025.03.12 175
3887 와콤, 완전히 새로워진 ‘와콤 인튜어스 프로(2025)’ 국내 출시 file newsit 2025.03.12 155
3886 로지텍, 게이밍 마우스용 무선 충전 시스템 ‘POWERPLAY 2’ 출시 file newsit 2025.03.12 177
3885 누보톤, 48V 배터리 모니터링 IC ‘KA49701A/KA49702A’ 양산 발표 file newsit 2025.03.12 499
3884 델, ‘델 테크놀로지스 생성형AI 메가 런치’ 행사 개최 file newsit 2025.03.12 743
3883 ADI, ‘CodeFusion Studio’ 솔루션 확장 버전 발표…“제품 개발 가속화 및 데이터 보안 보장” file newsit 2025.03.12 475
Board Pagination Prev 1 ... 83 84 85 86 87 88 89 90 91 92 ... 283 Next
/ 283
CLOSE