- 총 세 가지 탈옥 기법 통해 딥시크에서 데이터 탈취 도구 개발, 키로거(keylogger) 생성, 발화 장치 제작 등과 관련된 유해한 콘텐츠를 생성하며 보안 취약점 발견

 

팔로알토 네트웍스, ‘딥시크’ 보안 취약점 발견…“안전한 AI 활용 위해 AI에 특화된 보안 솔루션 필요”.PNG

팔로알토 네트웍스(Palo Alto Networks)는 위협 연구 기관 유닛42(Unit42)’의 조사를 바탕으로 딥시크가 탈옥(jailbreaking)’ 공격에 취약하며, 전문 지식이나 경험이 없는 사용자도 악성 콘텐츠를 생성할 수 있다는 조사 결과를 발표했다.

 

팔로알토 네트웍스의 유닛42 연구진은 딥시크가 악성 소프트웨어 생성, 악의적인 스크립팅 등 유해한 콘텐츠를 생성할 수 있는 가능성을 우려하여 총 세 가지 탈옥 기법을 통해 취약점을 집중적으로 테스트했다.

 

이번 연구에는 디셉티브 딜라이트(Deceptive Delight)’, ‘배드 리커트 저지(Bad Likert Judge)’, ‘크레센도(Crescendo)’ 등의 단일 또는 다단계 탈옥 기법이 활용되었으며, 딥시크의 가드레일을 성공적으로 우회하여 데이터 탈취 도구 개발, 키로거(keylogger) 생성, 발화 장치 제작 등과 관련된 유해한 콘텐츠를 생성했다. 탈옥은 AI 모델에 내장된 가드레일을 우회하여 AI가 유해한 콘텐츠를 생성하거나 부적절한 답변 등을 출력하도록 유도하는 행위를 의미한다. 이를 통해 누구나 허위 정보 또는 조작된 콘텐츠를 확산하거나 범죄 행위 등에 악용할 수 있다.

 

유닛42는 연구 과정에서 딥시크의 초기 응답은 대체적으로 무해했으나 정교하게 설계된 프롬프트를 단계적으로 입력했을 때 높은 우회 및 탈옥 성공률을 보이며 딥시크의 보안 취약점이 드러났으며, 이번 연구에 활용된 세 가지 탈옥 기법이 성공적으로 작동한 것은 아직 발견되지 않은 다른 새로운 탈옥 기법들이 있을 수 있음을 시사한다고 언급했다.

 

특정 LLM에 대한 모든 탈옥 기법을 완벽히 차단하는 것은 어려울 수 있지만, 기업의 LLM 활용에 있어서 적절한 가이드라인 설정 및 승인되지 않은 제3LLM 활용에 대한 모니터링 강화 등의 보안 대책이 필요하다.

 

팔로알토 네트웍스는 프리시전 AI(Precision AI) 기반 보안 솔루션 포트폴리오를 통해 기업이 생성형 AI 애플리케이션 사용으로 인한 위험을 차단하는 동시에 AI 혁신을 가속화할 수 있도록 지원한다. 또한, 유닛42가 제공하는 AI 보안 평가를 통해 기업은 보안을 강화하고 비즈니스 생산성을 향상시킬 수 있다.

 

팔로알토 네트웍스는 이번 유닛42의 연구 결과를 사이버위협연합(CTA) 회원사들과 공유했으며, 향후에도 기업들이 신속한 보안 조치를 적용하고 사이버 범죄 피해를 체계적으로 방지할 수 있도록 지원할 예정이다.

 

팔로알토 네트웍스 유닛42 일본·아시아·태평양(JAPAC) 부사장 필리파 콕스웰(Philippa Cogswell)이번 딥시크를 대상으로 연구를 진행한 결과, LLM이 의도한 대로 작동한다고 신뢰할 수 없으며, 조작 가능하다는 사실을 확인했다. 기업들은 오픈소스 LLM을 비즈니스 프로세스에 도입할 때 이러한 취약점을 반드시 고려해야 하며, LLM의 보호 장치가 무력화될 가능성을 염두에 두고 조직 차원의 보완책을 마련해야 한다고 강조했다.

 

또한 기업들이 LLM 모델을 적극 활용하는 것과 동시에, 사이버 공격자들도 이를 악용해 공격의 속도, 규모, 정교함을 높일 가능성이 크다. 이미 국가 지원 해커들이 오픈AI와 제미나이를 활용해 공격을 수행하고, 피싱 기법을 정교화하며, 악성코드를 개발하는 사례가 확인됐다. 향후 공격자들은 AI LLM 기술을 더욱 정교하게 발전시키고, 궁극적으로 AI 기반 공격 에이전트까지 개발할 것으로 예상된다고 경고했다.

 

#팔로알토네트웍스#AI#LLM#탈옥#바이패스#

 
 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
3846 카테노이드, ‘코리아 나라장터 엑스포 2025’ 참가… 공공 부문 사업 강화 file newsit 2025.03.04 638
3845 가민, 스마트 골프 워치 ‘어프로치 S50’ 출시…“고급 GPS 기술과 4만 3000개 이상의 골프 코스 정보 내장” file newsit 2025.03.04 183
3844 티맥스소프트, 디지털 분야 시상식 '2024 앤어워드' 수상 file newsit 2025.03.04 533
3843 캐논, 전 세계 렌즈교환식 카메라 시장 점유율 22년 연속 1위 달성! file newsit 2025.03.04 147
3842 마우저, 마이크로칩 「EV42J24A」 평가 키트 공급…“신속한 ROT 솔루션 개발” file newsit 2025.03.04 253
3841 엘앤에프, “가족 친화적 따뜻한 기업문화 조성” file newsit 2025.02.28 383
3840 ST, 최신 STM32C0 MCU 3종 추가 출시…“엔트리 레벨 임베디드 개발 간소화” file newsit 2025.02.28 304
3839 한국레노버, 씽크패드 X1 시리즈 아우라 에디션 2종 출시…“AI로 업무 생산성 혁신” file newsit 2025.02.28 185
3838 쿤텍-비나텍, 글로벌 탄소 규제 공동 대응 MOU 체결 file newsit 2025.02.28 409
3837 카스퍼스키, 깃허브에서 멀웨어 ‘GitVenom’ 발견 file newsit 2025.02.28 154
3836 알리바바 클라우드, AI 기반 비디오 생성 모델 ‘Wan2.1’ 오픈소스 공개 file newsit 2025.02.28 423
3835 마우저-NXP, <최신 전기차를 위한 첨단 모터 제어 기술에 대한 11명의 전문가 제언> 전자책 발간 file newsit 2025.02.28 258
3834 A10 네트웍스, 보안 기업 ‘ThreatX Protect’ 인수 file newsit 2025.02.27 165
3833 라바웨이브-용인동부서, 몸캠피싱 미성년자 피해자 무상 지원 file newsit 2025.02.26 163
3832 딥엘, 솔트룩스이노베이션과 파트너십 체결…“국내 기업 다국어 커뮤니케이션 혁신 주도” file newsit 2025.02.26 346
3831 세일즈포스, “AI 모델 선택부터 환경 구축까지 고객 자율성 확대” file newsit 2025.02.26 388
3830 티맥스티베로, ‘코리아 나라장터 엑스포 2025’ 참가…“공공 DBMS 시장 경쟁력 뽐내” file newsit 2025.02.26 749
3829 캐논코리아, 캐논갤러리에서 'Project 8 : 풍경 사진의 모든 것' 전시회 개최 file newsit 2025.02.26 121
3828 MSI, 지포스 RTX 5090 벤투스 3X OC 그래픽카드 출시 file newsit 2025.02.26 149
3827 코보, ‘디지키’와 글로벌 유통 계약 발표 file newsit 2025.02.26 204
Board Pagination Prev 1 ... 78 79 80 81 82 83 84 85 86 87 ... 275 Next
/ 275
CLOSE