- 총 세 가지 탈옥 기법 통해 딥시크에서 데이터 탈취 도구 개발, 키로거(keylogger) 생성, 발화 장치 제작 등과 관련된 유해한 콘텐츠를 생성하며 보안 취약점 발견

 

팔로알토 네트웍스, ‘딥시크’ 보안 취약점 발견…“안전한 AI 활용 위해 AI에 특화된 보안 솔루션 필요”.PNG

팔로알토 네트웍스(Palo Alto Networks)는 위협 연구 기관 유닛42(Unit42)’의 조사를 바탕으로 딥시크가 탈옥(jailbreaking)’ 공격에 취약하며, 전문 지식이나 경험이 없는 사용자도 악성 콘텐츠를 생성할 수 있다는 조사 결과를 발표했다.

 

팔로알토 네트웍스의 유닛42 연구진은 딥시크가 악성 소프트웨어 생성, 악의적인 스크립팅 등 유해한 콘텐츠를 생성할 수 있는 가능성을 우려하여 총 세 가지 탈옥 기법을 통해 취약점을 집중적으로 테스트했다.

 

이번 연구에는 디셉티브 딜라이트(Deceptive Delight)’, ‘배드 리커트 저지(Bad Likert Judge)’, ‘크레센도(Crescendo)’ 등의 단일 또는 다단계 탈옥 기법이 활용되었으며, 딥시크의 가드레일을 성공적으로 우회하여 데이터 탈취 도구 개발, 키로거(keylogger) 생성, 발화 장치 제작 등과 관련된 유해한 콘텐츠를 생성했다. 탈옥은 AI 모델에 내장된 가드레일을 우회하여 AI가 유해한 콘텐츠를 생성하거나 부적절한 답변 등을 출력하도록 유도하는 행위를 의미한다. 이를 통해 누구나 허위 정보 또는 조작된 콘텐츠를 확산하거나 범죄 행위 등에 악용할 수 있다.

 

유닛42는 연구 과정에서 딥시크의 초기 응답은 대체적으로 무해했으나 정교하게 설계된 프롬프트를 단계적으로 입력했을 때 높은 우회 및 탈옥 성공률을 보이며 딥시크의 보안 취약점이 드러났으며, 이번 연구에 활용된 세 가지 탈옥 기법이 성공적으로 작동한 것은 아직 발견되지 않은 다른 새로운 탈옥 기법들이 있을 수 있음을 시사한다고 언급했다.

 

특정 LLM에 대한 모든 탈옥 기법을 완벽히 차단하는 것은 어려울 수 있지만, 기업의 LLM 활용에 있어서 적절한 가이드라인 설정 및 승인되지 않은 제3LLM 활용에 대한 모니터링 강화 등의 보안 대책이 필요하다.

 

팔로알토 네트웍스는 프리시전 AI(Precision AI) 기반 보안 솔루션 포트폴리오를 통해 기업이 생성형 AI 애플리케이션 사용으로 인한 위험을 차단하는 동시에 AI 혁신을 가속화할 수 있도록 지원한다. 또한, 유닛42가 제공하는 AI 보안 평가를 통해 기업은 보안을 강화하고 비즈니스 생산성을 향상시킬 수 있다.

 

팔로알토 네트웍스는 이번 유닛42의 연구 결과를 사이버위협연합(CTA) 회원사들과 공유했으며, 향후에도 기업들이 신속한 보안 조치를 적용하고 사이버 범죄 피해를 체계적으로 방지할 수 있도록 지원할 예정이다.

 

팔로알토 네트웍스 유닛42 일본·아시아·태평양(JAPAC) 부사장 필리파 콕스웰(Philippa Cogswell)이번 딥시크를 대상으로 연구를 진행한 결과, LLM이 의도한 대로 작동한다고 신뢰할 수 없으며, 조작 가능하다는 사실을 확인했다. 기업들은 오픈소스 LLM을 비즈니스 프로세스에 도입할 때 이러한 취약점을 반드시 고려해야 하며, LLM의 보호 장치가 무력화될 가능성을 염두에 두고 조직 차원의 보완책을 마련해야 한다고 강조했다.

 

또한 기업들이 LLM 모델을 적극 활용하는 것과 동시에, 사이버 공격자들도 이를 악용해 공격의 속도, 규모, 정교함을 높일 가능성이 크다. 이미 국가 지원 해커들이 오픈AI와 제미나이를 활용해 공격을 수행하고, 피싱 기법을 정교화하며, 악성코드를 개발하는 사례가 확인됐다. 향후 공격자들은 AI LLM 기술을 더욱 정교하게 발전시키고, 궁극적으로 AI 기반 공격 에이전트까지 개발할 것으로 예상된다고 경고했다.

 

#팔로알토네트웍스#AI#LLM#탈옥#바이패스#

 
 
?

  1. 하이크비전, 국제 사이버 보안 제품 인증 획득…“IoT 기기 보안 최고 권위 인정”

    - IoT 제품의 보안 및 규정 준수 노력으로 ‘ETSI EN 303 645’ 및 ‘EN 18031’ 인증 하이크비전이 글로벌 인증 기관인 '뷰로 베리타스(Bureau Veritas)'에서 수여하는 국제 사이버 보안 표준 ‘ETSI EN 303 645’과 ‘EN 18031’ 인증을 획득했다고 밝혔다. ETSI EN ...
    Date2025.04.23 Bynewsit Views236
    Read More
  2. 네티스, 와이파이6 공유기 2종 한정수량 특가 이벤트

    네트워크 전문기업 넷유가 와이파이6 공유기 2종 특가 이벤트를 진행한다고 밝혔다. 네티스의 스테디셀러 제품 ‘netis MEX605’를 포함한 와이파이6(802.11AX)공유기 2종(MEX605,MEX601)을 쿠팡(www.coupang.com) 사이트에서 각 모델 별 500대 한정수량으로 4월...
    Date2025.04.22 Bynewsit Views210
    Read More
  3. 카스퍼스키, 전년 대비 매출이 11% 증가…역대 최고인 8억 2,200만 달러 실적 기록

    카스퍼스키는 오늘 2024년 재무 실적을 발표하고, 전년 대비 매출이 11% 증가하여 역대 최고인 8억 2,200만 달러를 기록했다고 밝혔다. 2024년에 카스퍼스키는 솔루션 포트폴리오를 더욱 강화하여 비즈니스를 성장시켰다. 지정학적 이슈와 그에 따른 제약에도 ...
    Date2025.04.22 Bynewsit Views222
    Read More
  4. 안랩, 대만 ‘CYBERSEC 2025’서 현지 맞춤형 보안 솔루션 소개

    - 대만 최대 사이버 보안 포럼 ‘CYBERSEC 2025’서 ▲CPS 보안 제품군(AhnLab EPS/XTD/Xcanner) ▲안티 랜섬웨어 제품군(AhnLab EDR/MDS) 등 소개 안랩은 15일부터 17일까지 대만 타이베이 난강전람관에서 열린 사이버 보안 포럼 ‘CYBERSEC 2025’에 참가해 현지 ...
    Date2025.04.18 Bynewsit Views185
    Read More
  5. 카스퍼스키, 한국 온라인 뱅킹 사용자 대상 ‘숨니봇(SoumniBot)’ 멀웨어 발견

    - 한국 온라인 뱅킹 사용자를 대상으로 청첩장 링크를 클릭하면 숨니봇 멀웨어가 설치 - 개인 데이터 및 은행 디지털 인증서 등의 중요한 정보 훔쳐 카스퍼스키는 오늘 사이버 범죄자들이 인생에서 가장 소중한 기념일인 결혼식 청첩장을 악용하여 안드로이드 ...
    Date2025.04.18 Bynewsit Views191
    Read More
  6. KG ICT, 카스퍼스키와 총판 계약 체결

    - Kaspersky Threat Intelligence·OT 보안 시장 본격 진출 정보통신기술 전문기업 KG ICT가 글로벌 사이버 보안 기업 카스퍼스키와 손잡고 국내 기업용 보안 시장 확대에 나선다. KG ICT는 최근 카스퍼스키와 국내 총판 계약을 체결하고, 산업 전반에 걸친 차...
    Date2025.04.17 Bynewsit Views237
    Read More
  7. 마에스트로 포렌식, macOS 포렌식 솔루션 ‘마에스트로 위즈덤(MAESTRO WISDOM)’ 출시

    - 원격 환경에서도 macOS 기기의 디스크 이미징, 라이브 증거 데이터 수집, 디지털포렌식 조사와 악성코드 탐지 및 분석, 침해사고 대응과 분석 기능 수행 마에스트로 포렌식은 오늘, macOS 시스템 라이브 증거 데이터 추출, 원격 이미징, 침해사고 조사, 악성...
    Date2025.04.15 Bynewsit Views209
    Read More
  8. 안랩, 자체 구축 AI 플랫폼 ‘안랩 AI 플러스(AhnLab AI PLUS)’ 런칭

    -‘안랩 AI 플러스(AhnLab AI PLUS)’: 안랩이 30년간 축적한 위협 분석 데이터, 악성코드 및 침해 사고 대응 경험 등 방대한 보안 정보를 기반으로 개발한 자체 AI 플랫폼 안랩이 자체 구축 AI 플랫폼 ‘안랩 AI 플러스(AhnLab AI Plus)’를 런칭했다고 밝혔다. ‘...
    Date2025.04.15 Bynewsit Views240
    Read More
  9. 라바웨이브, ‘몸캠피싱 채널별 가해자 접근 패턴 분석 보고서’ 발표

    - SNS·랜덤채팅·성소수자 커뮤니티 등 다중 경로 접근- 랜덤 채팅 앱에서 2차 채팅 플랫폼으로 유인- 카카오톡, ‘추천 친구’ 기능 악용 - 영상통화로 협박 수법- 성소수자 커뮤니티 및 X(트위터)에서도 피해 잇달아 디지털 범죄 대응 전문기업 라바웨이브는 14...
    Date2025.04.15 Bynewsit Views209
    Read More
  10. 카스퍼스키, 보안관제센터 성숙도 측정 지표 ‘SOC-CMM’의 공인 ‘골드 서포트 파트너’ 선정

    - 거버넌스, 위협 인텔리전스, 제어, 사고 관리 및 복원력과 같은 주요 영역을 평가하기 위한 포괄적인 접근 방식 제공 카스퍼스키는 오늘, 자사가 보안관제센터(SOC) 성숙도를 측정하는 글로벌 표준 지표인 SOC-CMM의 ‘골드 서포트 파트너’로 지정되었으며, ...
    Date2025.04.09 Bynewsit Views227
    Read More
목록
Board Pagination Prev 1 ... 22 23 24 25 26 27 28 29 30 31 ... 85 Next
/ 85
CLOSE