통신·보안·네트워크

2026.02.03 09:49

티오리, ‘AAAI 2026’ 논문 채택…윤리 편향 기반 LLM 탈옥 취약점 분석

newsit

https://hwlab.com/Network_security_comm/18751 조회 수 85 추천 수 0 댓글 0

Extra Form
참조#1	http://www.theori.io/

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

- 윤리적·사회적 편향이 대형 언어 모델 탈옥 취약점에 미치는 영향 규명

티오리, ‘AAAI 2026’ 논문 채택…윤리 편향 기반 LLM 탈옥 취약점 분석.png

사이버 보안 전문기업 티오리는 소속 연구원이 참여한 논문이 세계 최고 권위의 인공지능 학회 AAAI 2026 워크샵에 채택돼 연구 성과를 발표했다고 밝혔다. AAAI는 전 세계 연구기관과 기업 연구자들이 최신 인공지능 연구 결과를 공유하는 대표적 국제 학회다. AAAI 2026은 2026년 1월 20일부터 27일까지 싱가포르에서 열렸다.

윤리적 편향과 탈옥 취약점의 상관관계 분석

이번에 채택된 논문은 ‘BiasJailbreak: Analyzing Ethical Biases and Jailbreak Vulnerabilities in Large Language Models’로 대형 언어 모델(LLM)에 내재된 윤리적·사회적 편향이 탈옥(jailbreak) 공격 취약점에 미치는 영향을 실험적으로 분석했다.

연구팀은 LLM이 특정 편향 요소를 포함한 입력에 대해 서로 다른 안전 응답을 보인다는 점에 주목했다. 이를 바탕으로 윤리적 편향과 탈옥 공격 간 관계를 정량적으로 측정하는 분석 프레임워크 ‘BiasJailbreak’를 제안하고, 편향 기반 공격을 완화하기 위한 대응 방식으로 ‘BiasDefense’를 함께 제시했다.

LLM 보안 솔루션 설계에도 연구 성과 반영

해당 연구 결과는 티오리의 LLM 보안 솔루션 알파프리즘의 위험 탐지 기능 설계 과정에도 참고됐다. LLM의 윤리적 응답 특성이 공격에 악용되는 패턴을 분석하고, 편향 기반 입력에 대한 탐지·대응 모델을 설계하는 데 연구 내용을 적용했다.

논문 제1저자로 참여한 티오리 이이삭 연구원은 “LLM의 편향과 안전성 문제를 함께 살펴본 분석”이라며 “LLM 보안 연구와 논의 과정에서 하나의 참고 사례로 활용되길 기대한다”고 밝혔다.

오펜시브 보안 중심 기술력 확대

한편 티오리는 오펜시브 사이버보안 전문 기업으로, 구글, 마이크로소프트, 옥타, 삼성전자 등 국내외 주요 기업과 기관에 보안 컨설팅을 제공하고 있다.

또한 웹 애플리케이션 보안 자동화 솔루션 Xint(진트), 회원 7만 명 이상이 사용하는 사이버보안 교육 플랫폼 Dreamhack(드림핵)을 운영하며 실전 중심 보안 기술 생태계 확장에 주력하고 있다.

#티오리 #AAAI2026 #LLM보안 #AI윤리 #BiasJailbreak #알파프리즘 #사이버보안

Prev 카스퍼스키, HoneyMyte APT 진화 포착…공공·외교기관 정보 탈취 ...

카스퍼스키, HoneyMyte APT 진화 포착…공공·외교기관 정보 탈취 ... 2026.02.04by newsit 안랩클라우드메이트, 생성형 AI 데이터 보안 솔루션 ‘시큐어브리... Next

안랩클라우드메이트, 생성형 AI 데이터 보안 솔루션 ‘시큐어브리... 2026.02.02by newsit

Facebook Twitter Google Pinterest KakaoStory Band

Atachment
첨부 '1'	티오리, ‘AAAI 2026’ 논문 채택…윤리 편향 기반 LLM 탈옥 취약점 분석.png,

위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

✔댓글 쓰기

에디터 선택하기

✔ 텍스트 모드 ✔ 에디터 모드

댓글 쓰기

에디터 사용하기 닫기

통신·보안·네트워크

클라우드플레어, 2025년 4분기 DDoS 공격 전년 대비 121% 증가

- 연간 4,710만 건 공격 관측…네트워크 계층 DDoS 3배 이상 증가 글로벌 인터넷 보안 기업 클라우드플레어가 ‘2025년 4분기 DDoS 위협 보고서’를 통해 지난해 전 세계에서 관측된 분산서비스거부(DDoS) 공격이 전년 대비 121% 증가했다고 밝혔다. 네트워크 계...

Date2026.02.10 Bynewsit Views130

Read More
마에스트로 포렌식, DFIR 강화한 ‘마에스트로 위즈덤’ 공개

- LotL·파일리스 공격까지 정밀 분석하는 침해사고 대응 플랫폼 보안 전문기업 마에스트로 포렌식이 AI 기반 자동화 디지털 포렌식·악성코드 분석 통합 플랫폼 ‘마에스트로 위즈덤(MAESTRO WISDOM)’에 침해사고 대응(DFIR) 기능을 추가하며, 최신 랜섬웨어와 ...

Date2026.02.10 Bynewsit Views105

Read More
카스퍼스키, 노트패드++ 공급망 공격자 분석 발표…다중 감염 체인 확인

- 다중 감염 체인 활용한 공급망 공격 정황 확인 - 기존 IoC 점검만으로는 탐지 한계 카스퍼스키가 노트패드++(N otepad++) 공급망 공격을 분석한 결과, 배후 공격자들이 필리핀 정부 기관과 엘살바도르 금융 기관, 베트남 IT 서비스 제공업체, 그리고 여러 국...

Date2026.02.09 Bynewsit Views104

Read More
타포, 합리적 가격의 4K 초고화질 홈캠 ‘Tapo C250’ 출시

- 800만 화소·AI 자동 줌 트래킹 탑재, 7만 원대 가격으로 4K 홈캠 진입 장벽 낮춰 타포가 800만 화소 4K 초고화질 촬영을 지원하는 실내용 회전형 홈 보안 카메라 ‘Tapo C250’을 국내에 출시했다. 기존 풀HD급 실내용 홈캠 대비 한 단계 높은 해상도와 AI 기...

Date2026.02.06 Bynewsit Views137

Read More
안랩, 2025년 4분기 피싱 문자 분석…금융기관 사칭·URL 삽입 최다

- 금융기관 사칭 46.9%로 1위…직전 분기 대비 4배 이상 증가 - 사칭 산업군은 정부·공공기관이 최다, 피싱 유도는 URL 삽입이 압도적 - 불분명한 발신자 URL 클릭 금지 등 기본 보안 수칙 준수 필요 안랩이 2025년 10월부터 12월까지 자사의 에이전틱 AI 기반 ...

Date2026.02.05 Bynewsit Views127

Read More
그룹아이비, ‘예측형 인텔리전스’ 기반 선제적 보안 전략 제시

- 사고 이후 대응에서 공격 준비 단계 차단으로 전환 강조 - 통합 리스크 플랫폼 통해 위협 탐지·디지털 위험 보호·사기 방지 단일화 사이버 보안 기업 그룹아이비는 4일 서울 서초구 엘타워에서 열린 ‘시큐리티 메가비전 2026’에 참가해, 사이버 공격 가능성...

Date2026.02.05 Bynewsit Views163

Read More
클라우드플레어, “케이블 절단·정전·기상이변이 인터넷 장애 주원인”

- 케이블 절단·정전·기상이변이 주요 원인…정부 주도 차단도 지속 글로벌 네트워크 보안 기업 클라우드플레어가 2025년 4분기 전 세계에서 발생한 인터넷 연결 장애 현황을 분석한 보고서를 공개했다. 물리적 인프라 손상과 전력 장애, 기상이변이 주요 원인으...

Date2026.02.04 Bynewsit Views105

Read More
카스퍼스키, HoneyMyte APT 진화 포착…공공·외교기관 정보 탈취 공격 확대

- CoolClient 백도어 기능 확장…클립보드·브라우저·프록시 정보까지 탈취 글로벌 사이버 보안 기업 카스퍼스키가 정부 및 외교 기관을 겨냥한 HoneyMyte APT 공격의 최신 동향을 공개했다. CoolClient 백도어 기능이 대폭 확장되며 클립보드, 브라우저, 프록시...

Date2026.02.04 Bynewsit Views76

Read More
티오리, ‘AAAI 2026’ 논문 채택…윤리 편향 기반 LLM 탈옥 취약점 분석

- 윤리적·사회적 편향이 대형 언어 모델 탈옥 취약점에 미치는 영향 규명 사이버 보안 전문기업 티오리는 소속 연구원이 참여한 논문이 세계 최고 권위의 인공지능 학회 AAAI 2026 워크샵에 채택돼 연구 성과를 발표했다고 밝혔다. AAAI는 전 세계 연구기관과 ...

Date2026.02.03 Bynewsit Views85

Read More
안랩클라우드메이트, 생성형 AI 데이터 보안 솔루션 ‘시큐어브리지’ 디지털서비스 이용지원시스템 등록

- 공공에서도 입찰 없이 신속 도입… 안전한 생성형 AI 활용 환경 구축 지원 안랩의 AX·MSP 전문 자회사 안랩클라우드메이트가 생성형 AI 데이터 보안 솔루션 ‘시큐어브리지(SecureBridge)’를 디지털서비스 이용지원시스템에 등록하며 공공 분야에서의 활용 기...

Date2026.02.02 Bynewsit Views79

Read More

태그 쓰기

클라우드플레어, 에이전트 클라우드 확장…다이내믹 워...	04-15
한국레노버, 미니멀 디자인 올인원 PC ‘AIO A105a’ 출...	04-15
ACM, 플래니터리 플랫폼 기반 반도체 공정 포트폴리오 ...	04-15
어플라이드, 옹스트롬 로직 공정용 GAA 증착 시스템 발...	04-14
윈드리버, BAE 시스템즈 ‘파트너-투-윈’ 골드 티어 수...	04-14
솔트웨어, K-ISMS 기준 AWS 보안 점검 서비스 ‘SCR’ 업...	04-14
ST, 모션 제어용 고속 GaN 게이트 드라이버 출시…전력 ...	04-14
카스퍼스키, AI 캐리커처 열풍 속 개인정보 노출 위험 ...	04-14
엔비디아, ‘네모트론 디벨로퍼 데이즈 서울 2026’ 첫 개최	04-13
로지텍, 앰배서더 프로그램 ‘로지텍 G 히어로즈’ 1기 모집	04-13

통신·보안·네트워크

통신·보안·네트워크

티오리, ‘AAAI 2026’ 논문 채택…윤리 편향 기반 LLM 탈옥 취약점 분석

단축키

단축키

통신·보안·네트워크

클라우드플레어, 2025년 4분기 DDoS 공격 전년 대비 121% 증가

마에스트로 포렌식, DFIR 강화한 ‘마에스트로 위즈덤’ 공개

카스퍼스키, 노트패드++ 공급망 공격자 분석 발표…다중 감염 체인 확인

타포, 합리적 가격의 4K 초고화질 홈캠 ‘Tapo C250’ 출시

안랩, 2025년 4분기 피싱 문자 분석…금융기관 사칭·URL 삽입 최다

그룹아이비, ‘예측형 인텔리전스’ 기반 선제적 보안 전략 제시

클라우드플레어, “케이블 절단·정전·기상이변이 인터넷 장애 주원인”

카스퍼스키, HoneyMyte APT 진화 포착…공공·외교기관 정보 탈취 공격 확대

티오리, ‘AAAI 2026’ 논문 채택…윤리 편향 기반 LLM 탈옥 취약점 분석

안랩클라우드메이트, 생성형 AI 데이터 보안 솔루션 ‘시큐어브리지’ 디지털서비스 이용지원시스템 등록