통신·보안·네트워크

2026.02.03 09:49

티오리, ‘AAAI 2026’ 논문 채택…윤리 편향 기반 LLM 탈옥 취약점 분석

newsit

https://hwlab.com/Network_security_comm/18751 조회 수 61 추천 수 0 댓글 0

Extra Form
참조#1	http://www.theori.io/

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

- 윤리적·사회적 편향이 대형 언어 모델 탈옥 취약점에 미치는 영향 규명

티오리, ‘AAAI 2026’ 논문 채택…윤리 편향 기반 LLM 탈옥 취약점 분석.png

사이버 보안 전문기업 티오리는 소속 연구원이 참여한 논문이 세계 최고 권위의 인공지능 학회 AAAI 2026 워크샵에 채택돼 연구 성과를 발표했다고 밝혔다. AAAI는 전 세계 연구기관과 기업 연구자들이 최신 인공지능 연구 결과를 공유하는 대표적 국제 학회다. AAAI 2026은 2026년 1월 20일부터 27일까지 싱가포르에서 열렸다.

윤리적 편향과 탈옥 취약점의 상관관계 분석

이번에 채택된 논문은 ‘BiasJailbreak: Analyzing Ethical Biases and Jailbreak Vulnerabilities in Large Language Models’로 대형 언어 모델(LLM)에 내재된 윤리적·사회적 편향이 탈옥(jailbreak) 공격 취약점에 미치는 영향을 실험적으로 분석했다.

연구팀은 LLM이 특정 편향 요소를 포함한 입력에 대해 서로 다른 안전 응답을 보인다는 점에 주목했다. 이를 바탕으로 윤리적 편향과 탈옥 공격 간 관계를 정량적으로 측정하는 분석 프레임워크 ‘BiasJailbreak’를 제안하고, 편향 기반 공격을 완화하기 위한 대응 방식으로 ‘BiasDefense’를 함께 제시했다.

LLM 보안 솔루션 설계에도 연구 성과 반영

해당 연구 결과는 티오리의 LLM 보안 솔루션 알파프리즘의 위험 탐지 기능 설계 과정에도 참고됐다. LLM의 윤리적 응답 특성이 공격에 악용되는 패턴을 분석하고, 편향 기반 입력에 대한 탐지·대응 모델을 설계하는 데 연구 내용을 적용했다.

논문 제1저자로 참여한 티오리 이이삭 연구원은 “LLM의 편향과 안전성 문제를 함께 살펴본 분석”이라며 “LLM 보안 연구와 논의 과정에서 하나의 참고 사례로 활용되길 기대한다”고 밝혔다.

오펜시브 보안 중심 기술력 확대

한편 티오리는 오펜시브 사이버보안 전문 기업으로, 구글, 마이크로소프트, 옥타, 삼성전자 등 국내외 주요 기업과 기관에 보안 컨설팅을 제공하고 있다.

또한 웹 애플리케이션 보안 자동화 솔루션 Xint(진트), 회원 7만 명 이상이 사용하는 사이버보안 교육 플랫폼 Dreamhack(드림핵)을 운영하며 실전 중심 보안 기술 생태계 확장에 주력하고 있다.

#티오리 #AAAI2026 #LLM보안 #AI윤리 #BiasJailbreak #알파프리즘 #사이버보안

Facebook Twitter Google Pinterest KakaoStory Band

Atachment
첨부 '1'	티오리, ‘AAAI 2026’ 논문 채택…윤리 편향 기반 LLM 탈옥 취약점 분석.png,

위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

✔댓글 쓰기

에디터 선택하기

✔ 텍스트 모드 ✔ 에디터 모드

댓글 쓰기

에디터 사용하기 닫기

통신·보안·네트워크

클라우드플레어, SASE 전 구간에 양자 내성 암호화 적용…‘클라우드플레어 원’ 기본값 전환

- 제로트러스트부터 WAN·IPsec까지 무료 보호…차세대 위협 대응 체계 강화 클라우드플레어가 SASE 플랫폼 ‘클라우드플레어 원(Cloudflare One)’ 전반에 최신 양자 내성 암호화(post-quantum encryption)를 세계 최초로 전면 적용하며, 차세대 사이버 위협 대응...

Date2026.02.25 Bynewsit Views60

Read More
마에스트로 포렌식, ‘마에스트로 위즈덤 리눅스’ 공개…리눅스 서버 EXT·XFS 정밀 분석 확대

- Red Hat·Ubuntu 등 주요 배포판 지원 강화, 250종 이상 디지털 아티팩트 통합 분석 마에스트로 포렌식이 레드햇과 우분투 등 주요 리눅스 배포판의 파일시스템 분석을 강화한 디지털 포렌식 솔루션 ‘마에스트로 위즈덤 리눅스’를 공개하며, 서버·클라우드 환...

Date2026.02.24 Bynewsit Views53

Read More
카스퍼스키, 알파 세대 AI 사용 확산 대응 가이드 공개…개인정보 보호·앱 권한 관리 강조

- 개인정보 공유 차단·교차 검증 교육·자녀 보호 도구 활성화 권고 카스퍼스키가 ‘안전한 인터넷의 날(Safer Internet Day)’을 맞아 어린이와 청소년의 AI 활용 안전 수칙을 공개하며, 알파 세대의 디지털 보호 인식 강화를 위한 실천 방안을 제시했다. 카스퍼...

Date2026.02.24 Bynewsit Views67

Read More
삼성SDS, 2026년 5대 사이버 보안 위협 제시…AI 확산에 보안 대응 방식 전환 강조

- IT·보안 관계자 667명 의견 반영, AI 기반 자동화 중심 보안 전략 강조 삼성SDS가 지난해 국내외 사이버 보안 이슈를 분석하고 국내 IT·보안 관계자 667명의 의견을 반영해 ‘2026년 5대 사이버 보안 위협’을 제시했다. AI 확산과 클라우드 전환이 빨라지면서...

Date2026.02.23 Bynewsit Views60

Read More
카스퍼스키, 2026 동계 올림픽 겨냥 사이버 사기 경고…공식 채널 이용 강조

- 가짜 티켓·위조 상품·불법 스트리밍 확산…개인정보 유출 주의 카스퍼스키가 2026 동계 올림픽 기간 발생할 수 있는 주요 사이버 사기 유형과 식별법을 소개했다고 밝혔다. 가짜 티켓 판매, 위조 상품 쇼핑몰, 불법 스트리밍 사이트가 확산되며 스포츠 팬을 ...

Date2026.02.20 Bynewsit Views42

Read More
노조미 네트웍스, 랜섬웨어 70% 영어권 집중…OT·IoT 보안 리스크 확대

- 랜섬웨어 70% 영어권 집중…교통·공공 부문 공격 급증 노조미 네트웍스가 2025년 하반기 OT·IoT 사이버보안 동향 보고서를 발표하며, 전 세계 랜섬웨어 공격의 70%가 영어권 국가를 겨냥했다고 밝혔다. 미국·캐나다·영국을 중심으로 공격이 집중됐으며, 생성...

Date2026.02.20 Bynewsit Views44

Read More
머큐시스, 10Gbps 유선 환경 대응 ‘MA510E’ 출시

- 기가비트 대비 10배 속도·Flow Control·WoL·EEE 지원, NAS·서버·크리에이터 환경 확장 머큐시스는 10기가비트 PCIe 네트워크 랜카드 ‘MA510E’를 출시했다고 19일 밝혔다. 최대 10Gbps 속도를 지원해 1Gbps 기가비트 환경에서 발생하는 대역폭 한계를 해소하...

Date2026.02.19 Bynewsit Views43

Read More
Tapo, 태양광·4G LTE 결합 실외용 보안 카메라 ‘Tapo C615G KIT’ 출시

- 와이파이·전원 공사 없이 설치… 태양광 충전·AI 감지·360° 회전 지원 타포가 태양광 충전과 4G LTE 연결을 지원하는 회전형 실외용 보안 카메라 ‘Tapo C615G KIT’를 국내에 출시하며, 인터넷과 전원 인프라 제약 없이 원격 모니터링 환경을 구축할 수 있다고...

Date2026.02.12 Bynewsit Views174

Read More
카스퍼스키, ‘OT 사이버보안 절감 계산기’ 공개…보안 투자 효과 수치화

- OT 보안 미흡 시 발생 가능한 잠재 비용 재무 지표로 환산 - 산업·지역·기업 규모 입력 시 맞춤형 절감 효과 산출 - 경영진 의사결정 지원 위한 데이터 기반 온라인 도구 카스퍼스키 이효은 한국지사장은 산업 기업의 OT 보안 투자 효과를 재무 지표로 환산...

Date2026.02.11 Bynewsit Views169

Read More
닷핵 컨퍼런스 2026, 4월 코엑스 개최…AI 시대 보안 전략 집중 조명

해커와 보안 전문가들이 한자리에 모이는 ‘닷핵 컨퍼런스 2026(.HACK Conference 2026)’가 오는 4월 7일부터 8일까지 서울 코엑스 컨퍼런스룸(남) 4층에서 열린다. 이번 행사는 AI 확산으로 변화하는 위협 환경을 중심으로 최신 사이버 보안 트렌드와 실전 기...

Date2026.02.10 Bynewsit Views171

Read More

태그 쓰기

넷스카우트 코리아, AI 기반 DDoS 대응 체계 공개…탐지...	03-20
아웃시스템즈, G2 AI 에이전트 빌더 리더 선정…NPS 95...	03-20
지멘스, 에이전틱 AI 기반 반도체 검증 플랫폼 ‘퀘스타...	03-20
아비바-엔비디아, 기가와트급 AI 팩토리 디지털 트윈 ...	03-20
코헤시티, NH농협은행 클라우드 백업 구축…TCO 28억 절...	03-19
[GTC 2026] HPE, 엔비디아와 AI 인프라 확장…GPU 128개...	03-19
[GTC 2026] 엔비디아, 오라클과 벡터 검색 가속…GPU 인...	03-19
[GTC 2026] 엔비디아, 단백질 데이터셋 확장…170만 복...	03-19
[GTC 2026] 엔비디아, 한국 기업과 AI 협력 확대…메모...	03-19
[GTC 2026] 엔비디아, 금융 AI 확산 가속…마스터카드·...	03-19

통신·보안·네트워크

통신·보안·네트워크

티오리, ‘AAAI 2026’ 논문 채택…윤리 편향 기반 LLM 탈옥 취약점 분석

단축키

단축키

통신·보안·네트워크

클라우드플레어, SASE 전 구간에 양자 내성 암호화 적용…‘클라우드플레어 원’ 기본값 전환

마에스트로 포렌식, ‘마에스트로 위즈덤 리눅스’ 공개…리눅스 서버 EXT·XFS 정밀 분석 확대

카스퍼스키, 알파 세대 AI 사용 확산 대응 가이드 공개…개인정보 보호·앱 권한 관리 강조

삼성SDS, 2026년 5대 사이버 보안 위협 제시…AI 확산에 보안 대응 방식 전환 강조

카스퍼스키, 2026 동계 올림픽 겨냥 사이버 사기 경고…공식 채널 이용 강조

노조미 네트웍스, 랜섬웨어 70% 영어권 집중…OT·IoT 보안 리스크 확대

머큐시스, 10Gbps 유선 환경 대응 ‘MA510E’ 출시

Tapo, 태양광·4G LTE 결합 실외용 보안 카메라 ‘Tapo C615G KIT’ 출시

카스퍼스키, ‘OT 사이버보안 절감 계산기’ 공개…보안 투자 효과 수치화

닷핵 컨퍼런스 2026, 4월 코엑스 개최…AI 시대 보안 전략 집중 조명