- 윤리적·사회적 편향이 대형 언어 모델 탈옥 취약점에 미치는 영향 규명

 

티오리, ‘AAAI 2026’ 논문 채택…윤리 편향 기반 LLM 탈옥 취약점 분석.png

사이버 보안 전문기업 티오리는 소속 연구원이 참여한 논문이 세계 최고 권위의 인공지능 학회 AAAI 2026 워크샵에 채택돼 연구 성과를 발표했다고 밝혔다. AAAI는 전 세계 연구기관과 기업 연구자들이 최신 인공지능 연구 결과를 공유하는 대표적 국제 학회다. AAAI 20262026120일부터 27일까지 싱가포르에서 열렸다.

 

윤리적 편향과 탈옥 취약점의 상관관계 분석

이번에 채택된 논문은 ‘BiasJailbreak: Analyzing Ethical Biases and Jailbreak Vulnerabilities in Large Language Models’로 대형 언어 모델(LLM)에 내재된 윤리적·사회적 편향이 탈옥(jailbreak) 공격 취약점에 미치는 영향을 실험적으로 분석했다.

 

연구팀은 LLM이 특정 편향 요소를 포함한 입력에 대해 서로 다른 안전 응답을 보인다는 점에 주목했다. 이를 바탕으로 윤리적 편향과 탈옥 공격 간 관계를 정량적으로 측정하는 분석 프레임워크 ‘BiasJailbreak’를 제안하고, 편향 기반 공격을 완화하기 위한 대응 방식으로 ‘BiasDefense’를 함께 제시했다.

 

LLM 보안 솔루션 설계에도 연구 성과 반영

해당 연구 결과는 티오리의 LLM 보안 솔루션 알파프리즘의 위험 탐지 기능 설계 과정에도 참고됐다. LLM의 윤리적 응답 특성이 공격에 악용되는 패턴을 분석하고, 편향 기반 입력에 대한 탐지·대응 모델을 설계하는 데 연구 내용을 적용했다.

 

논문 제1저자로 참여한 티오리 이이삭 연구원은 “LLM의 편향과 안전성 문제를 함께 살펴본 분석이라며 “LLM 보안 연구와 논의 과정에서 하나의 참고 사례로 활용되길 기대한다고 밝혔다.

 

오펜시브 보안 중심 기술력 확대

한편 티오리는 오펜시브 사이버보안 전문 기업으로, 구글, 마이크로소프트, 옥타, 삼성전자 등 국내외 주요 기업과 기관에 보안 컨설팅을 제공하고 있다.

 

또한 웹 애플리케이션 보안 자동화 솔루션 Xint(진트), 회원 7만 명 이상이 사용하는 사이버보안 교육 플랫폼 Dreamhack(드림핵)을 운영하며 실전 중심 보안 기술 생태계 확장에 주력하고 있다.

 

#티오리 #AAAI2026 #LLM보안 #AI윤리 #BiasJailbreak #알파프리즘 #사이버보안

 

 

 
?

  1. 가민, 세계 여성의 날 맞아 ‘Garmin with Her’ 캠페인 진행

    - 수면·스트레스·생리 주기 등 데이터 기반 웰니스 관리 지원… 온오프라인 이벤트 운영 가민이 3월 8일 세계 여성의 날을 맞아 여성의 건강한 라이프스타일을 지원하는 ‘Garmin with Her(건강하게, 나답게)’ 캠페인을 3월 한 달간 진행한다. 이번 캠페인은 수...
    Date2026.03.09 Bynewsit Views43
    Read More
  2. 카스퍼스키, ‘자동차 산업 사이버 위협 전망 2026’ 발표…차량·인프라 겨냥 공격 증가

    - 자동차 제조 인프라·모빌리티 서비스·차량 시스템 취약점 노린 사이버 공격 확대 전망 카스퍼스키는 자동차 제조사 인프라와 차량 시스템 취약점을 겨냥한 공격 증가 등을 분석한 ‘자동차 산업 사이버 위협 전망 2026(Cyberthreat Forecast for the Automoti...
    Date2026.03.09 Bynewsit Views31
    Read More
  3. 히타치 밴타라, APeJ 하이엔드 외장 스토리지 매출 1위…미션 크리티컬 데이터 인프라 경쟁력 확인

    - IDC 기준 2025년 3분기 아태 지역 하이엔드 외장 스토리지 시스템 벤더 매출 1위 HS효성인포메이션시스템은 IDC가 발표한 ‘글로벌 엔터프라이즈 스토리지 시스템 추적 보고서(Worldwide Quarterly Enterprise Storage Systems Tracker, 2025년 12월 발표)’에...
    Date2026.03.09 Bynewsit Views58
    Read More
  4. [MWC 2026] 노르딕 세미컨덕터, 셀룰러 IoT 신제품 공개… NTN·Cat1bis 확장

    - LTE-M·NB-IoT 기반 차세대 IoT 포트폴리오 확대 노르딕 세미컨덕터가 MWC 2026에서 셀룰러 IoT 제품 포트폴리오를 확장하며 저전력 글로벌 연결 전략을 공개했다. LTE-M과 NB-IoT 기반 셀룰러 플랫폼을 중심으로 공개된 nRF92와 nRF93 시리즈는 위성 NTN 연...
    Date2026.03.05 Bynewsit Views37
    Read More
  5. [AW2026] 슈나이더 일렉트릭 코리아, AI 기반 통합 자동화 전략 공개

    - 개방형 플랫폼 기반 산업 데이터 통합·분석 구조 제시 - 디지털 트윈·AI 데이터 분석으로 자율제조 경쟁력 강화 슈나이더 일렉트릭 코리아가 ‘2026 스마트공장·자동화산업전(AW 2026)’에서 AI 기반 통합 자동화 플랫폼 전략을 공개하며 데이터 중심 산업 운...
    Date2026.03.05 Bynewsit Views54
    Read More
  6. 피아이이 최정일 대표, ‘납세자의 날’ 대통령 표창… 모범납세자 선정

    - 성실 납세 공로 인정… 세무조사 유예·금융 우대 혜택 - 투명 경영·AI 제조 솔루션 혁신 기반 산업 발전 기여 AI 기반 제조 지능화 통합 솔루션 기업 피아이이(PIE) 최정일 대표가 ‘제60회 납세자의 날’을 맞아 모범납세자로 선정돼 대통령 표창을 수상했다. ...
    Date2026.03.05 Bynewsit Views35
    Read More
  7. ST, 고속 절연 게이트 드라이버 출시… 자동차 전력 모듈 소형화 지원

    - 60ns 응답 속도·4A 구동 전류로 고주파 스위칭 지원 - 최대 1200V 전압 대응… EV·하이브리드 차량 전력 시스템 적용 ST마이크로일렉트로닉스가 자동차 등급의 갈바닉 절연 게이트 드라이버 STGAP2SA와 STGAP2HSA를 출시했다. 이 디바이스는 60ns 응답 시간과...
    Date2026.03.05 Bynewsit Views39
    Read More
  8. SAP, FC 바이에른 뮌헨 클라우드 전환… 950만 팬 데이터 통합 운영

    - 온프레미스 ERP 클라우드 전환 통해 AI 기반 운영 체계 구축 - 950만 팬 데이터·2만5000 제품 데이터 통합 관리 SAP가 독일 프로축구 구단 FC 바이에른 뮌헨(Bayern Munich)의 ‘RISE with SAP’ 기반 클라우드 전환 프로젝트를 완료했다고 밝혔다. 이번 전환...
    Date2026.03.05 Bynewsit Views75
    Read More
  9. 클라우드플레어, 위협 인텔리전스 보고서 공개… ‘침입보다 로그인’ 공격 확산

    - AI로 낮아진 공격 진입장벽…신원 도용·SaaS 침해 증가 - 최대 31.4Tbps 초대형 DDoS 등장…자율형 방어 필요 커넥티비티 클라우드 기업 클라우드플레어(Cloudflare)가 첫 연례 보고서 ‘2026 위협 인텔리전스 보고서’를 공개했다. 보고서는 클라우드포스 원(Cl...
    Date2026.03.05 Bynewsit Views43
    Read More
  10. 벡터, 소프트웨어 타이밍 분석 기술 ‘록스탯’ 인수… 안전 필수 시스템 검증 강화

    - VectorCAST 툴체인에 통합해 WCET 추정·타이밍 분석 기능 확대 - SDV 등 소프트웨어 정의 시스템에서 요구되는 타이밍 안전 대응 차량 네트워크와 임베디드 시스템 개발 솔루션을 제공하는 벡터코리아가 타이밍 안전 분석 기술 ‘록스탯(RocqStat)’을 인수해 ...
    Date2026.03.05 Bynewsit Views74
    Read More
  11. 엔비디아 지포스3 25주년…셰이더 시대를 열다

    - 고정 그래픽 파이프라인에서 프로그래머블 셰이더 구조로 전환 엔비디아가 프로그래머블 셰이더 GPU ‘지포스3’ 출시 25주년을 맞아 초기 PC 그래픽 기술 전환점을 조명했다. 2001년 등장한 지포스3는 고정 기능 기반 그래픽 파이프라인에서 벗어나 개발자가 ...
    Date2026.03.05 Bynewsit Views63
    Read More
  12. 넷스카우트, DDoS 공격 800만 건 발생… AI·IoT 결합한 새로운 공격 패턴

    - 멀티 벡터 공격 42% 차지, IoT 기반 대규모 트래픽 확산 - AI 활용 공격 자동화·공격자 협업 확대 글로벌 보안 기업 넷스카우트가 ‘2025년 하반기 DDoS 위협 인텔리전스 보고서’를 발표했다. 보고서는 공격자 협업 확대와 AI 활용 공격 자동화, 침해된 IoT ...
    Date2026.03.05 Bynewsit Views50
    Read More
  13. 아비바, 유니파이드 엔지니어링에 산업용 AI 대거 추가…설계 자동화·프로젝트 협업 강화

    - 산업용 AI 어시스턴트·생성형 설계 AI 등 신규 기능 공개 - 데이터 중심 1D·2D·3D 통합 설계 환경 기반 엔지니어링 효율 향상 아비바가 자사의 엔지니어링 통합 플랫폼 아비바 유니파이드 엔지니어링에 산업용 AI 도구를 대거 추가했다. 프로젝트 설계와 협...
    Date2026.03.05 Bynewsit Views77
    Read More
  14. 옥타브, 헥사곤 소프트웨어 사업 분사 추진…산업 자산 전주기 플랫폼 전략 출범

    - 헥사곤 ALI·SIG 사업부와 브릭시스, ETQ, 프로젝트메이츠 통합 - 설계·구축·운영·보호 전 단계를 연결하는 산업 인프라 소프트웨어 포트폴리오 구축 옥타브가 헥사곤 소프트웨어 사업을 통합해 독립 브랜드로 출범하며 산업 및 인프라 자산 관리 플랫폼 전략...
    Date2026.03.04 Bynewsit Views95
    Read More
  15. 포낙, ‘비르토 인피니오 R’로 충전식 맞춤형 시장 확장… 인피니오 울트라 라인업 완성

    - 포낙 최초 충전식 맞춤형 귓속형 모델 3월 국내 출시 - 1,600개 이상 귀 데이터 분석·AutoSense OS 7.0 기반 자동 환경 인식 적용 스위스 청각 솔루션 브랜드 포낙이 3월 포낙 최초 충전식 맞춤형 보청기 ‘비르토 인피니오 R’을 국내에 출시한다. AI 기반 청...
    Date2026.02.27 Bynewsit Views63
    Read More
  16. 포낙, ‘말소리 이해’ 중심 AI 보청기 기준 제시… 인피니오 울트라로 소음 속 이해력 24% 향상

    - 경쟁 축 ‘음량’에서 ‘이해 정확도’로 이동 - 150만 대 판매·VA 60% 점유율… 딥소닉 초당 77억 회 연산 구조 공개 스위스 프리미엄 청각 브랜드 포낙이 27일 서울 동대문디자인플라자에서 ‘Phonak: Leading the AI Experience’를 주제로 AI 기반 청각 기술 전...
    Date2026.02.27 Bynewsit Views58
    Read More
  17. 서비스나우, 생각하고 행동하는 ‘자율 인력’ 출시… 워크플로우 기반 AI 실행 구조 제시

    - 역할·권한·거버넌스 갖춘 AI 전문가 투입… ‘임플로이웍스’로 약 2억 명 직원 지원 서비스나우가 기업 업무에 필요한 역할과 권한, 거버넌스를 갖추고 자율적으로 업무를 수행하는 AI 전문가 조직 ‘자율 인력(Autonomous Workforce)’을 출시했다. 무브웍스 기...
    Date2026.02.27 Bynewsit Views86
    Read More
  18. 피아이이, ‘2026 스마트공장·자동화산업전’ 참가… 자율제조·AX 전환 엔드 투 엔드 역량 공개

    - 피지컬·인텔리전스·엔터프라이즈 AI 3대 존 구성… 설계부터 통합 관제까지 전주기 구현 피아이이가 3월 4일부터 6일까지 서울 코엑스에서 열리는 ‘2026 스마트공장·자동화산업전(AW 2026)’에 참가해 자율제조 및 AX 전환을 위한 엔드 투 엔드 스마트 팩토리 ...
    Date2026.02.27 Bynewsit Views86
    Read More
  19. 사이냅소프트, 사이냅 OCR IX 분당 500장 처리… 금융·공공 대량 트래픽 대응 구조 공개

    - 처리 속도·정확도·보안 3요건 충족… 금융·공공 200건 레퍼런스로 현장 검증 도큐먼트 AI 전문 기업 사이냅소프트 전경헌 대표가 1월 출시한 ‘사이냅 OCR IX’의 구체적인 성능 수치를 공개하며 온프레미스 환경에서 처리 속도와 정확도, 보안을 동시에 충족하...
    Date2026.02.27 Bynewsit Views97
    Read More
  20. 티유브이 슈드 코리아, 하우엔지니어링웍스와 기능안전·A-SPICE 통합 지원… 차량 반도체 글로벌 대응 체계 구축

    - ISO 26262·A-SPICE 기반 기술 자문부터 인증까지 연계… 국내 기업 국제 표준 경쟁력 강화 전동화와 자율주행 확산으로 자동차 산업이 소프트웨어 중심 구조로 빠르게 이동하는 가운데, 기능안전과 개발 프로세스 역량이 글로벌 협업의 핵심 요건으로 자리 잡...
    Date2026.02.27 Bynewsit Views93
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 11 ... 284 Next
/ 284
CLOSE