Anthropic Fable 5 재개, 사이버 안전장치와 jailbreak 기준까지 공개

SNACK 세 줄 요약

Anthropic이 Fable 5를 전 세계 사용자에게 다시 열었습니다. 6월 중순 미국 정부 지시로 접근이 멈췄던 모델이 7월 1일부터 복귀한 흐름입니다.
7월 2일에는 사이버 안전 분류기와 jailbreak 심각도 기준 초안을 공개했습니다. 모델 성능보다 어떤 요청을 막고, 어떤 방어 목적 요청은 허용할지를 설명한 글입니다.
핵심은 “강한 AI를 다시 열되, 운영 규칙도 같이 공개한다”는 점입니다. 개발자와 일반 독자는 새 모델 소식만큼 안전장치의 오탐·차단 범위도 함께 봐야 합니다.

이미지 출처: Anthropic 공식 뉴스룸

스낵걸즈 편집부 후기

AIKO: “이번 소식은 단순히 모델이 돌아왔다는 이야기가 아니에요. 강한 AI를 공개할 때 안전장치를 어떻게 설명하고 검증할지가 같이 나온 사례입니다.”

레드: “개발자 입장에서는 Fable 5가 다시 열리는 것도 중요하지만, 정상적인 보안 점검 요청까지 막힐 수 있는지를 같이 봐야 해요. 빠른 모델일수록 사용 규칙이 더 중요해집니다.”

무엇이 다시 열렸나

Anthropic은 6월 30일 공식 글에서 Claude Fable 5가 7월 1일부터 전 세계 사용자에게 다시 제공된다고 밝혔습니다. 대상은 Claude Platform, Claude.ai, Claude Code, Claude Cowork입니다. 이전에 Fable 5와 Mythos 5는 미국 정부의 지시 이후 접근이 중단됐고, Game Sunakku도 당시 중단 소식을 다룬 바 있습니다.

이번 후속의 핵심은 단순한 “서비스 재개”가 아닙니다. Anthropic은 접근 재개와 함께 Fable 5에 적용한 안전 분류기, 정부·파트너 검토, 그리고 jailbreak 심각도 기준 논의를 공개했습니다. 즉 강한 모델을 다시 열면서 왜 막고, 무엇을 허용할지 설명한 운영 보고서에 가깝습니다.

사이버 안전 분류기가 하는 일

7월 2일 글에서 Anthropic은 Fable 5의 사이버 보안 관련 요청을 네 단계로 나눠 설명했습니다. 큰 피해 가능성이 높은 요청은 차단하고, 일상적인 방어 목적 요청은 허용하되 일부 경계 영역은 감시하거나 차단할 수 있다는 구조입니다.

쉽게 말하면 AI가 보안 일을 도와도 되는지 판단하는 신호등을 모델 옆에 붙인 셈입니다. 초록불은 일반적인 안전한 요청, 빨간불은 피해 가능성이 큰 요청, 노란불은 방어와 악용 가능성이 섞인 요청입니다. Anthropic은 Fable 5에서 이 노란불 영역을 더 보수적으로 잡았다고 설명했습니다.

jailbreak 기준을 왜 따로 꺼냈나

Anthropic은 Amazon, Microsoft, Google 등 Glasswing 파트너들과 함께 AI jailbreak severity framework 초안을 만들고 있다고 밝혔습니다. 여기서 jailbreak는 모델의 안전장치를 우회하려는 프롬프트 방식입니다. 회사는 모든 우회 시도가 같은 위험은 아니기 때문에, 위험도를 일관되게 나누는 기준이 필요하다고 설명합니다.

이 대목은 일반 독자에게도 중요합니다. 앞으로 AI 모델 논란은 “뚫렸다 / 안 뚫렸다” 한 줄로 끝나기 어렵습니다. 어떤 기능이 풀렸는지, 실제 피해 가능성이 있는지, 방어 목적 사용까지 막는지까지 봐야 합니다. 이번 발표는 AI 안전 이슈를 제품 기능표처럼 더 구체적으로 공개하려는 흐름으로 볼 수 있습니다.

사용자가 조심해서 볼 부분

다만 안전장치가 강하다는 말이 곧 모든 사용자가 편해진다는 뜻은 아닙니다. Anthropic도 보수적인 분류기는 정상적인 코딩·디버깅 요청을 더 자주 막을 수 있다고 인정했습니다. 특히 보안 점검, 취약점 분석, 코드 리뷰처럼 방어 목적이지만 표현상 민감해 보이는 요청은 오탐 가능성을 확인해야 합니다.

정리하면 이번 Fable 5 후속은 모델 재개 소식이면서 동시에 AI 안전 운영 방식의 공개 사례입니다. 성능이 올라갈수록 제품 뉴스는 모델 이름만 보는 것으로 부족합니다. 앞으로는 접근 권한, 차단 기준, 오탐 가능성, 제3자 검증 흐름까지 함께 보는 습관이 필요합니다.

출처 및 확인일 · 발표 2026-07-02 / 확인 2026-07-03T01:05:53+00:00

출처

Anthropic Fable 5 재개, 사이버 안전장치와 jailbreak 기준까지 공개

SNACK 세 줄 요약

스낵걸즈 편집부 후기

무엇이 다시 열렸나

사이버 안전 분류기가 하는 일

jailbreak 기준을 왜 따로 꺼냈나

사용자가 조심해서 볼 부분

이 글 공유하기:

이것이 좋아요:

코멘트

댓글 남기기응답 취소

더 많은 게시물

GTA 6 예약 시작, 한국 8만9800원 가격 비교

다마고치 파라다이스 메지루시 액세서리, 7월 4주 가샤폰 출시

스즈미야 하루히×코노스바, 메구밍 의상 1/7 피규어 예약 시작

케로로군조 일번쿠지 2탄, 7월 4일 행진 피규어로 출격

레고 할로윈 장식 40872·40873·40883, 호박등·랜턴·해골 촛대 3종

Game Sunakku에서 더 알아보기