ChatGPT를 시작으로 생성형 AI가 대중에게 폭발적으로 확산되고 있습니다. 하지만 이에 대한 사회적 이해와 안전장치(Safety Guardrail)는 기술 발전 속도를 따라가지 못하고 있는 실정입니다. Anthropic이 Constitutional AI를 내세우며 안전성을 강조하는 등 업계 차원의 노력이 이어지고 있지만, 이러한 안전장치를 우회하는 Jailbreaking 기법들은 여전히 끊임없이 등장하고 있습니다.
JAMA Netw. Open2026-01-07