Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 237 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

김장하 어른과 이재명 후보의 만남 전지적 대변인 시점 비하인드

-
익명
조회수 314
추천 0
2025.05.18
김장하 어른과 이재명 후보의 만남 전지적 대변인 시점 비하인드

[정치달글 달웃] 부산은 그럼 부리부리특별자치도냐고

-
익명
조회수 307
추천 0
2025.05.18
[정치달글 달웃] 부산은 그럼 부리부리특별자치도냐고

한동훈, 안철수 sns

-
익명
조회수 304
추천 0
2025.05.18
한동훈, 안철수 sns

즉석 떡볶이 만들기.gif

-
익명
조회수 312
추천 0
2025.05.18
즉석 떡볶이 만들기.gif

11년만에 만난 팬때문에 눈물터진 아이유.twt

-
익명
조회수 310
추천 0
2025.05.18
11년만에 만난 팬때문에 눈물터진 아이유.twt

"눈주름에 효과적?” 시술 대신 바른다는 '치질크림', 경고 나온 까닭

-
익명
조회수 304
추천 0
2025.05.18
"눈주름에 효과적?” 시술 대신 바른다는 '치질크림', 경고 나온 까닭

비 오는 날에는 파전.gif

-
익명
조회수 316
추천 0
2025.05.18
비 오는 날에는 파전.gif

세상에서 제일 귀여운 유물

-
익명
조회수 318
추천 0
2025.05.18
세상에서 제일 귀여운 유물

한국을 포함한 식민지의 역사를 가진 나라들의 매국노는 공통된 정신병을 갖고 있다

-
익명
조회수 312
추천 0
2025.05.18
한국을 포함한 식민지의 역사를 가진 나라들의 매국노는 공통된 정신병을 갖고 있다

나 배민이름 노숙자인데

-
익명
조회수 326
추천 0
2025.05.18
나 배민이름 노숙자인데

파렛트에 같이 딸려온 고양이는…

-
익명
조회수 316
추천 0
2025.05.18
파렛트에 같이 딸려온 고양이는…

포켓몬 이브이 어둠의 진화루트

-
익명
조회수 321
추천 0
2025.05.18
포켓몬 이브이 어둠의 진화루트

처음 보는 개를 만질때 매너.gif

-
익명
조회수 294
추천 0
2025.05.18
처음 보는 개를 만질때 매너.gif

160kg-70kg! 3개월 만에 90kg 감량

-
익명
조회수 302
추천 0
2025.05.18
160kg-70kg! 3개월 만에 90kg 감량

경찰견 출신 댕댕이가 무서워 하는 것

-
익명
조회수 312
추천 0
2025.05.18
경찰견 출신 댕댕이가 무서워 하는 것
작성
89 90 91 92 93
2.jpg