Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 155 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

연세우유빵 시리즈 신상 ㅋㅋㅋㅋㅋㅋㅋ.jpg

-
익명
조회수 197
추천 0
2025.05.25
연세우유빵 시리즈 신상 ㅋㅋㅋㅋㅋㅋㅋ.jpg

몸무게 잘못 쟤고 있었음

-
익명
조회수 203
추천 0
2025.05.25
몸무게 잘못 쟤고 있었음

이제서야 말하는 과거 박정아가 서인영에게 했던 폭언 .JPG

-
익명
조회수 202
추천 0
2025.05.25
이제서야 말하는 과거 박정아가 서인영에게 했던 폭언 .JPG

여자 강사들이 보디가드 달고 다니는 이유

-
익명
조회수 196
추천 0
2025.05.25
여자 강사들이 보디가드 달고 다니는 이유

내가 좋아서 계속 올리는 문채원

-
익명
조회수 204
추천 0
2025.05.25
내가 좋아서 계속 올리는 문채원

부정선거가 거의 종교❓

-
익명
조회수 195
추천 0
2025.05.25
부정선거가 거의 종교❓

지친 남친을 어떻게 위로해줄래?

-
익명
조회수 204
추천 0
2025.05.25
지친 남친을 어떻게 위로해줄래?

깡촌캉스 첫째날 이동욱이 방명록에 쓴 글ㅋㅋㅋㅋ

-
익명
조회수 204
추천 0
2025.05.25
깡촌캉스 첫째날 이동욱이 방명록에 쓴 글ㅋㅋㅋㅋ

맥도날드 5월 해피밀 장난감

-
익명
조회수 210
추천 0
2025.05.25
맥도날드 5월 해피밀 장난감

위풍댕댕 '반려견 순찰대' 24일부터 신규대원 모집

-
익명
조회수 203
추천 0
2025.05.25
위풍댕댕 '반려견 순찰대' 24일부터 신규대원 모집

웃기려는 의지가 전혀 없는데 또 레전드 장면 갱신한 지락실 미미.jpgif

-
익명
조회수 203
추천 0
2025.05.25
웃기려는 의지가 전혀 없는데 또 레전드 장면 갱신한 지락실 미미.jpgif

인도에서 온 채식주의자도 변하게 만드는 한국.jpg

-
익명
조회수 203
추천 0
2025.05.25
인도에서 온 채식주의자도 변하게 만드는 한국.jpg

딸(만 9세)이 남기고 간 쪽지

-
익명
조회수 212
추천 0
2025.05.25
딸(만 9세)이 남기고 간 쪽지

문희준과 소율 아들딸

-
익명
조회수 215
추천 0
2025.05.25
문희준과 소율 아들딸

리투아니아 화가 겸 작곡가라는데 정말 천재같다

-
익명
조회수 204
추천 0
2025.05.25
리투아니아 화가 겸 작곡가라는데 정말 천재같다
작성
55 56 57 58 59
2.jpg