Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 227 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

마블영화 망조 든 이유가 뭘까 달글

-
익명
조회수 292
추천 0
2025.05.19

현금 10억 체감.gif

-
익명
조회수 288
추천 0
2025.05.19
현금 10억 체감.gif

이 상황에서 유튜버 슈카월드가 업로드한 새 영상.twt

-
익명
조회수 296
추천 0
2025.05.19
이 상황에서 유튜버 슈카월드가 업로드한 새 영상.twt

체포가 늦어졌던 이유 ㅜ

-
익명
조회수 311
추천 0
2025.05.19
체포가 늦어졌던 이유 ㅜ

친북 좌파몰이 안먹히는 이유가 대부분의 국민은 북한에 관심이 없어요~

-
익명
조회수 296
추천 0
2025.05.19

판) 상견례 자리 남자 쪽 엄마는 첩

-
익명
조회수 311
추천 0
2025.05.19
판) 상견례 자리 남자 쪽 엄마는 첩

과거 기숙사 수칙 위반자 퇴사 공고 레전드

-
익명
조회수 305
추천 0
2025.05.19
과거 기숙사 수칙 위반자 퇴사 공고 레전드

클리오 NEW 모델

-
익명
조회수 302
추천 0
2025.05.19
클리오 NEW 모델

GTX-A 북부구간 개통 후 이용객 근황

-
익명
조회수 308
추천 0
2025.05.19
GTX-A 북부구간 개통 후 이용객 근황

실시간 석열이 상태

-
익명
조회수 282
추천 0
2025.05.19
실시간 석열이 상태

예전 대형고기집 특징

-
익명
조회수 304
추천 0
2025.05.19
예전 대형고기집 특징

믿고 집 맡겨도 될 용맹한 강아지 두 마리

-
익명
조회수 260
추천 0
2025.05.19
믿고 집 맡겨도 될 용맹한 강아지 두 마리

요즘 최전성기라는 올리브영 실적근황..

-
익명
조회수 278
추천 0
2025.05.19
요즘 최전성기라는 올리브영 실적근황..

행인 머리에서 바퀴벌레 털어줬더니 되레 화내…'반려벌레'였다

-
익명
조회수 294
추천 0
2025.05.19
행인 머리에서 바퀴벌레 털어줬더니 되레 화내…'반려벌레'였다

김고은 눈웃음

-
익명
조회수 296
추천 0
2025.05.19
김고은 눈웃음
작성
86 87 88 89 90
2.jpg