Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 173 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

학벌을 극복했던 인강 강사.jpg

-
익명
조회수 230
추천 0
2025.05.22
학벌을 극복했던 인강 강사.jpg

듀가나디가 실존..

-
익명
조회수 233
추천 0
2025.05.22
듀가나디가 실존..

신비하게 생긴 티베트의 동물들.jpgif

-
익명
조회수 235
추천 0
2025.05.22
신비하게 생긴 티베트의 동물들.jpgif

조선시대로 가서 3달 버티면 100억.jpg

-
익명
조회수 241
추천 0
2025.05.22
조선시대로 가서 3달 버티면 100억.jpg

저희가 이상한 바지를 발견했는데 같이 보실래요?.gif

-
익명
조회수 228
추천 0
2025.05.22
저희가 이상한 바지를 발견했는데 같이 보실래요?.gif

두리안 냄새맡은 댕댕이 반응

-
익명
조회수 240
추천 0
2025.05.22
두리안 냄새맡은 댕댕이 반응

돌고돌아 넷플릭스 1위까지 한 구)홍김동전 현) 버

-
익명
조회수 230
추천 0
2025.05.22
돌고돌아 넷플릭스 1위까지 한 구)홍김동전 현) 버

엄마가 안았을 때와 아빠가 안았을 때의 차이.jpg

-
익명
조회수 230
추천 0
2025.05.22
엄마가 안았을 때와 아빠가 안았을 때의 차이.jpg

한석준 아나운서가 말하는 순한 사람조차 화나게 하는 말투.jpg

-
익명
조회수 238
추천 0
2025.05.22
한석준 아나운서가 말하는 순한 사람조차 화나게 하는 말투.jpg

만약 그대로 기획됐다면 큰일날 뻔 했던 무한도전.jpg

-
익명
조회수 228
추천 0
2025.05.22
만약 그대로 기획됐다면 큰일날 뻔 했던 무한도전.jpg

엄마, 재고있음이 뭐야?

-
익명
조회수 236
추천 0
2025.05.22
엄마, 재고있음이 뭐야?

43년생 눈에는 2000년생이 애기로 보이나??

-
익명
조회수 234
추천 0
2025.05.22
43년생 눈에는 2000년생이 애기로 보이나??

자기객관화가 잘 된 사람은 울면서라도 고치려 한다.twt

-
익명
조회수 240
추천 0
2025.05.22
자기객관화가 잘 된 사람은 울면서라도 고치려 한다.twt

이 그림이 저에요

-
익명
조회수 233
추천 0
2025.05.22
이 그림이 저에요

외모 정병 관련 글인데 ㄹㅇ 맞말

-
익명
조회수 227
추천 0
2025.05.22
외모 정병 관련 글인데 ㄹㅇ 맞말
작성
70 71 72 73 74
2.jpg