Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 237 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

유일한 국힘의 바른 정치인이었던 의원 근황 .jpg

-
익명
조회수 322
추천 0
2025.05.18
유일한 국힘의 바른 정치인이었던 의원 근황 .jpg

정치에 관심없다는 사람들 특징

-
익명
조회수 318
추천 0
2025.05.18
정치에 관심없다는 사람들 특징

현재 논란중인 톰 크루즈를 향한 기자의 무례한 질문.jpg

-
익명
조회수 311
추천 0
2025.05.18
현재 논란중인 톰 크루즈를 향한 기자의 무례한 질문.jpg

김문수보고 김무열 닮았다고 착즙 시작한 소드

-
익명
조회수 299
추천 0
2025.05.18
김문수보고 김무열 닮았다고 착즙 시작한 소드

진도믹스 강쥐 우비 뭐입혀??

-
익명
조회수 318
추천 0
2025.05.18
진도믹스 강쥐 우비 뭐입혀??

2025 최신 국립대 입결순위래요 ㄷㄷ jpg

-
익명
조회수 313
추천 0
2025.05.18
2025 최신 국립대 입결순위래요 ㄷㄷ jpg

동물병원 호구 안 당하는 꿀팁

-
익명
조회수 317
추천 0
2025.05.18
동물병원 호구 안 당하는 꿀팁

한국에서 동전으로 6,000만 원을 번 미국인

-
익명
조회수 296
추천 0
2025.05.18
한국에서 동전으로 6,000만 원을 번 미국인

나한테는 광어필통이 하나 있는데.jpg

-
익명
조회수 306
추천 0
2025.05.18
나한테는 광어필통이 하나 있는데.jpg

첫출근했는데 점심 혼자 먹겠다는 신입사원 어떻게 해야 되지?.jpg

-
익명
조회수 307
추천 0
2025.05.18
첫출근했는데 점심 혼자 먹겠다는 신입사원 어떻게 해야 되지?.jpg

삼겹살 먹을 때 은근 갈린다는 거

-
익명
조회수 308
추천 0
2025.05.18
삼겹살 먹을 때 은근 갈린다는 거

사람들이 잘 모르는 예스24 레전드 사건

-
익명
조회수 304
추천 0
2025.05.18
사람들이 잘 모르는 예스24 레전드 사건

도시락 남기면 엄마가 속상해하시니 나눠먹자던 친구

-
익명
조회수 292
추천 0
2025.05.18
도시락 남기면 엄마가 속상해하시니 나눠먹자던 친구

OO고추'가 실트에…'유명인 몸캠' 공유·품평한 카페

-
익명
조회수 304
추천 0
2025.05.18
OO고추'가 실트에…'유명인 몸캠' 공유·품평한 카페

실시간 소드 김문수 착즙 개크게 ON

-
익명
조회수 311
추천 0
2025.05.18
실시간 소드 김문수 착즙 개크게 ON
작성
88 89 90 91 92
2.jpg