Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 23 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

요즘 미용실 짜치는 점들 모아봄...jpg

N
-
익명
조회수 1
추천 0
4시간전
요즘 미용실 짜치는 점들 모아봄...jpg

친구집에 갔는데 케이크를 이렇게 준다면?

N
-
익명
조회수 1
추천 0
4시간전
친구집에 갔는데 케이크를 이렇게 준다면?

요즘 유튜브 섭외력 1황인 듯한 채널

N
-
익명
조회수 1
추천 0
4시간전
요즘 유튜브 섭외력 1황인 듯한 채널

투표가 망설여질때 봐야할 사진 4장

N
-
익명
조회수 3
추천 0
2025.05.28
투표가 망설여질때 봐야할 사진 4장

택시기사님의 딸이 되어버림.jpg

N
-
익명
조회수 3
추천 0
2025.05.28
택시기사님의 딸이 되어버림.jpg

[스우파3] 촌스럽다고 반응 난리난 일본팀 한본어/일본어 자막

N
-
익명
조회수 3
추천 0
2025.05.28
[스우파3] 촌스럽다고 반응 난리난 일본팀 한본어/일본어 자막

인플루언서 딸이랑 놀지말라한게 잘못인가요

N
-
익명
조회수 3
추천 0
2025.05.28
인플루언서 딸이랑 놀지말라한게 잘못인가요

진짜 문제되어야 할 오늘 파묘된 발언

N
-
익명
조회수 3
추천 0
2025.05.28
진짜 문제되어야 할 오늘 파묘된 발언

직장인 사내 메신저 총정리

N
-
익명
조회수 3
추천 0
2025.05.28
직장인 사내 메신저 총정리

지난 대선 레전드 투표인증jpg

N
-
익명
조회수 3
추천 0
2025.05.28
지난 대선 레전드 투표인증jpg

🚨SM엔터테인먼트입니다.🚨

N
-
익명
조회수 4
추천 0
2025.05.28
🚨SM엔터테인먼트입니다.🚨

현재 오른쪽 끝까지 갔다는 카리나 이미지.JPG

N
-
익명
조회수 5
추천 0
2025.05.28
현재 오른쪽 끝까지 갔다는 카리나 이미지.JPG

카리나 이미지 어쩌나...우파 연예인 JK 김동욱까지 격하게 '환영'

N
-
익명
조회수 4
추천 0
2025.05.28
카리나 이미지 어쩌나...우파 연예인 JK 김동욱까지 격하게 '환영'

상견례에 단체로 40분 늦었습니다

N
-
익명
조회수 3
추천 0
2025.05.28
상견례에 단체로 40분 늦었습니다

현타 온 카리나팬...

N
-
익명
조회수 3
추천 0
2025.05.28
현타 온 카리나팬...
작성
1 2 3 4 5
2.jpg