Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 224 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자(yspark@dt.co.kr)
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

5년임기 동안 𝙕𝙄𝙍𝘼𝙇 하기전에 이거 세워야 함.JPG

-
익명
조회수 88
추천 0
2025.06.05
5년임기 동안 𝙕𝙄𝙍𝘼𝙇 하기전에 이거 세워야 함.JPG

조선총독부 첨탑 근황

-
익명
조회수 98
추천 0
2025.06.05
조선총독부 첨탑 근황

연세크림빵 어디까지 먹어봄?

-
익명
조회수 90
추천 0
2025.06.05
연세크림빵 어디까지 먹어봄?

누누이 말하지만 이런애들하고도 같이 살아야됨.....twt

-
익명
조회수 95
추천 0
2025.06.05
누누이 말하지만 이런애들하고도 같이 살아야됨.....twt

프로미스나인 이나경 면상 근황

-
익명
조회수 83
추천 0
2025.06.05
프로미스나인 이나경 면상 근황

좋아요 30만여개 받은 카리나 관련 트윗

-
익명
조회수 75
추천 0
2025.06.05
좋아요 30만여개 받은 카리나 관련 트윗

인스타에 유퀴즈 촬영 후기 업로드한 김숙 (ft.과거 맞담 메이트)

-
익명
조회수 90
추천 0
2025.06.05
인스타에 유퀴즈 촬영 후기 업로드한 김숙 (ft.과거 맞담 메이트)

어제 TF회의에서 개인폰번호 공유한 잼통령

-
익명
조회수 91
추천 0
2025.06.05
어제 TF회의에서 개인폰번호 공유한 잼통령

대통령 까짓하느라 상황파악 안되는 애들이 있는데

-
익명
조회수 74
추천 0
2025.06.05
대통령 까짓하느라 상황파악 안되는 애들이 있는데

나 리박스쿨에서 활동 좀 해본 사람인데....

-
익명
조회수 72
추천 0
2025.06.05
나 리박스쿨에서 활동 좀 해본 사람인데....

[포토] 뺨 맞은 권성동

-
익명
조회수 85
추천 0
2025.06.05
[포토] 뺨 맞은 권성동

현재 2찍들 심리상태 ㅋㅋㅋㅋㅋㅋㅋ

-
익명
조회수 78
추천 0
2025.06.05
현재 2찍들 심리상태 ㅋㅋㅋㅋㅋㅋㅋ

강훈식 비서실장 11시간 전 - 30분 전

-
익명
조회수 80
추천 0
2025.06.05
강훈식 비서실장 11시간 전 - 30분 전

우리 빌라 단톡 꽤웃김

-
익명
조회수 100
추천 0
2025.06.05
우리 빌라 단톡 꽤웃김

"망할 회사" 대통령실 여직원 퇴사 영상…논란 커지자 '비공개'

-
익명
조회수 100
추천 0
2025.06.05
"망할 회사" 대통령실 여직원 퇴사 영상…논란 커지자 '비공개'
작성
15 16 17 18 19
2.jpg