Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 143 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

[나혼자산다] 10년 넘게 단골이라는 강원도 능이백숙집 찾아간 샤이니 키

-
익명
조회수 147
추천 0
2025.05.26
[나혼자산다] 10년 넘게 단골이라는 강원도 능이백숙집 찾아간 샤이니 키

네팔 가서 신명나 게 살풀이 한판 하고 왔다는 기안

-
익명
조회수 148
추천 0
2025.05.26
네팔 가서 신명나 게 살풀이 한판 하고 왔다는 기안

현재 충격적이라는 초등학교 졸사.JPG

-
익명
조회수 153
추천 0
2025.05.26
현재 충격적이라는 초등학교 졸사.JPG

현재 카리나 데리고 또 한건했다는 젠틀몬스터.JPG

-
익명
조회수 156
추천 0
2025.05.26
현재 카리나 데리고 또 한건했다는 젠틀몬스터.JPG

남편 아침밥 해주는게 그렇게 욕먹을 일이야?

-
익명
조회수 147
추천 0
2025.05.26
남편 아침밥 해주는게 그렇게 욕먹을 일이야?

운동권 달란트를 타고난 배우들..

-
익명
조회수 146
추천 0
2025.05.26
운동권 달란트를 타고난 배우들..

성전환 수술 후회하는 트랜스젠더 분 있으실까요?

-
익명
조회수 146
추천 0
2025.05.26
성전환 수술 후회하는 트랜스젠더 분 있으실까요?

김문수가 대통령 되면 제일 걱정되는 부분 .jpg

-
익명
조회수 150
추천 0
2025.05.26
김문수가 대통령 되면 제일 걱정되는 부분 .jpg

모델 하려고 110kg에서 40kg를 뺐다는 김재영

-
익명
조회수 143
추천 0
2025.05.26
모델 하려고 110kg에서 40kg를 뺐다는 김재영

샤이니 종현이 말했던 투표를 해야 하는 이유

-
익명
조회수 147
추천 0
2025.05.26
샤이니 종현이 말했던 투표를 해야 하는 이유

대단한 나쵸 단종이 이해되는 나쵸 신상

-
익명
조회수 149
추천 0
2025.05.26
대단한 나쵸 단종이 이해되는 나쵸 신상

부산 낙동고 졸업사진에 등장한 나치 경례

-
익명
조회수 144
추천 0
2025.05.26
부산 낙동고 졸업사진에 등장한 나치 경례

부산을 대표하는 어묵 브랜드 라이벌

-
익명
조회수 148
추천 0
2025.05.26
부산을 대표하는 어묵 브랜드 라이벌

현재 너무 놀랍다는 그알 이수정 교수 근황.JPG

-
익명
조회수 148
추천 0
2025.05.26
현재 너무 놀랍다는 그알 이수정 교수 근황.JPG

현재 미국에서 난리난.. (나혼자만 레벨업) 애니 파급력

-
익명
조회수 147
추천 0
2025.05.26
현재 미국에서 난리난.. (나혼자만 레벨업) 애니 파급력
작성
46 47 48 49 50
2.jpg