Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 220 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

카톡 선물하기 베스트셀러 하겐다즈 케이크 후기 상태.jpg

-
익명
조회수 303
추천 0
2025.05.19
카톡 선물하기 베스트셀러 하겐다즈 케이크 후기 상태.jpg

(혐) 어제자 남의 집 앞에 똥 싸고 튄 남

-
익명
조회수 289
추천 0
2025.05.19
(혐) 어제자 남의 집 앞에 똥 싸고 튄 남

드디어 올 것이 온 듯한 또간집 다음편 예고🥖

-
익명
조회수 273
추천 0
2025.05.19
드디어 올 것이 온 듯한 또간집 다음편 예고🥖

첫출근한 신입사원이 점심시간에 밥 혼자 먹겠다고 얘기함

-
익명
조회수 288
추천 0
2025.05.19
첫출근한 신입사원이 점심시간에 밥 혼자 먹겠다고 얘기함

누군지 못 알아본 사람 꽤 있다는 긴머리하고 SNL 나온 단발좌.jpg

-
익명
조회수 288
추천 0
2025.05.19
누군지 못 알아본 사람 꽤 있다는 긴머리하고 SNL 나온 단발좌.jpg

노포 라는 단어 보면 뭐가 제일 먼저 생각나?

-
익명
조회수 308
추천 0
2025.05.19
노포 라는 단어 보면 뭐가 제일 먼저 생각나?

볶음밥 기름양

-
익명
조회수 283
추천 0
2025.05.19
볶음밥 기름양

마스크 독특하다는 반응 있는 신인배우

-
익명
조회수 301
추천 0
2025.05.19
마스크 독특하다는 반응 있는 신인배우

현재 기괴하다는 남친사진 본 상사 반응.JPG

-
익명
조회수 295
추천 0
2025.05.19
현재 기괴하다는 남친사진 본 상사 반응.JPG

코인으로 돈벌었다고 갑자기 연락 온 동창

-
익명
조회수 290
추천 0
2025.05.19
코인으로 돈벌었다고 갑자기 연락 온 동창

강남 고속 터미널 소매치기 수법ㄷㄷ

-
익명
조회수 288
추천 0
2025.05.19
강남 고속 터미널 소매치기 수법ㄷㄷ

외국인들이 다이소 명동점에서 쓸어가고 있다는 신상품

-
익명
조회수 278
추천 0
2025.05.19
외국인들이 다이소 명동점에서 쓸어가고 있다는 신상품

尹정부 '나혼산' 말고 '육아콘텐츠' 제작 확대한다…"결혼·출산 긍정 확산"

-
익명
조회수 289
추천 0
2025.05.19
尹정부 '나혼산' 말고 '육아콘텐츠' 제작 확대한다…"결혼·출산 긍정 확산"

[단독] 이혼 요구했다 정신병원 감금… 경찰은 "사설구급대만 잘못”

-
익명
조회수 307
추천 0
2025.05.19

딘딘 네모라이팅 당하는거 직관한 여배우

-
익명
조회수 287
추천 0
2025.05.19
딘딘 네모라이팅 당하는거 직관한 여배우
작성
84 85 86 87 88
2.jpg