Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 140 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

이재명의 검정고시 수험표 사진

-
익명
조회수 136
추천 0
2025.05.27
이재명의 검정고시 수험표 사진

오늘 수학 가르치다가 문제집으로 애를 때렸어요

-
익명
조회수 139
추천 0
2025.05.27
오늘 수학 가르치다가 문제집으로 애를 때렸어요

1970년대 영화 촬영 기법

-
익명
조회수 136
추천 0
2025.05.27
1970년대 영화 촬영 기법

인터넷에서 가정사 얘기할 때 넌씨눈인거 고르기

-
익명
조회수 142
추천 0
2025.05.27
인터넷에서 가정사 얘기할 때 넌씨눈인거 고르기

실시간 공부왕찐천재 대선후보편 소퀴벌레 펨퀴벌레들 몰려옴

-
익명
조회수 140
추천 0
2025.05.27
실시간 공부왕찐천재 대선후보편 소퀴벌레 펨퀴벌레들 몰려옴

한국인들이 유독 좋아한다는 식감.JPG

-
익명
조회수 130
추천 0
2025.05.27
한국인들이 유독 좋아한다는 식감.JPG

민주당 유세원 차로 치고 폭행하는 대구남 영상

-
익명
조회수 141
추천 0
2025.05.27
민주당 유세원 차로 치고 폭행하는 대구남 영상

6.25 때 우리나라 도와준 대만 뒷통수 친 뒤 꾸준히 친중 하는 국민의힘 친중역사 (노태우 이명박 박근혜 이준석 윤석열)

-
익명
조회수 142
추천 0
2025.05.27
6.25 때 우리나라 도와준 대만 뒷통수 친 뒤 꾸준히 친중 하는 국민의힘 친중역사 (노태우 이명박 박근혜 이준석 윤석열)

평생 3가지튀김만 먹을수있다면?

-
익명
조회수 129
추천 0
2025.05.27
평생 3가지튀김만 먹을수있다면?

아들한테 밥 얻어먹음

-
익명
조회수 142
추천 0
2025.05.27
아들한테 밥 얻어먹음

의외로 합성이 아니라는 사진

-
익명
조회수 138
추천 0
2025.05.27
의외로 합성이 아니라는 사진

화장실까지 따라오는 댕댕이들

-
익명
조회수 129
추천 0
2025.05.27
화장실까지 따라오는 댕댕이들

포켓몬 vs 디지몬 진화 비교

-
익명
조회수 137
추천 0
2025.05.27
포켓몬 vs 디지몬 진화 비교

순대 간 넉넉히 달라고 한 결과

-
익명
조회수 135
추천 0
2025.05.27
순대 간 넉넉히 달라고 한 결과

동물농장 저번주 레전드 회차 수리부엉이 가족과 둘째 이야기.jpg

-
익명
조회수 155
추천 0
2025.05.27
동물농장 저번주 레전드 회차 수리부엉이 가족과 둘째 이야기.jpg
작성
42 43 44 45 46
2.jpg