[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작
25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.
팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.
연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.
AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.
연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.
다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.
중략
박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit
댓글 0
🔥 실시간 핫이슈 모음
한반도를 연상케하는 퀸가비의 춤사위 (범접)
-
익명
조회수
134
추천 0
2025.05.27

찐고수 와인 덕후 한국인을 만난 이탈리아 소믈리에의 반응
-
익명
조회수
133
추천 0
2025.05.27

"5월 2일까지 전입신고 완료해야 새 주소지서 대선 투표 가능"
-
익명
조회수
129
추천 0
2025.05.27

현실에서 여자 33살 남자 38살 나이차이 흔해?.jpg
-
익명
조회수
128
추천 0
2025.05.27

살코남들이 민주당의원들 포함 진보진영 인사들 하도 무시하고 학력 대라고 쌩난리를 치길래 궁금해서 대강 학력 무작위로 찾아봄
-
익명
조회수
134
추천 0
2025.05.27

출근해서 점심 먹고 사투할 때!!! 봉투 주는데 테이프 밀봉 안 하면 무효표야!!!!!!!!!
-
익명
조회수
131
추천 0
2025.05.27
샤워하면서 노래 듣는 거 좋아하는 사람 공감..jpg
-
익명
조회수
127
추천 0
2025.05.27

스레드에서 500플 넘게 달린 국밥 매너
-
익명
조회수
134
추천 0
2025.05.27

내현적 나르시스트는 답도 없다
-
익명
조회수
131
추천 0
2025.05.27

업무메일 보낼때 발생하는 일
-
익명
조회수
130
추천 0
2025.05.27

𝙅𝙊𝙉𝙉𝘼 충격적인 그 당시 문방구 군것질.JPG
-
익명
조회수
137
추천 0
2025.05.27

오히려 너무 잘생겨서 저평가되는 스트리머
-
익명
조회수
140
추천 0
2025.05.27

남편이 의대 합격해서 갑분싸된 집
-
익명
조회수
129
추천 0
2025.05.27

데블스플랜2 스텝 인스스
-
익명
조회수
143
추천 0
2025.05.27

정샘물 NEW 모델.jpg
-
익명
조회수
143
추천 0
2025.05.27

