[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작
25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.
팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.
연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.
AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.
연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.
다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.
중략
박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit
댓글 0
🔥 실시간 핫이슈 모음
10년전 문채원이 연기했던 레전드 사극 캐릭터
-
익명
조회수
224
추천 0
2025.05.23

대놓고 썸타거나 사귀는 것 보다 서로 호감있는것만 아는 상태가 가장 짜릿한 것 같은 달글
-
익명
조회수
226
추천 0
2025.05.23

내일(23일) 주변 사람들 SNS 프로필 사진 유심히 봐야하는 이유
-
익명
조회수
227
추천 0
2025.05.23

현재 난리 난 밥에 침뱉은 조카 훈육..JPG
-
익명
조회수
230
추천 0
2025.05.23

진심 일본인들 결혼식할때 주례 백인한테 맞기는거 ㄹㅇ임 ㅋㅋㅋㅋㅋㅋㅋ
-
익명
조회수
222
추천 0
2025.05.22

현재 서로 충격받고있는 한국 저녁식사 시간대.JPG
-
익명
조회수
218
추천 0
2025.05.22

"저를 싫어하셨던 분들…” 손흥민 울먹이며 韓 팬들에게 한 말
-
익명
조회수
218
추천 0
2025.05.22

누구나 인정하는 직장인 출근백
-
익명
조회수
227
추천 0
2025.05.22

수요일 자정이 언제인지 논란.jpg
-
익명
조회수
229
추천 0
2025.05.22

여전히 귀엽다는 츄 인스타 근황.jpg
-
익명
조회수
233
추천 0
2025.05.22

한국인들 쉴 때 특징
-
익명
조회수
234
추천 0
2025.05.22

말이 안나오는 현 90대 노인의 근황..jpg
-
익명
조회수
222
추천 0
2025.05.22

[네이트판] 우리 솔직히 못된생각 하나씩 말하고 가자
-
익명
조회수
221
추천 0
2025.05.22
![[네이트판] 우리 솔직히 못된생각 하나씩 말하고 가자](/upload/00b4850c7f2640dda67ccae3ec2124ff.jpg?thumbnail)
성범죄 한 번도 안 당해본 분 있나요?
-
익명
조회수
227
추천 0
2025.05.22

데블스플랜 "그분은 계속 모르셔" 라는 말에 공감하는 사람들 많은 이유
-
익명
조회수
233
추천 0
2025.05.22

