[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작
25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.
팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.
연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.
AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.
연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.
다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.
중략
박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit
댓글 0
🔥 실시간 핫이슈 모음
장기연애면 이런 마음으로 결혼하는 경우도 많나요?
-
익명
조회수
269
추천 0
2025.05.20

집안일하다 서러워서 폭발한 남편.jpg
-
익명
조회수
265
추천 0
2025.05.20

'44세' 김대명, 5수 도전해 입학한 S 대학교 '21년' 만에 졸업했다
-
익명
조회수
275
추천 0
2025.05.20

결혼 13년 차 곽범이 말하는 와이프 화 풀어주는 팁.jpg
-
익명
조회수
273
추천 0
2025.05.20

실내흡연 주의 안내에 "냄새 싫은 건 본인 취향…범죄자 취급 마라"
-
익명
조회수
271
추천 0
2025.05.20

애인이 너무 더워서 소중이에 땀 찬다고 얘기함.jpg
-
익명
조회수
262
추천 0
2025.05.20

관식이병 걸린 사람들한테 일침날리는 이상엽...jpg
-
익명
조회수
254
추천 0
2025.05.20

의학 역사에서 가장 쩔었던 순간중에 하나.jpg
-
익명
조회수
280
추천 0
2025.05.20

연봉 1억 아파트 외벽 도장공
-
익명
조회수
284
추천 0
2025.05.20

내몸을 자꾸 만지는 장애인근로자분
-
익명
조회수
282
추천 0
2025.05.20

바닷가에서 인형 사진을 찍으면 안되는 이유
-
익명
조회수
285
추천 0
2025.05.20

채소가 혈당스파이크를 얼마나 막는지 실험한 유튜버.jpg
-
익명
조회수
273
추천 0
2025.05.20

데블스플랜2 누가 우승할지 예측해보는 글 (ㅅㅍㅈㅇ)
-
익명
조회수
263
추천 0
2025.05.20

나 편의점에서 민폐짓 한건가?.jpg
-
익명
조회수
279
추천 0
2025.05.20

[단독] "임신, 두 남자에게 연락했다"…손흥민, 공갈 사건의 반전
-
익명
조회수
263
추천 0
2025.05.20
![[단독] "임신, 두 남자에게 연락했다"…손흥민, 공갈 사건의 반전](/upload/1e9429b6df3c46b08f0a64c6ef6eeea6.jpg?thumbnail)
