[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작
25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.
팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.
연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.
AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.
연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.
다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.
중략
박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit
댓글 0
🔥 실시간 핫이슈 모음
어르신이 안먹는다는데 이상한거 만드는 백종원.gif
N
-
익명
조회수
17
추천 0
2025.05.27

와이프가 임밍아웃할 때 리액션 잘해야 하는 이유 (ft.곽범)
N
-
익명
조회수
17
추천 0
2025.05.27

mbti I들 사이에서 50 대 50으로 갈린다는 난제
N
-
익명
조회수
14
추천 0
2025.05.27

정웅인 둘째딸 소윤, 日서 뉴진스 멤버로 오해 받았다(내생활)
N
-
익명
조회수
16
추천 0
2025.05.27

전성기 노홍철도 못 이겼던 진짜 광기
N
-
익명
조회수
20
추천 0
2025.05.27

요즘 해외에서 유행중인 비키니라인 태닝
N
-
익명
조회수
20
추천 0
2025.05.27

요즘 유치원 부페 식당 논란.jpg
N
-
익명
조회수
17
추천 0
2025.05.27

육아일기를 18년째 쓰고있는 아빠
N
-
익명
조회수
20
추천 0
2025.05.27

부모님 두분 합쳐서 국민연금 200이면 노후준비 충분한거야?
N
-
익명
조회수
22
추천 0
2025.05.27

한국 푸딩 덕후들의 아픈 손가락
N
-
익명
조회수
18
추천 0
2025.05.27

뚱뚱한 와이프랑 이혼 하고 싶어요..
N
-
익명
조회수
16
추천 0
2025.05.27

현재 모두가 주작이길 바라고있는 판글.JPG
N
-
익명
조회수
22
추천 0
2025.05.27

솔비한테 "전공아닌데 그림 왜그리냐”했던 기안84 학력
N
-
익명
조회수
16
추천 0
2025.05.27

이재명의 검정고시 수험표 사진
N
-
익명
조회수
21
추천 0
2025.05.27

오늘 수학 가르치다가 문제집으로 애를 때렸어요
N
-
익명
조회수
21
추천 0
2025.05.27

