[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작
25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.
팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.
연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.
AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.
연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.
다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.
중략
박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit
댓글 0
🔥 실시간 핫이슈 모음
실시간 국장 상황
-
익명
조회수
272
추천 0
2025.05.20

폭싹 속았수다)애순이 애교 너무껴서 관식이 정신못차리는거 미치겠음.twt
-
익명
조회수
300
추천 0
2025.05.20
무인카페에서 데이트하다가 경찰서 가기 직전인 커플
-
익명
조회수
276
추천 0
2025.05.20

유튜버 궤도가 말하는 한국사회의 치명적인 문제점
-
익명
조회수
288
추천 0
2025.05.20

"밤 '10시 39분' 지나서 자면 아무리 자도 피곤하다"
-
익명
조회수
277
추천 0
2025.05.20

남연들 병크 or 범죄칠 때마다 인용에 해외팬들이 꼭 올리는 짤
-
익명
조회수
285
추천 0
2025.05.20

고양이 앞에서 익사하는 척 해보기.jpg
-
익명
조회수
272
추천 0
2025.05.20

호불호 갈린다는 홍콩식 아침식사.JPG
-
익명
조회수
285
추천 0
2025.05.20

삶에 큰 의미가 있을 필요가 없습니다.twt
-
익명
조회수
291
추천 0
2025.05.20

현재 말 나오는 투어스 도훈 관상.JPG
-
익명
조회수
284
추천 0
2025.05.20

현재 댓글창 난리 난 여단오 채널.JPG
-
익명
조회수
276
추천 0
2025.05.20

회사생활 너무 편해서 현타온 직장인
-
익명
조회수
291
추천 0
2025.05.19

마음대로 단골 손님한테 공짜 커피 준 갠카 직원.jpg
-
익명
조회수
263
추천 0
2025.05.19

아이들 우기 발언 공식 사과.JPG
-
익명
조회수
292
추천 0
2025.05.19

직업 만족도 최상인듯한 김상욱......
-
익명
조회수
286
추천 0
2025.05.19

