[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작
25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.
팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.
연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.
AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.
연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.
다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.
중략
박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit
댓글 0
🔥 실시간 핫이슈 모음
현재 반응 갈리는 "연예인 실물후기 𝙅𝙊𝙉𝙉𝘼 허언같음”
N
-
익명
조회수
50
추천 0
2025.05.27

이동욱이 핑계고 촌캉스 가서 쓴 메모.jpg
N
-
익명
조회수
49
추천 0
2025.05.27

요리 초보의 충격적인 전복 세척 대참사
N
-
익명
조회수
47
추천 0
2025.05.27

확신의 햄찌상 같은 WM에서 데뷔하는 여돌 멤버.jpg
N
-
익명
조회수
51
추천 0
2025.05.27

어제자 대구 유세현장 차량 돌진 사건 총정리 .gif
N
-
익명
조회수
50
추천 0
2025.05.27

미용실 원장요금 냈는데, 시술은 보조직원이?💇🏻♀️ 괜찮을까?
N
-
익명
조회수
48
추천 0
2025.05.27

정현규, 성해은 결별설 해명 "상품화 싫어서…지금도 응원하는 사이"
N
-
익명
조회수
51
추천 0
2025.05.27

한국에서 가장 흔하다는 중산층 유형...jpg
N
-
익명
조회수
50
추천 0
2025.05.27

현재 대부분 외국기업으로 알고있다는 카페.JPG
N
-
익명
조회수
47
추천 0
2025.05.27

(ㅎㅇㅈㅇ) 구로디지털단지 배수로 실제상황.gif
N
-
익명
조회수
52
추천 0
2025.05.27

배우 최정우 본인상... 향년 69세
N
-
익명
조회수
52
추천 0
2025.05.27

병에 걸리지 않았는데 착각으로 고통을 만들어 안타까운 일을 당한 사람들..
N
-
익명
조회수
52
추천 0
2025.05.27

법륜스님) 도벽이 있고 거짓말하는 직원을 어떡해야 할까요?
N
-
익명
조회수
53
추천 0
2025.05.27

대구 빨봉분식
N
-
익명
조회수
49
추천 0
2025.05.27

어르신이 안먹는다는데 이상한거 만드는 백종원.gif
N
-
익명
조회수
50
추천 0
2025.05.27

