Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 239 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

그날 새벽3시 한덕수 말고 후보 등록하러간 또 한명

-
익명
조회수 303
추천 0
2025.05.18
그날 새벽3시 한덕수 말고 후보 등록하러간 또 한명

노화 속도를 4배 늦추는 습관 "20억을 아끼는 효과” 영상 앙딱정

-
익명
조회수 324
추천 0
2025.05.18
노화 속도를 4배 늦추는 습관 "20억을 아끼는 효과” 영상 앙딱정

그 나라까지 갈만한 이 동물들의 귀여움.jpg

-
익명
조회수 299
추천 0
2025.05.18
그 나라까지 갈만한 이 동물들의 귀여움.jpg

입짧은 햇님이 본 비투비 실물 후기.jpg

-
익명
조회수 298
추천 0
2025.05.18
입짧은 햇님이 본 비투비 실물 후기.jpg

요즘 30대는 정말 다 듣는다는 소리.jpg

-
익명
조회수 313
추천 0
2025.05.18
요즘 30대는 정말 다 듣는다는 소리.jpg

손흥민 협박녀, 흉악범 취급?…얼굴도 못 가린 채 출석

-
익명
조회수 327
추천 0
2025.05.18
손흥민 협박녀, 흉악범 취급?…얼굴도 못 가린 채 출석

시아버지 밥 때문에 이혼하네요 +후기

-
익명
조회수 321
추천 0
2025.05.17
시아버지 밥 때문에 이혼하네요 +후기

배쓰밤 풀었는데 김칫국같음

-
익명
조회수 317
추천 0
2025.05.17
배쓰밤 풀었는데 김칫국같음

인스티즈 광기의 비둘기좌

-
익명
조회수 319
추천 0
2025.05.17
인스티즈 광기의 비둘기좌

꽤나 어렵다는 일본학교의 한국어 문제.jpg

-
익명
조회수 302
추천 0
2025.05.17
꽤나 어렵다는 일본학교의 한국어 문제.jpg

현재 지속적인 증언이 나오는 지하철 실화.JPG

-
익명
조회수 321
추천 0
2025.05.17
현재 지속적인 증언이 나오는 지하철 실화.JPG

이재명 2030 여성에 대한 언급 + 실시간으로 공표한 여성정책

-
익명
조회수 317
추천 0
2025.05.17
이재명 2030 여성에 대한 언급 + 실시간으로 공표한 여성정책

현재 난리 난 소개팅 여성 백초크.JPG

-
익명
조회수 308
추천 0
2025.05.17
현재 난리 난 소개팅 여성 백초크.JPG

학교 동기가 어제 가해자가 자살하는 시대가 와서 다행이라고 해서 좀 속으로 놀랬음

-
익명
조회수 321
추천 0
2025.05.17

입사 첫 날 인수인계 받은 중소기업 커피 레시피

-
익명
조회수 307
추천 0
2025.05.17
입사 첫 날 인수인계 받은 중소기업 커피 레시피
작성
90 91 92 93 94
2.jpg