Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 156 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

지붕 뚫고 하이킥 아역 배우들 나이 근황

-
익명
조회수 185
추천 0
2025.05.25
지붕 뚫고 하이킥 아역 배우들 나이 근황

쿠팡 2L*6병 생수 80묶음 반품 시킨 고객

-
익명
조회수 214
추천 0
2025.05.25
쿠팡 2L*6병 생수 80묶음 반품 시킨 고객

서울에서 직장다니던 부산친구가 남긴 명언

-
익명
조회수 196
추천 0
2025.05.25
서울에서 직장다니던 부산친구가 남긴 명언

현재 난리 난 시어머니 충격 실화.JPG

-
익명
조회수 207
추천 0
2025.05.25
현재 난리 난 시어머니 충격 실화.JPG

문희준 소율 딸아들 근황

-
익명
조회수 207
추천 0
2025.05.25
문희준 소율 딸아들 근황

이창섭이 전과자 하차한 이유

-
익명
조회수 197
추천 0
2025.05.25
이창섭이 전과자 하차한 이유

자존감 엄청 높다는 mbti

-
익명
조회수 201
추천 0
2025.05.24
자존감 엄청 높다는 mbti

"女목소리 80데시벨 넘어선 안 돼" "말대꾸 금지"…남고생이 든 손팻말 '발칵'

-
익명
조회수 188
추천 0
2025.05.24
"女목소리 80데시벨 넘어선 안 돼" "말대꾸 금지"…남고생이 든 손팻말 '발칵'

어떤 손흥민팬의 탈덕문

-
익명
조회수 204
추천 0
2025.05.24
어떤 손흥민팬의 탈덕문

"성욕 없다" 8년간 부부관계 거부한 남편…이혼 후 '시험관 아이' 데려가 잠적

-
익명
조회수 195
추천 0
2025.05.24
"성욕 없다" 8년간 부부관계 거부한 남편…이혼 후 '시험관 아이' 데려가 잠적

윤민수, 이혼한 전처와 해외여행…윤후와 셋이 일본행 '쿨

-
익명
조회수 196
추천 0
2025.05.24
윤민수, 이혼한 전처와 해외여행…윤후와 셋이 일본행 '쿨

대한간호협회, 대한한의사협회 김문수 지지선언. (본문)

-
익명
조회수 189
추천 0
2025.05.24

현재 난리 난 신축 래미안 미감.JPG

-
익명
조회수 210
추천 0
2025.05.24
현재 난리 난 신축 래미안 미감.JPG

[데블스플랜2] 촬영하는동안 3.6kg이 빠졌다는 손은유

-
익명
조회수 227
추천 0
2025.05.24
[데블스플랜2] 촬영하는동안 3.6kg이 빠졌다는 손은유

읽씹 당해도 안 민망한 카톡 기술 ㅋㅋㅋ

-
익명
조회수 219
추천 0
2025.05.24
읽씹 당해도 안 민망한 카톡 기술 ㅋㅋㅋ
작성
57 58 59 60 61
2.jpg