Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 153 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

"기사님 프사가 너무 무서워요"

-
익명
조회수 198
추천 0
2025.05.25
"기사님 프사가 너무 무서워요"

신입사원이 물어보지도 않고 사무실 에어컨 틀어서 빡침.jpg

-
익명
조회수 193
추천 0
2025.05.25
신입사원이 물어보지도 않고 사무실 에어컨 틀어서 빡침.jpg

회사 신입과 5년차이..

-
익명
조회수 195
추천 0
2025.05.25
회사 신입과 5년차이..

엄청 힘든 시기에 나타난 귀신.jpg

-
익명
조회수 193
추천 0
2025.05.25
엄청 힘든 시기에 나타난 귀신.jpg

현재 기준 애 한명 낳으면 나라에서 받는 지원금

-
익명
조회수 190
추천 0
2025.05.25
현재 기준 애 한명 낳으면 나라에서 받는 지원금

진짜 각잡고 공부할때 모습

-
익명
조회수 196
추천 0
2025.05.25
진짜 각잡고 공부할때 모습

사람들이 쏘렌토 많이 타는 이유

-
익명
조회수 191
추천 0
2025.05.25
사람들이 쏘렌토 많이 타는 이유

판) 중딩 때 말조심 안하고 다녔는데 너무 후회됨

-
익명
조회수 208
추천 0
2025.05.25
판) 중딩 때 말조심 안하고 다녔는데 너무 후회됨

반년동안 모은 자전거 바구니 사진 🚲✨🌿

-
익명
조회수 206
추천 0
2025.05.25
반년동안 모은 자전거 바구니 사진 🚲✨🌿

안유진이 본인이랑 너무 안어울린다고 생각했다는 아이브 노래

-
익명
조회수 192
추천 0
2025.05.25
안유진이 본인이랑 너무 안어울린다고 생각했다는 아이브 노래

쿠팡에서 98만원 주고 샀는데 다음날 73만 원.. 이건 좀 아니지 않나요?

-
익명
조회수 197
추천 0
2025.05.25
쿠팡에서 98만원 주고 샀는데 다음날 73만 원.. 이건 좀 아니지 않나요?

친구 모임에서 항상 계산 총대 메는 애가 있었는데

-
익명
조회수 187
추천 0
2025.05.25
친구 모임에서 항상 계산 총대 메는 애가 있었는데

쿠팡 육개장 대란 이후 난리났다는 문의란

-
익명
조회수 189
추천 0
2025.05.25
쿠팡 육개장 대란 이후 난리났다는 문의란

축제때 싸움난 한양대 중재하는 체리필터

-
익명
조회수 201
추천 0
2025.05.25
축제때 싸움난 한양대 중재하는 체리필터

5월 24일 생일축하노래

-
익명
조회수 203
추천 0
2025.05.25
5월 24일 생일축하노래
작성
53 54 55 56 57
2.jpg