Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 183 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

포타 진짜 악독한게. twt

-
익명
조회수 247
추천 0
2025.05.21
포타 진짜 악독한게. twt

쩝쩝박사의 라이스페이퍼에 김치볶음밥 넣고 구워 먹기

-
익명
조회수 233
추천 0
2025.05.21
쩝쩝박사의 라이스페이퍼에 김치볶음밥 넣고 구워 먹기

이거 아는 사람 특)

-
익명
조회수 259
추천 0
2025.05.21
이거 아는 사람 특)

"진짜 나왔다" 오뚜기, 진라면 '약간매운맛' 한정판 출시

-
익명
조회수 244
추천 0
2025.05.21
"진짜 나왔다" 오뚜기, 진라면 '약간매운맛' 한정판 출시

방금 길에어 만난 아저씨가 좋은날이래서 탄핵됨줄

-
익명
조회수 257
추천 0
2025.05.21

생각없이 일하는 직업이 좋은 사람들

-
익명
조회수 242
추천 0
2025.05.21
생각없이 일하는 직업이 좋은 사람들

성실하게 살되 적당히 도망치자.twt

-
익명
조회수 253
추천 0
2025.05.21
성실하게 살되 적당히 도망치자.twt

마네킹 아니에요 저희 직원이에요....

-
익명
조회수 239
추천 0
2025.05.21

키아누 리브스 20대 - 30대 - 40대 - 50대.gif

-
익명
조회수 242
추천 0
2025.05.21
키아누 리브스 20대 - 30대 - 40대 - 50대.gif

급 나누기를 귀신같이 잘하는 커피 회사....jpg

-
익명
조회수 250
추천 0
2025.05.21
급 나누기를 귀신같이 잘하는 커피 회사....jpg

쿠팡 로켓프레시 근황

-
익명
조회수 261
추천 0
2025.05.21
쿠팡 로켓프레시 근황

슬기가 밝힌 활동기 몸무게.jpg

-
익명
조회수 253
추천 0
2025.05.21
슬기가 밝힌 활동기 몸무게.jpg

고양이 쌍수 전후 너무 귀여어ㅋㅋㅋㅋㅋㅋㅋㅋㅋ

-
익명
조회수 240
추천 0
2025.05.21
고양이 쌍수 전후 너무 귀여어ㅋㅋㅋㅋㅋㅋㅋㅋㅋ

에어컨 끄는 것 깜빡 잊고 외출 나갔다 집에 돌아온 집사가 목격한 고양이의 반응

-
익명
조회수 256
추천 0
2025.05.21
에어컨 끄는 것 깜빡 잊고 외출 나갔다 집에 돌아온 집사가 목격한 고양이의 반응

대구 옛날햄버거 vs 돈까스버거

-
익명
조회수 249
추천 0
2025.05.21
대구 옛날햄버거 vs 돈까스버거
작성
76 77 78 79 80
2.jpg