Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 156 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

나 이렇게 돈쓰기 싫어하는 팬덤 처음봄

-
익명
조회수 213
추천 0
2025.05.24
나 이렇게 돈쓰기 싫어하는 팬덤 처음봄

인성이 보였다는 어제자 대선후보토론회 .jpg

-
익명
조회수 204
추천 0
2025.05.24
인성이 보였다는 어제자 대선후보토론회 .jpg

중소돌 노래 제목까지 교묘하게 바꿔서 표절한 듯한 NCT127 노래(수록곡)

-
익명
조회수 205
추천 0
2025.05.24
중소돌 노래 제목까지 교묘하게 바꿔서 표절한 듯한 NCT127 노래(수록곡)

네팔에서 이미지가 망가지고 있다는 한국

-
익명
조회수 209
추천 0
2025.05.24
네팔에서 이미지가 망가지고 있다는 한국

현재 폭발한 연애남매 재형 마지막 경고문.JPG

-
익명
조회수 189
추천 0
2025.05.24
현재 폭발한 연애남매 재형 마지막 경고문.JPG

커피맛 막걸리 후기.jpg

-
익명
조회수 210
추천 0
2025.05.24
커피맛 막걸리 후기.jpg

아이들을 아이패드 없이 키우면 생기는 일

-
익명
조회수 193
추천 0
2025.05.24
아이들을 아이패드 없이 키우면 생기는 일

국민의힘 대선 후보 교체

-
익명
조회수 212
추천 0
2025.05.24
국민의힘 대선 후보 교체

찰스가 말하는 모솔의 기준.twt

-
익명
조회수 219
추천 0
2025.05.24

이영지급으로 사이버 도화살 있는 것 같은 연예인

-
익명
조회수 209
추천 0
2025.05.24
이영지급으로 사이버 도화살 있는 것 같은 연예인

이재명: 그래서 이준석 후보는 대안이 있으세요?

-
익명
조회수 216
추천 0
2025.05.24
이재명: 그래서 이준석 후보는 대안이 있으세요?

푸라닭치킨 근황.jpg

-
익명
조회수 220
추천 0
2025.05.24
푸라닭치킨 근황.jpg

다친 햄스터 야매로 수술해준 디시인

-
익명
조회수 218
추천 0
2025.05.24
다친 햄스터 야매로 수술해준 디시인

태국 경찰 폭행범 머그샷

-
익명
조회수 211
추천 0
2025.05.24
태국 경찰 폭행범 머그샷

마지막회를 제대로 안봐서 아무도 모르는 윤소희 데블스플랜2 참가소감

-
익명
조회수 212
추천 0
2025.05.24
마지막회를 제대로 안봐서 아무도 모르는 윤소희 데블스플랜2 참가소감
작성
58 59 60 61 62
2.jpg