Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 220 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

日군함 독도 20km 앞 접근, 1년동안 숨겨

-
익명
조회수 299
추천 0
2025.05.19
日군함 독도 20km 앞 접근, 1년동안 숨겨

요리하는 사람마다 다른 굴소스 브랜드 파

-
익명
조회수 293
추천 0
2025.05.19
요리하는 사람마다 다른 굴소스 브랜드 파

대통령 후보 비호감도 1위 근황.jpg

-
익명
조회수 291
추천 0
2025.05.19
대통령 후보 비호감도 1위 근황.jpg

당신은 아기 코알라의 엉덩이를 본 적이 있습니까?

-
익명
조회수 290
추천 0
2025.05.19
당신은 아기 코알라의 엉덩이를 본 적이 있습니까?

현재 또 '피 묻은 빵' 사태 발생한 회사.JPG

-
익명
조회수 284
추천 0
2025.05.19
현재 또 '피 묻은 빵' 사태 발생한 회사.JPG

사실 아기 코끼리는 호다닥 달린다.gif

-
익명
조회수 290
추천 0
2025.05.19
사실 아기 코끼리는 호다닥 달린다.gif

표절 의심되는 영화 파묘

-
익명
조회수 303
추천 0
2025.05.19
표절 의심되는 영화 파묘

오늘자 박혜진 전 MBC 아나운서 인스타 스토리 업로드

-
익명
조회수 296
추천 0
2025.05.19
오늘자 박혜진 전 MBC 아나운서 인스타 스토리 업로드

하스스톤 신규 영웅 변신 카드 "짐 레이너"

-
익명
조회수 295
추천 0
2025.05.19
하스스톤 신규 영웅 변신 카드 "짐 레이너"

내 애인과 이성 직장 동료 단 둘의 술자리 가능하다vs불가능하다

-
익명
조회수 292
추천 0
2025.05.19
내 애인과 이성 직장 동료 단 둘의 술자리 가능하다vs불가능하다

???: 어이 새삥 장기자랑 한번 해봐라

-
익명
조회수 278
추천 0
2025.05.19
???: 어이 새삥 장기자랑 한번 해봐라

손익분기 난리난 안중근 의사 영화, 하얼빈

-
익명
조회수 280
추천 0
2025.05.19
손익분기 난리난 안중근 의사 영화, 하얼빈

막걸리와 동동주의 차이.jpg

-
익명
조회수 281
추천 0
2025.05.19
막걸리와 동동주의 차이.jpg

김세정에게 편지 쓴 엔믹스 해원

-
익명
조회수 304
추천 0
2025.05.19
김세정에게 편지 쓴 엔믹스 해원

휠체어가 필요한 승객을 대하는 항공사와 공항 직원의 태도

-
익명
조회수 302
추천 0
2025.05.19
휠체어가 필요한 승객을 대하는 항공사와 공항 직원의 태도
작성
85 86 87 88 89
2.jpg