Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 23 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

강아지 개빡친거같은데 어떻함....

N
-
익명
조회수 5
추천 0
2025.05.28
강아지 개빡친거같은데 어떻함....

이준석 '여성 신체 질의가 "왜 문제인지도 모르겠다

N
-
익명
조회수 5
추천 0
2025.05.28
이준석 '여성 신체 질의가 "왜 문제인지도 모르겠다

오늘도 대선토론 때 실시간으로 정말 바빴던 민주당

N
-
익명
조회수 4
추천 0
2025.05.28
오늘도 대선토론 때 실시간으로 정말 바빴던 민주당

조규성 합병증 원인 수술 중 수혈에서 혈액감염

N
-
익명
조회수 5
추천 0
2025.05.28

선거 투표 안하는 사람들 벌금 10만원씩 부과하는 거 어떻게 생각해?.jpg

N
-
익명
조회수 7
추천 0
2025.05.28
선거 투표 안하는 사람들 벌금 10만원씩 부과하는 거 어떻게 생각해?.jpg

직장인이 몸 만들기 제일 쉽다는 운동 유튜버

N
-
익명
조회수 4
추천 0
2025.05.28
직장인이 몸 만들기 제일 쉽다는 운동 유튜버

실패없는 맛집 찾는법

N
-
익명
조회수 5
추천 0
2025.05.28
실패없는 맛집 찾는법

밤에 먹어도 괜찮은 야식 9개

N
-
익명
조회수 6
추천 0
2025.05.28
밤에 먹어도 괜찮은 야식 9개

형제의 나라 튀르키예 근황

N
-
익명
조회수 6
추천 0
2025.05.28
형제의 나라 튀르키예 근황

AI에 밥그릇 뺏길줄 알았는데 … 통번역 업계 "오히려 더 호황"

N
-
익명
조회수 6
추천 0
2025.05.28

방 안치우는 사람 특징.jpg

N
-
익명
조회수 5
추천 0
2025.05.28
방 안치우는 사람 특징.jpg

혐)이준석 젓가락 발언 영상(유튜브)

N
-
익명
조회수 6
추천 0
2025.05.28
혐)이준석 젓가락 발언 영상(유튜브)

비싸다 vs 아니다로 여전히 많이 갈리는 메뉴

N
-
익명
조회수 5
추천 0
2025.05.28
비싸다 vs 아니다로 여전히 많이 갈리는 메뉴

직장인 등급.jpg

N
-
익명
조회수 4
추천 0
2025.05.28
직장인 등급.jpg

정반대로 생겼는데 이목구비 위치는 거의 비슷하다는 아이린 슬기

N
-
익명
조회수 4
추천 0
2025.05.28
정반대로 생겼는데 이목구비 위치는 거의 비슷하다는 아이린 슬기
작성
2 3 4 5 6
2.jpg