Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 165 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자(yspark@dt.co.kr)
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

잡식공룡 기부 인증 게시글에 달린 광주 시민의 댓글

N
-
익명
조회수 23
추천 0
2025.06.07
잡식공룡 기부 인증 게시글에 달린 광주 시민의 댓글

또 시작한 쓰레기언론들.....twt

N
-
익명
조회수 37
추천 0
2025.06.06
또 시작한 쓰레기언론들.....twt

𝙅𝙊𝙉𝙉𝘼싸가지 없다고 말나오는 기자.....

N
-
익명
조회수 26
추천 0
2025.06.06
𝙅𝙊𝙉𝙉𝘼싸가지 없다고 말나오는 기자.....

25만원에 개거품 무는 새끼들 특

N
-
익명
조회수 27
추천 0
2025.06.06
25만원에 개거품 무는 새끼들 특

현재 반응 역대급으로 좋다는 셀린느 신상백.JPG

N
-
익명
조회수 31
추천 0
2025.06.06
현재 반응 역대급으로 좋다는 셀린느 신상백.JPG

교토식화법) 이중에 진짜로 커피 마시자고 한 사람은?

N
-
익명
조회수 29
추천 0
2025.06.06
교토식화법) 이중에 진짜로 커피 마시자고 한 사람은?

전국민 25만원 민생지원금 지급 검토중

N
-
익명
조회수 31
추천 0
2025.06.06
전국민 25만원 민생지원금 지급 검토중

중국어 배우기 싫다던 유튜버 잡식공룡 반전...jpg

N
-
익명
조회수 28
추천 0
2025.06.06
중국어 배우기 싫다던 유튜버 잡식공룡 반전...jpg

한가인이 자녀들 대학생 되기전까지 하지 말았으면 하는 것.jpg

N
-
익명
조회수 27
추천 0
2025.06.06
한가인이 자녀들 대학생 되기전까지 하지 말았으면 하는 것.jpg

산속에 버려진 시력잃은 노견과 후기

N
-
익명
조회수 28
추천 0
2025.06.06
산속에 버려진 시력잃은 노견과 후기

이 미친 정권은 대체 3년동안 뭘한거냐? 공무원들 데리고 놀고 먹었어?

N
-
익명
조회수 26
추천 0
2025.06.06

현재 𝙅𝙊𝙉𝙉𝘼 인지부조화 온다는 김상욱 의원 상탈.JPG

N
-
익명
조회수 28
추천 0
2025.06.06
현재 𝙅𝙊𝙉𝙉𝘼 인지부조화 온다는 김상욱 의원 상탈.JPG

'다슈 모델' 김종석 4일 사망 충격···항년 29세

N
-
익명
조회수 33
추천 0
2025.06.06
'다슈 모델' 김종석 4일 사망 충격···항년 29세

대통령실 브리핑 대단하닼ㅋㅋㅋ오늘 시장 구매 목록까지 다 알려줌ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

N
-
익명
조회수 32
추천 0
2025.06.06

국제적으로 패싱당한 대통령;;

N
-
익명
조회수 31
추천 0
2025.06.06
국제적으로 패싱당한 대통령;;
작성
5 6 7 8 9
2.jpg