Droowa

[속보] "영화속 일이 실제로"…영국서 AI 인간 통제 벗어나려 지시거부, 코드 조작

-
익명
2025.05.26 추천 0 조회수 151 댓글 0

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자([email protected])
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






댓글 0

🔥 실시간 핫이슈 모음

진짜 분노조절장애

-
익명
조회수 180
추천 0
2025.05.26
진짜 분노조절장애

이재명 찬조연설 나선 이기영 "뭐 하나라도 도움될까 싶어…"

-
익명
조회수 164
추천 0
2025.05.26
이재명 찬조연설 나선 이기영 "뭐 하나라도 도움될까 싶어…"

[응답하라1988] 어른은 그저 견디고 있을 뿐이다

-
익명
조회수 169
추천 0
2025.05.26
[응답하라1988] 어른은 그저 견디고 있을 뿐이다

혈당 스파이크가 몸을 아프게 하는 이유.jpg

-
익명
조회수 170
추천 0
2025.05.26
혈당 스파이크가 몸을 아프게 하는 이유.jpg

대략 2분동안 19번 맞았습니다

-
익명
조회수 166
추천 0
2025.05.26
대략 2분동안 19번 맞았습니다

알고보면 더 재밌는 이재명 사이다 모음

-
익명
조회수 171
추천 0
2025.05.26
알고보면 더 재밌는 이재명 사이다 모음

멀.꾸(멀티탭 꾸미기)

-
익명
조회수 159
추천 0
2025.05.26
멀.꾸(멀티탭 꾸미기)

대통령 선거, 누구에게 투표해야 할지 아직 고민중이라면

-
익명
조회수 160
추천 0
2025.05.26
대통령 선거, 누구에게 투표해야 할지 아직 고민중이라면

냥냥펀치 각이 안나옴

-
익명
조회수 160
추천 0
2025.05.26
냥냥펀치 각이 안나옴

성시경이 인정하는 노래 잘하는 가수

-
익명
조회수 160
추천 0
2025.05.26
성시경이 인정하는 노래 잘하는 가수

린넨 팬츠 이렇게 잘 비친다는 게 당황스러운 달글

-
익명
조회수 165
추천 0
2025.05.26
린넨 팬츠 이렇게 잘 비친다는 게 당황스러운 달글

카페에서 남녀 커플의 입장차이

-
익명
조회수 168
추천 0
2025.05.26
카페에서 남녀 커플의 입장차이

실시간 알티타는 쿠우쿠우 근황...x

-
익명
조회수 173
추천 0
2025.05.26
실시간 알티타는 쿠우쿠우 근황...x

솔직히 나는 월급 70%이삭 저축 안하는 사람들 보면 좀.....

-
익명
조회수 165
추천 0
2025.05.26
솔직히 나는 월급 70%이삭 저축 안하는 사람들 보면 좀.....

챗GPT 성인모드 출시 예정

-
익명
조회수 180
추천 0
2025.05.25
챗GPT 성인모드 출시 예정
작성
50 51 52 53 54
2.jpg