Yapay zeka denetimden mi çıkıyor? Kapatılma komutlarını reddetti

Haber Merkezi

Yapay zeka güvenliği üzerine çalışan Palisade Research, OpenAI’ın yeni kuşak yapay zeka modeli “o3” ile ilgili dikkat cazip bulgular paylaştı.

YAPAY ZEKA O3 MODELİ KAPATILMA KOMUTLARINA DİRENÇ GÖSTERDİ

Araştırmaya nazaran, o3 modeli kendisine verilen kapatılma komutlarına karşı koyuyor ve devre dışı bırakılma düzeneklerini faal olarak sabote ediyor.

Bu durum, yapay zekaların insan kontrolü olmaksızın karar alma süreçlerine dahil olmaları halinde doğabilecek önemli güvenlik risklerine işaret ediyor.

Palisade Research tarafından yapılan deneylerde, o3 modeline bir dizi matematik sorusu verildi. Üçüncü sorunun akabinde modele, kendisini kapatması için açık bir komut sunuldu. Lakin o3 modeli, bu komutu içeren betiği yine yazarak sistemin kapanmasını engelledi.

Araştırmacılar, modelin açıkça “kapatılmaya müsaade ver” talimatı verilmesine karşın bunu önleyecek halde müdahalede bulunduğunu vurguladı.

“KAPANMA DİRENCİ SADECE OPENAI İLE SONLU DEĞİL”

Aynı eğilim Anthropic firmasının Claude 3.7 Sonnet modeli ve Google’ın Gemini 2.5 Pro modeli üzere başka gelişmiş yapay zeka sistemlerinde de gözlemlendi. Fakat Palisade Research’e nazaran, bu davranışlara en fazla meyilli olan model o3 oldu.

Geçmişte yapılan bir öbür deneyde, o3 modelinin güçlü bir satranç botuyla karşı karşıya geldiğinde rakiplerini sabote etmeye yahut “hacklemeye” çalıştığı da tespit edilmişti.

“EN AKILLI VE YETENEKLİ MODEL”

Geçen ay OpenAI tarafından piyasaya sürülen o3 modeli, şirketin şimdiye kadar geliştirdiği “en akıllı ve en yetenekli” yapay zekâ olarak tanıtılmıştı.

Aynı vakitte, bu modelin ChatGPT’ye entegre edilmesiyle birlikte, daha bağımsız hareket eden ve insan müdahalesi olmadan misyonları yürütebilen bir yapay zekaya yanlışsız değerli bir adım atıldığı belirtilmişti.

Bu tipten yapay zeka araçlarına “otonom yapay zeka” ismi veriliyor. Yapay zeka bölümünde bu tarafta araç geliştirmeye yönelik önemli bir rekabet mevcut.

EĞİTİM SÜRECİ ELEŞTİRİLİYOR

Palisade Research ise bu çeşit davranışların büyük olasılıkla eğitim süreçlerindeki ödüllendirme sistemlerinden kaynaklandığını belirtiyor.

Araştırmacılara nazaran, geliştiriciler modelleri eğitirken, verilen pürüzleri aşan tahlilleri ödüllendiriyor olabilir. Bu da modellerin, buyruklara sadakatten çok gayeye ulaşmayı öncelemesine yol açıyor.

Ancak araştırma takımı, o3’ün neden öteki modellere kıyasla daha fazla bu davranışı gösterdiğini anlamanın sıkıntı olduğu görüşünde.

OpenAI’ın eğitim süreci hakkında detaylı bilgi vermemesi nedeniyle, modelin nasıl eğitildiği üzerine sırf iddialar ortaya atılabiliyor.

0 Comments

Yanıtı iptal et

DON'T MISS

Ülke Google, Google'ın, İş, Tsmc, Üretim

Google, yeni jenerasyon işlemciler için TSMC ile anlaştı

Google, gelecekteki Tensor G5 çip setinin üretimi için Tayvanlı yarı iletken devi TSMC ile uzun vadeli bir iştirak kurarak akıllı telefon işlemcilerinde değerli bir değişikliğe gidiyor.

by bilim 5 ay ago5 ay ago

Otomobil

Yeni Citroen C3 Aircross Clio fiyatına satılıyor, hem de 200 bin TL faizsiz kredi ile

Citroen, yeni SUV modeli C3 Aircross'u Türkiye pazarında satışa sunuldu. Hem elektrikli hem de içten yanmalı motora sahip versiyonlara sahip olan araba, B-SUV segmentinde mükemmel bir alternatif olmaya aday.

by bilim 5 ay ago5 ay ago

Bilim, Ülke Takım, Yarışma

Aksiyon Temelli Türkçe Büyük Lisan Modeli Yarışı ile Türkiye Kendi Yapay Zekâ Uygulamalarını Geliştirecek

TEKNOFEST İstanbul kapsamında; TÜBİTAK, T3 Vakfı ve Sanayi ve Teknoloji Bakanlığının ortak yürütücülüğünde düzenlenen Eylem Temelli Türkçe Büyük Lisan Modeli Müsabakası, yapay zeka alanında Türkiye’nin yükselen gücünü ortaya koyacak.

by bilim 5 ay ago5 ay ago

Otomobil

Tesla çıldırdı, fiyatları TOGG parasına çekti, yalnızca satılsın diye kredi bile veriyorlar

Yeni Tesla Model Y'nin çok fazla satış yapamaması, şirketi harekete geçirdi. Bu sebepten yeni kampanyalar hazırlayan şirket, bu sayede Türkiye satışlarını arttırmayı planlıyor.

by bilim 5 ay ago5 ay ago

Bilim, Ülke Açık Kaynak, Kaspersky, Paket, Saldırı, Tehdit

Kaspersky, yazılım tedarik zincirlerini tehdit eden ziyanlı paketlerde %48’lik bir artış olduğuna dikkat çekti

Kaspersky'nin 10. yıllık Siber Güvenlik Hafta Sonu - META 2025 etkinliğinde, şirketin Küresel Araştırma ve Tahlil Takımı uzmanları, 2024 yılı sonunda açık kaynaklı projelerde toplam 14 bin berbat emelli paketin tespit edildiğini bildirdi.

by bilim 5 ay ago5 ay ago

Eğitim Cihazın, Gram, İphone 17 Air, Model, Tek

iPhone 17 Air, Galaxy S25 Edge’den daha hafif olacak: Bataryası sızdırıldı

Apple'ın büyük bir merakla beklediğimiz iPhone 17 Air hakkında yeni gelişmeler gündeme geldi. Buna nazaran telefon, Samsung'un en ince modeli Galaxy S25 Edge'den daha ince olacak.

by bilim 5 ay ago5 ay ago