Anthropic, iki yıl içinde yapay zekanın kara kutusunu açmak istiyor

Yapay Zeka Şirketi Anthropic, Yapay Zekanın “Kara Kutusu”nu Açmaya Hazırlanıyor!

Yapay zeka teknolojileri her geçen gün daha güçlü hale gelirken, bu sistemlerin nasıl çalıştığı halen tam anlamıyla çözülebilmiş değil. Anthropic CEO’su Dario Amodei, yayınladığı dikkat çekici bir makalede, bu bilinmezliğin tehlikelerine dikkat çekerek şirketinin 2027 yılına kadar yapay zeka modellerindeki sorunların büyük kısmını tespit edebilecek seviyeye ulaşmayı hedeflediğini açıkladı.

Yapay Zekanın Çalışma Mekanizmaları ve Güvenlik Riskleri!

“The Urgency of Interpretability” başlıklı makalede Amodei, mevcut yapay zeka modellerinin nasıl karar verdiğini tam olarak anlayamamanın ciddi bir güvenlik riski oluşturduğunu ifade ediyor. Amodei, “Bu sistemler ekonomi, teknoloji ve ulusal güvenlik için kesinlikle merkezi öneme sahip olacak ve o kadar fazla özerklik kapasitesine sahip olacaklar ki, insanlığın nasıl çalıştıklarından tamamen habersiz olmasının temelde kabul edilemez olduğunu düşünüyorum” sözleriyle durumu özetliyor.

Anthropic’in kurucularından Chris Olah’ın ifadesine göre yapay zeka modelleri “inşa edilmekten ziyade büyütülüyor.” Araştırmacılar zeka seviyelerini artırabiliyor olsa da, bu gelişimin ardındaki mekanizmaları henüz açıklayamıyorlar. Bu da yapay zekanın belirli kararları neden aldığı, bir kelimeyi başka bir kelimeye göre neden tercih ettiği ya da genellikle doğru olmasına rağmen neden ara sıra hata yaptığı gibi konularda ciddi bir bilgi boşluğuna işaret ediyor.

Örneğin, yakın geçmişte OpenAI, daha iyi performans gösteren, ancak aynı zamanda diğer modellerine göre daha fazla hayal gören o3 ve o4-mini adlı yeni muhakeme modellerini yayınladı. Ayrıca firma, bu modellerin neden daha fazla halüsinasyon gördüğü konusunda da bir fikirlerinin olmadığının altını çizdi.

Bu durum aslında bizi korkutmalı. Anthropic, yapay zekanın bu “kara kutusu” üzerinde çalışan, spesifik araştırmalar yapan nadide şirketlerden birisi. Çoğu AI şirketi en azından kamu önünde bu konuyu derinlemesine araştırdıklarını söylemiyor bile.

Yapay Zeka ve AGI Yolculuğunda Önemli Adımlar!

Bununla birlikte Anthropic, modellerin karar süreçlerini “devreler” üzerinden takip ederek nasıl düşündüklerine dair ilk sinyalleri almaya başladı. Ancak bu, halen küçük bir adım. Pandora’nın kutusu daha yeni açılıyor, zira bu tür devrelerden milyonlar hatta milyarlarca olabileceği düşünülüyor.

Amodei, bu modellerin nasıl çalıştığını anlamadan AGI’ye (insan seviyesinde yapay zeka, yapay genel zeka) ulaşmanın tehlikeli olabileceğini söylüyor. Ek olarak Amodei’nin uzun vadeli vizyonu ise oldukça iddialı: Yapay zeka modellerine adeta bir “beyin taraması” yapılması. Bu taramalar sayesinde modellerin dürüstlükten sapma eğilimi, güç kazanma isteği gibi tehlikeli eğilimleri önceden tespit edilebilecek. Bu tür gelişmiş analiz araçlarının geliştirilmesinin beş ila on yıl alabileceği öngörülüyor.

Anthropic’in CEO’su, makalesinde yalnızca kendi şirketine değil, sektöre de bir çağrıda bulunuyor. OpenAI ve Google DeepMind gibi devlerin yorumlanabilirlik araştırmalarına daha fazla kaynak ayırması gerektiğini vurgulayan Amodei, hükümetlere ise regülasyonlarla bu araştırmaları teşvik etme çağrısı yaptı.

Yapay zeka ve özellikle derin öğrenme konusundaki çalışmalarla günümüz yapay zekaların doğmasında büyük pay sahibi olan, bu konuda Nobel Fizik Ödülü’nü alan Geoffrey Hinton’ın kendisi de 2023’te bu ağların nasıl çalıştığını bilmediğini söylemişti. Aşağıdaki videoyu izlemenizi tavsiye ederim.

Related Posts

iPhone 17 ile birlikte, iPhone’larda 12 GB RAM dönemi başlıyor

Apple, iPhone 17 serisinde RAM kapasitesini artırmayı planlıyor. iPhone 17 Air, iPhone 17 Pro ve Pro Max modellerinde 12 GB RAM ile çoklu görev performansı ve Apple Intelligence’ın etkinliği üst seviyelere çıkarılabilir.

“Yeni rengimiz” Olo’dan doğan ilk boya ortaya çıktı: Ve karşınızda YOLO!

Bilim insanları, kısa bir süre önce Olo ismini verdikleri yeni bir renk keşfettiklerini duyurmuş ve büyük bir tartışmanın fitilini ateşlemişti. Ve şimdi bir ressam, bu rengi kullanarak oluşturduğunu söylediği ilk boya olan YOLO’yu resmi olarak duyurdu.

Arkeologlar gladyatörlerin aslanla savaştığını kanıtladı

Bir Roma gladyatörünün iskeletinde tespit edilen ısırık izleri, insan ile aslan arasındaki bir çarpışmanın ilk arkeolojik kanıtı olarak değerlendiriliyor

Samsung PCIe 5.0 destekli 9100 PRO SSD serisi hakkında her şey!

Samsung, PCIe 5.0 teknolojisini kullanan ilk tüketici SSD’si olan 9100 PRO serisini tanıttı. Şirketin yeni SSD modeli, bir önceki nesil 990 PRO’ya göre iki kat daha yüksek performans ve %49’a kadar daha iyi güç verimliliği sunuyor. Samsung 9100 PRO …

Meta’nın akıllı gözlükleri, canlı çeviri özelliği sunuyor!

Meta, Ray-Ban işbirliğiyle geliştirdiği akıllı gözlüklere gerçek zamanlı çeviri özelliği ekledi. Daha önce yalnızca sınırlı sayıda kullanıcı tarafından test edilen bu özellik, 24 Nisan 2025 itibarıyla daha geniş çapta kullanılabilir hale geldi …

Çiftlerin boşanıp boşanmayacağını yüzlerine bakıp söylüyor: Tek bir işaret yetiyor, %93,6 oranında tutuyor

Psikologlara göre, bir evliliğin boşanmayla sonuçlanıp sonuçlanmayacağını anlamak için partnerinizin telefonuna değil, yüzüne bakmanız yeterli olabilir.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir