Yapay zeka bilgiyi nereden alıyor?

Yapay zeka bilgiyi nereden alıyor?

Hiç oturup kafanızı kaşıdınız mı, " Bunlar nereden geliyor ?" diye? Yani, yapay zekâ tozlu kütüphane raflarını karıştırmıyor veya gizlice YouTube kısa filmleri izlemiyor. Yine de, lazanya hilelerinden kara delik fiziğine kadar her şeye cevaplar üretiyor; sanki içinde dipsiz bir dosya dolabı varmış gibi. Gerçek ise tahmin ettiğinizden daha tuhaf ve belki de daha ilgi çekici. Hadi biraz açalım (ve evet, belki bu arada birkaç efsaneyi de çürütelim).


Büyü mü? 🌐

Büyücülük değil, ama bazen öyle hissettiriyor. Perdenin ardında olup bitenler aslında bir kalıp tahmini . Büyük dil modelleri (LLM'ler), bilgileri depolamaz ; bunun yerine, bir sonraki kelimeyi (token) kendinden önce gelene dayanarak tahmin etmek üzere eğitilirler [2]. Pratikte bu, ilişkileri yakaladıkları anlamına gelir: hangi kelimelerin bir arada durduğu, cümlelerin genellikle nasıl şekillendiği, bütünsel fikirlerin iskele gibi nasıl inşa edildiği. Çıktının kulağa gelmesinin , dürüst olmak gerekirse, istatistiksel bir taklit olmasına rağmen, kavrama değil [4].

faydalı kılan şey nedir ? Birkaç şey:

  • Veri çeşitliliği - tek bir dar akıştan değil, sayısız kaynaktan veri çekmek.

  • Güncellemeler - yenileme döngüleri olmadan, çok çabuk bayatlar.

  • Filtreleme - İdeal olarak, çöplerin içeri sızmadan önce yakalanması (gerçi gerçekçi olalım, bu ağın delikleri var).

  • Çapraz kontrol - çoğu yapay zeka yönetişim kılavuzunda bulunması gereken bir zorunluluk olan otorite kaynaklarına (NASA, WHO, büyük üniversiteler gibi) yaslanma [3].

Yine de, bazen kendinden emin bir şekilde uyduruyor. O sözde halüsinasyonlar mı? Temelde, ciddi bir yüzle dile getirilen cilalı saçmalıklar [2][3].

Bu yazıdan sonra okumak isteyebileceğiniz yazılar:

🔗 Yapay zeka piyango numaralarını tahmin edebilir mi?
Yapay zeka piyango tahminleri hakkındaki efsaneleri ve gerçekleri araştırıyoruz.

🔗 Yapay zekaya bütünsel bir yaklaşım benimsemek ne anlama geliyor?
Etik ve etki üzerine dengeli bakış açılarıyla yapay zekayı anlamak.

🔗 İncil yapay zeka hakkında ne diyor?
Teknoloji ve insan yaratılışına ilişkin İncil perspektiflerinin incelenmesi.


Hızlı Karşılaştırma: Yapay Zeka Nereden Faydalanıyor? 📊

Her kaynak aynı değildir, ancak her biri kendi rolünü oynar. İşte bir anlık görüntü.

Kaynak Türü Kim Kullanıyor (AI) Maliyet/Değer Neden işe yarıyor (ya da yaramıyor...)
Kitaplar ve Makaleler Büyük dil modelleri Paha biçilemez (ish) Yoğun, yapılandırılmış bilgi-sadece çabuk eskir.
Web Siteleri ve Bloglar Hemen hemen tüm yapay zekalar Ücretsiz (gürültülü) Vahşi çeşitlilik; parlaklıkla tam bir çöpün karışımı.
Akademik Makaleler Araştırma ağırlıklı yapay zekalar Bazen ödeme duvarı uygulanıyor Kesinlik + güvenilirlik, ancak ağır jargonla ifade edilmiş.
Kullanıcı Verileri Kişiselleştirilmiş Yapay Zekalar Son derece hassas ⚠️ Keskin terzilik, ama gizlilik sorunları bol.
Gerçek Zamanlı Web Arama bağlantılı yapay zekalar Ücretsiz (eğer çevrimiçi ise) Bilgiyi taze tutar; olumsuz tarafı söylentilerin yayılma riskidir.

Eğitim Veri Evreni 🌌

Bu, "çocukluk öğrenme" aşamasıdır. Bir çocuğa milyonlarca hikâye kitabı, haber kupürü ve Wikipedia bilgisi verdiğinizi düşünün. Ön eğitim tam da böyle bir şeydir. Gerçek dünyada, sağlayıcılar herkese açık verileri, lisanslı kaynakları ve eğitmen tarafından oluşturulan metinleri [2].

Üstüne katmanlar halinde: takviye başlamadan önce bile düzenlenmiş insan örnekleri - iyi cevaplar, kötü cevaplar, doğru yöne doğru dürtmeler [1].

Şeffaflık uyarısı: Şirketler her ayrıntıyı açıklamaz. Bazı kısıtlamalar gizlilik içerir (IP, güvenlik endişeleri), bu nedenle gerçek karışıma yalnızca kısmi bir bakış açısı elde edersiniz [2].


Gerçek Zamanlı Arama: Ekstra Malzeme 🍒

Bazı modeller artık eğitim balonlarının dışına bakabiliyor. Bu, geri çağırma destekli üretim (RAG) - temelde canlı bir endeksten veya belge deposundan parçalar çekip bunları yanıta dahil etmek [5]. Haber başlıkları veya hisse senedi fiyatları gibi hızla değişen veriler için mükemmel.

Sorun ne? İnternet hem deha hem de çöp yangınıdır. Filtreler veya kaynak kontrolleri zayıfsa, gereksiz verilerin içeri sızma riskiyle karşı karşıya kalırsınız; risk çerçevelerinin de uyardığı gibi [3].

Yaygın bir geçici çözüm: Şirketler, modelleri kendi iç veritabanlarına bağlar, böylece yanıtlar doğaçlama yapmak yerine güncel bir İK politikasına veya güncellenmiş ürün belgesine atıfta bulunur. Düşünün: daha az "aman Tanrım" anı, daha güvenilir yanıtlar.


İnce Ayar: Yapay Zekanın Parlatma Adımı 🧪

Ham, önceden eğitilmiş modeller kullanışsızdır. Bu yüzden ince ayar :

  • yardımsever, zararsız ve dürüst olmayı öğretmek (insan geri bildirimlerinden gelen takviyeli öğrenme yoluyla, RLHF) [1].

  • Güvenli olmayan veya toksik kenarların zımparalanması (hizalama) [1].

  • Tonunuzu ayarlayın - ister dostça, ister resmi, isterse de şakacı bir alaycı olsun.

Bu, bir elması parlatmaktan çok, istatistiksel bir çığın etrafından dolaşıp bir sohbet arkadaşı gibi davranmasını sağlamakla ilgili.


Engeller ve Başarısızlıklar 🚧

Kusursuz olduğunu iddia etmeyelim:

  • Halüsinasyonlar - tamamen yanlış olan net cevaplar [2][3].

  • Önyargı - Verilere işlenmiş kalıpları yansıtır; kontrol edilmediğinde bunları daha da güçlendirebilir [3][4].

  • Birinci elden deneyim yok hakkında konuşabilirim ama hiç tatmadım [4].

  • Aşırı özgüven - nesir, bilmese bile biliyormuş gibi akar. Risk çerçeveleri, zayıflayan varsayımları vurgular [3].


Neden Biliyormuş Gibi Hissettiriyor

İnançları, insani anlamda hafızası ve kesinlikle benliği yoktur. Ancak cümleleri akıcı bir şekilde bir araya getirdiği için, beyniniz onu anlıyormuş . Olan biten, yalnızca devasa ölçekli bir sonraki jeton tahminidir : trilyonlarca olasılığı saniyenin küçük bir kısmında hesaplamak [2].

"Zeka" hissi ortaya çıkan bir davranıştır; araştırmacılar buna, biraz da şaka yollu, "stokastik papağan" etkisi adını veriyorlar [4].


Çocuk Dostu Benzetme 🎨

Kütüphanedeki tüm kitapları okumuş bir papağan düşünün. anlamıyor ama kelimeleri bilgece bir şekilde harmanlayabiliyor. Bazen tam isabet, bazen saçmalık - ama yeterince gösterişli olunca, her zaman farkı anlayamıyorsunuz.


Özetle: Yapay Zekanın Bilgileri Nereden Geliyor 📌

Basitçe söylemek gerekirse:

  • Büyük eğitim verileri (kamu + lisanslı + eğitmen tarafından oluşturulan) [2].

  • Tonu/davranışı şekillendirmek için insan geri bildirimiyle ince ayar yapma

  • Canlı veri akışlarına bağlandığında alma sistemleri

Yapay zeka bir şeyleri "bilmez"; metni tahmin eder . Bu hem onun süper gücü hem de zayıf noktasıdır. Sonuç olarak? Önemli bilgileri her zaman güvenilir bir kaynakla karşılaştırın [3].


Referanslar

  1. Ouyang, L. ve diğerleri (2022). İnsan geri bildirimiyle talimatları takip etmek için dil modellerinin eğitimi (InstructGPT) . arXiv .

  2. OpenAI (2023). GPT-4 Teknik Raporu - lisanslı, kamuya açık ve insan yapımı verilerin karışımı; bir sonraki belirteç tahmininin amacı ve sınırlamaları. arXiv .

  3. NIST (2023). AI Risk Yönetimi Çerçevesi (AI RMF 1.0) - menşe, güvenilirlik ve risk kontrolleri. PDF .

  4. Bender, EM, Gebru, T., McMillan-Major, A., Mitchell, S. (2021). Stokastik Papağanların Tehlikeleri Üzerine: Dil Modelleri Çok Büyük Olabilir mi? PDF .

  5. Lewis, P. ve diğerleri (2020). Bilgi Yoğun NLP için Geri Alma-Artırılmış Üretim . arXiv .


Resmi AI Asistan Mağazasında En Son Yapay Zekayı Bulun

Hakkımızda

Bloga geri dön