Açık Kaynak Yapay Zeka nedir?

Açık Kaynak Yapay Zeka, her şeyi açan sihirli bir anahtar gibi konuşuluyor. Öyle değil. Ancak, yoludur . "Açık"ın ne anlama geldiğini, neyin sadece pazarlama olduğunu ve iş yerinde nasıl kullanılacağını merak ettiyseniz, doğru yerdesiniz. Bir kahve alın - bu faydalı olacak ve belki biraz da öznel olacak ☕🙂.

Bu makaleden sonra okumak isteyebileceğiniz diğer makaleler:

🔗 İşletmenize yapay zekayı nasıl entegre edebilirsiniz?
Daha akıllı iş büyümesi için yapay zeka araçlarını entegre etmeye yönelik pratik adımlar.

🔗 Yapay zekayı daha verimli olmak için nasıl kullanabilirsiniz?
Zaman kazandıran ve verimliliği artıran etkili yapay zeka iş akışlarını keşfedin.

🔗 Yapay zekâ becerileri nelerdir?
Geleceğe hazır profesyoneller için gerekli olan temel yapay zeka yetkinliklerini öğrenin.

🔗 Google Vertex AI nedir?
Google'ın Vertex AI'sını ve makine öğrenimini nasıl kolaylaştırdığını anlayın.

Açık Kaynak Yapay Zeka Nedir? 🤖🔓

En basit haliyle, Açık Kaynak Yapay Zeka, bir yapay zeka sisteminin bileşenlerinin—kod, model ağırlıkları, veri işlem hatları, eğitim komut dosyaları ve dokümantasyon—makul şartlara tabi olarak herkesin bunları kullanmasına, incelemesine, değiştirmesine ve paylaşmasına izin veren lisanslar altında yayınlanması anlamına gelir. Bu temel özgürlük dili, Açık Kaynak Tanımı ve uzun süredir devam eden kullanıcı özgürlüğü ilkelerinden gelir [1]. Yapay zeka ile ilgili ilginç nokta, sadece koddan daha fazla bileşenin olmasıdır.

Bazı projeler her şeyi yayınlıyor: kod, eğitim veri kaynakları, tarifler ve eğitilmiş model. Diğerleri ise özel bir lisansla yalnızca ağırlıkları . Ekosistem bazen özensiz kısaltmalar kullanıyor, bu yüzden bir sonraki bölümde bunları düzenleyelim.

Açık Kaynak Yapay Zeka mı, Açık Ağırlıklar mı, Açık Erişim mi? 😅

Burada insanlar birbirlerini anlamadan konuşuyorlar.

Açık Kaynak Yapay Zeka — Proje, tüm yığınında açık kaynak ilkelerini takip eder. Kod, OSI onaylı bir lisans altındadır ve dağıtım koşulları geniş kullanım, değişiklik ve paylaşıma izin verir. Buradaki ruh, OSI'nin tanımladığı şeyi yansıtır: kullanıcının özgürlüğü her şeyden önce gelir [1][2].
Açık ağırlıklar — Eğitilmiş model ağırlıkları indirilebilir (çoğu zaman ücretsiz) ancak özel şartlar altında. Kullanım koşulları, yeniden dağıtım sınırları veya raporlama kuralları göreceksiniz. Meta'nın Llama ailesi bunu göstermektedir: kod ekosistemi açık bir yapıya sahip, ancak model ağırlıkları kullanım temelli koşullara sahip belirli bir lisans altında gönderiliyor [4].
Açık erişim — Bir API'ye, belki de ücretsiz olarak, erişebilirsiniz, ancak ağırlıkları elde edemezsiniz. Denemeler için faydalıdır, ancak açık kaynak değildir.

Bu sadece anlambilimsel bir mesele değil. Haklarınız ve riskleriniz bu kategoriler arasında değişiyor. OSI'nin yapay zeka ve açıklık üzerine yaptığı güncel çalışmalar bu nüansları sade bir dille açıklıyor [2].

Açık Kaynak Yapay Zekayı Gerçekten İyi Yapan Şey Nedir? ✅

Hızlı ve dürüst olalım.

Denetlenebilirlik — Kodu okuyabilir, veri tariflerini inceleyebilir ve eğitim adımlarını takip edebilirsiniz. Bu, uyumluluk, güvenlik incelemeleri ve eski moda merak konusunda yardımcı olur. NIST Yapay Zeka Risk Yönetimi Çerçevesi, açık projelerin daha kolay karşılayabileceği dokümantasyon ve şeffaflık uygulamalarını teşvik eder [3].
Uyarlanabilirlik — Bir tedarikçinin yol haritasına bağlı kalmak zorunda değilsiniz. Onu kopyalayın. Yama yapın. Gönderin. Lego gibi, yapıştırılmış plastik değil.
Maliyet kontrolü — Daha ucuz olduğunda kendi sunucunuzda barındırın. Daha pahalı olduğunda buluta taşıyın. Donanımı birbiriyle karıştırın ve eşleştirin.
Topluluk hızı — Hatalar düzeltilir, özellikler eklenir ve akranlarınızdan öğrenirsiniz. Karmaşık mı? Bazen. Verimli mi? Çoğu zaman.
Yönetimde şeffaflık — Gerçek açık lisanslar öngörülebilirdir. Bunu, salı günleri sessizce değişen API Hizmet Şartları ile karşılaştırın.

Mükemmel mi? Hayır. Ancak sağladığı avantajlar ve dezavantajlar anlaşılabilir; birçok kapalı kutu hizmetinden daha fazlasını sunuyor.

Açık Kaynak Yapay Zeka yığını: kod, ağırlıklar, veri ve bağlantı elemanları 🧩

Bir yapay zeka projesini, tuhaf bir lazanya gibi düşünün. Her yerinde katmanlar var.

Çerçeveler ve çalışma ortamları — Modelleri tanımlamak, eğitmek ve sunmak için kullanılan araçlar (örneğin, PyTorch, TensorFlow). Sağlıklı topluluklar ve dokümanlar, marka isimlerinden daha önemlidir.
Model mimarileri — Temel plan: dönüştürücüler, yayılım modelleri, geri alma ile güçlendirilmiş kurulumlar.
Ağırlıklar — Eğitim sırasında öğrenilen parametreler. Buradaki "açık" ifadesi, yalnızca indirilebilirlik değil, yeniden dağıtım ve ticari kullanım haklarını da kapsar.
Veriler ve tarifler — Düzenleme komut dosyaları, filtreler, veri zenginleştirmeleri, eğitim programları. Burada şeffaflık, tekrarlanabilirlik için altın değerindedir.
Araçlar ve orkestrasyon — Çıkarım sunucuları, vektör veritabanları, değerlendirme araçları, gözlemlenebilirlik, CI/CD.
Lisanslama — Gerçekte ne yapabileceğinize karar veren sessiz temel unsur. Daha fazla bilgi aşağıda.

Açık Kaynak Yapay Zeka için Lisanslama 101 📜

Avukat olmanıza gerek yok. Ama kalıpları fark edebilmeniz gerekiyor.

İzin verici kod lisansları — MIT, BSD, Apache-2.0. Apache, birçok ekibin takdir ettiği açık bir patent hakkı içeriyor [1].
Copyleft — GPL ailesi, türetilmiş yazılımların aynı lisans altında açık kalmasını gerektirir. Güçlü bir özellik, ancak mimarinizde bunu göz önünde bulundurun.
Modele özgü lisanslar — Ağırlıklar ve veri kümeleri için, Sorumlu Yapay Zeka Lisansı ailesi (OpenRAIL) gibi özel lisanslar göreceksiniz. Bunlar, kullanıma dayalı izinleri ve kısıtlamaları kodlar; bazıları ticari kullanıma geniş ölçüde izin verirken, diğerleri kötüye kullanıma karşı koruyucu önlemler ekler [5].
Veriler için Creative Commons lisansı (CC-BY veya CC0) veri kümeleri ve dokümanlar için yaygındır. Atıf zorunluluğu küçük ölçekte yönetilebilir; erken aşamada bir model oluşturun.

İpucu: Her bağımlılığı, lisansını ve ticari yeniden dağıtımın izin verilip verilmediğini listeleyen tek sayfalık bir özet tutun. Sıkıcı mı? Evet. Gerekli mi? O da evet.

Karşılaştırma tablosu: Popüler Açık Kaynak Yapay Zeka projeleri ve öne çıktıkları alanlar 📊

Bilerek hafifçe dağınık - gerçek banknotlar böyle görünür

Araç / Proje	Kimin için?	Fiyatı yaklaşık olarak	Neden iyi çalışıyor?
PyTorch	Araştırmacılar, mühendisler	Özgür	Dinamik grafikler, geniş topluluk, kapsamlı dokümanlar. Üretim ortamında test edilmiş ve onaylanmış.
TensorFlow	Kurumsal ekipler, ML operasyonları	Özgür	Grafik modu, TF-Serving, ekosistem derinliği. Bazıları için daha zorlu bir öğrenme süreci, ancak yine de sağlam.
Sarılma Yüzü Transformers	Teslim tarihi olan inşaatçılar	Özgür	Önceden eğitilmiş modeller, işlem hatları, veri kümeleri, kolay ince ayar. Dürüst olmak gerekirse, tam bir kısayol.
vLLM	İnfra-zihinli takımlar	Özgür	Hızlı LLM sunumu, verimli KV önbelleği, yaygın GPU'larda yüksek işlem hacmi.
Llama.cpp	Tamirciler, uç cihazlar	Özgür	Modelleri, nicelleştirme özelliğiyle dizüstü bilgisayarlarda ve telefonlarda yerel olarak çalıştırın.
Dil Zinciri	Uygulama geliştiriciler, prototip geliştiriciler	Özgür	Birleştirilebilir zincirler, bağlayıcılar, aracılar. Basit tutarsanız hızlı sonuçlar alırsınız.
Kararlı Difüzyon	Yaratıcı ekipler, ürün ekipleri	Serbest ağırlıklar	Görüntü oluşturma yerel veya bulut tabanlı; bunun etrafında şekillenen devasa iş akışları ve kullanıcı arayüzleri.
Ollama	Yerel CLI'ları seven geliştiriciler	Özgür	Yerel model araçlar için geçerli olan çekme ve çalıştırma sistemleri. Lisanslar model kartına göre değişir, buna dikkat edin.

Evet, birçok "ücretsiz" seçenek var. Ancak hosting, GPU'lar, depolama ve insan gücü ücretsiz değil.

Şirketler açık kaynaklı yapay zekayı iş yerinde nasıl kullanıyor? 🏢⚙️

İki uç noktayı duyacaksınız: ya herkes her şeyi kendi sunucusunda barındırmalı, ya da hiç kimse barındırmamalı. Gerçek hayat daha esnek.

Hızlı prototipleme — Kullanıcı deneyimini ve etkiyi doğrulamak için öncelikle esnek açık modellerle başlayın. Daha sonra yeniden düzenleyin.
Hibrit sunum — Gizlilik hassasiyeti gerektiren çağrılar için VPC'de barındırılan veya şirket içi bir modeli koruyun. Uzun kuyruklu veya ani yük artışları için barındırılan bir API'ye geri dönün. Çok normal.
Dar kapsamlı görevler için ince ayar yapın — Alan uyarlaması genellikle genel ölçekten daha iyidir.
Her yerde RAG — Veriye dayalı yanıtlar sayesinde yanılgıları azaltan, veri tabanlı üretim. Açık vektör veritabanları ve adaptörler bunu mümkün kılıyor.
Edge ve çevrimdışı — Dizüstü bilgisayarlar, telefonlar veya tarayıcılar için derlenmiş hafif modeller, ürün yelpazesini genişletiyor.
Uyumluluk ve denetim — İç yapıyı inceleyebildiğiniz için denetçilerin gözden geçirebileceği somut bir şey var. Bunu, NIST'in RMF kategorilerine ve dokümantasyon kılavuzuna uyan sorumlu bir yapay zeka politikasıyla birleştirin [3].

Küçük bir not: Gördüğüm gizliliğe önem veren bir SaaS ekibi (orta ölçekli, AB kullanıcıları) hibrit bir kurulum benimsemişti: isteklerin %80'i için VPC içinde küçük, açık bir model; nadir, uzun bağlamlı istekler için ise barındırılan bir API'ye yönlendirme. Ortak yol için gecikmeyi azalttılar ve DPIA evrak işlerini basitleştirdiler - çok büyük bir değişiklik yapmadan.

Planlamanız gereken riskler ve beklenmedik durumlar 🧨

Bu konuda olgun davranalım.

Lisans kayması — Bir depo MIT lisansı ile başlar, sonra ağırlıklar özel bir lisansa geçer. Dahili kayıt defterinizi güncel tutun, yoksa uyumlulukla ilgili bir sürprizle karşılaşırsınız [2][4][5].
Veri kaynağı — Bulanık haklara sahip eğitim verileri modellere akabilir. Kaynakları takip edin ve veri kümesi lisanslarına uyun, hislere değil [5].
Güvenlik — Model yapıtlarını diğer tüm tedarik zinciri unsurları gibi ele alın: sağlama toplamları, imzalı onaylar, SBOM'lar. En azından bir SECURITY.md dosyası bile sessizlikten iyidir.
Kalite varyansı — Açık kaynaklı modeller büyük farklılıklar gösterir. Değerlendirmeyi yalnızca sıralama tablolarıyla değil, görevlerinizle yapın.
Gizli altyapı maliyeti — Hızlı çıkarım için GPU'lara, nicelemeye, gruplandırmaya ve önbelleğe almaya ihtiyaç vardır. Açık kaynaklı araçlar yardımcı olur; ancak yine de işlem gücü için ödeme yaparsınız.
Yönetişim borcu — Eğer model yaşam döngüsünün sahibi kimse değilse, karmaşık bir yapılandırma yığınıyla karşılaşırsınız. Hafif bir MLOps kontrol listesi çok değerlidir.

Kullanım senaryonuza uygun açıklık seviyesini seçmek 🧭

Biraz dolambaçlı bir karar yolu:

Az uyumluluk gereksinimiyle hızlı ürün teslimi mi gerekiyor ? İzin verici açık modeller, minimum ayarlama ve bulut tabanlı sunucu ile başlayın
Sıkı gizlilik veya çevrimdışı çalışma mı gerekiyor ? İyi desteklenen açık kaynaklı bir teknoloji yığını seçin, kendi sunucunuzda çıkarım yapın ve lisansları dikkatlice inceleyin.
Geniş ticari haklara ve yeniden dağıtıma mı ihtiyacınız var ? Ticari kullanım ve yeniden dağıtıma açıkça izin veren OSI uyumlu kod artı model lisanslarını tercih edin [1][5].
Araştırmalarınızda esnekliğe mi ihtiyacınız var ? Tekrarlanabilirlik ve paylaşılabilirlik için veriler de dahil olmak üzere uçtan uca esnek bir yaklaşım benimseyin.
Emin değil misiniz? İkisini de deneyin. Bir hafta sonra bir yolun daha iyi hissettireceği açıkça belli olacaktır.

Açık Kaynak Yapay Zeka Projesini Profesyonel Gibi Değerlendirmenin Yolları 🔍

Bazen peçeteye yazdığım, hızlıca kontrol ettiğim bir liste.

Lisans açıklığı — Kod için OSI onaylı mı? Ağırlıklar ve veriler ne olacak? İş modelinizi aksatan herhangi bir kullanım kısıtlaması var mı [1][2][5]?
Dokümantasyon — Kurulum, hızlı başlangıç, örnekler, sorun giderme. Dokümanlar bir kültürün göstergesidir.
Yayın sıklığı — Etiketlenmiş yayınlar ve değişiklik kayıtları istikrara işaret eder; düzensiz yayınlar ise kahramanca çabalara işaret eder.
Kıyaslama ve değerlendirmeler — Görevler gerçekçi mi? Değerlendirmeler çalıştırılabilir mi?
Bakım ve yönetişim — Net kod sahipleri, sorun önceliklendirme, PR'lara hızlı yanıt verme.
Ekosistem uyumluluğu — Donanımınızla, veri depolarınızla, günlük kaydıyla ve kimlik doğrulama sisteminizle sorunsuz çalışır.
Güvenlik duruşu — İmzalı yapılar, bağımlılık taraması, CVE yönetimi.
Topluluk sinyali — Tartışmalar, forum cevapları, örnek depolar.

Güvenilir uygulamalarla daha geniş bir uyum sağlamak için sürecinizi NIST AI RMF kategorilerine ve dokümantasyon yapıtlarına eşleştirin [3].

Derinlemesine İnceleme 1: Model Lisanslarının Karmaşık Orta Aşaması 🧪

En yetenekli modellerin bazıları “koşullu açık ağırlıklar” kategorisinde yer alıyor. Erişilebilirler, ancak kullanım sınırları veya yeniden dağıtım kuralları var. Ürününüz modelin yeniden paketlenmesine veya müşteri ortamlarına gönderilmesine bağlı değilse bu sorun olmayabilir. Eğer buna ihtiyacınız varsa , farklı bir taban üzerinde pazarlık yapın veya seçin. Önemli olan, aşağı yönlü planlarınızı blog yazısına değil, gerçek lisans metnine göre eşleştirmektir [4][5].

OpenRAIL tarzı lisanslar bir denge kurmaya çalışır: açık araştırmayı ve paylaşımı teşvik ederken, kötüye kullanımı da caydırır. Niyet iyidir; yükümlülükler yine de size aittir. Şartları okuyun ve koşulların risk iştahınıza uygun olup olmadığına karar verin [5].

Derinlemesine İnceleme 2: Veri şeffaflığı ve tekrarlanabilirlik efsanesi 🧬

“Tam veri dökümleri olmadan Açık Kaynak Yapay Zeka sahtedir.” Tam olarak değil. Veri kaynağı ve tarifler, bazı ham veri kümeleri kısıtlı olsa bile anlamlı bir şeffaflık sağlayabilir. Filtreleri, örnekleme oranlarını ve temizleme sezgisel yöntemlerini, başka bir ekibin sonuçları yaklaşık olarak elde edebilmesi için yeterince iyi belgeleyebilirsiniz. Mükemmel tekrarlanabilirlik güzeldir. Eyleme geçirilebilir şeffaflık genellikle yeterlidir [3][5].

Veri kümeleri açık olduğunda, CC-BY veya CC0 gibi Creative Commons lisanslama türleri yaygındır. Büyük ölçekte kaynak gösterme işlemi karmaşık hale gelebilir, bu nedenle bu konuyu nasıl ele alacağınızı baştan standartlaştırın.

Derinlemesine inceleme 3: Açık modeller için pratik MLO işlemleri 🚢

Açık model bir ürünü göndermek, herhangi bir hizmeti göndermek gibidir, sadece birkaç tuhaflığı vardır.

Sunucu katmanı — Özel çıkarım sunucuları, toplu işlemeyi, KV önbellek yönetimini ve belirteç akışını optimize eder.
Nicelleştirme — Daha küçük ağırlıklar → daha ucuz çıkarım ve daha kolay uç nokta dağıtımı. Kalite ödünleşmeleri değişir; görevlerinizle .
Gözlemlenebilirlik — Gizliliği göz önünde bulundurarak günlük istemlerini/çıktılarını kaydedin. Değerlendirme için örnek ekleyin. Geleneksel makine öğreniminde olduğu gibi sapma kontrolleri ekleyin.
Güncellemeler — Modeller davranışlarını incelikli bir şekilde değiştirebilir; geri alma ve denetimler için canary testleri kullanın ve bir arşiv tutun.
Değerlendirme ortamı — Genel kıyaslamaların ötesinde, göreve özel bir değerlendirme paketi oluşturun. Düşmanca uyarılar ve gecikme bütçeleri ekleyin.

Mini bir yol haritası: 10 adımda sıfırdan kullanılabilir pilot uçağa 🗺️

Tek bir dar kapsamlı görev ve ölçüt tanımlayın. Henüz büyük platformlar yok.
Yaygın olarak kullanılan ve iyi belgelenmiş, izin verici bir temel model seçin.
Yerel çıkarım ve ince bir sarmalayıcı API oluşturun. Sıkıcı kalmasın.
Verilerinizdeki temel çıktılara veri alma özelliği ekleyin.
Kullanıcılarınızı tüm yönleriyle yansıtan, etiketlenmiş küçük bir değerlendirme seti hazırlayın.
Yalnızca değerlendirme raporu gerektiriyorsa ince ayar veya hızlı ayar yapın.
Gecikme veya maliyet sorun yaratıyorsa bunu nicelleştirin. Kaliteyi yeniden ölçün.
Kayıt tutma, sızma testi uyarıları ve kötüye kullanım politikası ekleyin.
Özellik bayrağıyla kontrol edin ve küçük bir gruba yayınlayın.
Tekrarlayın. Haftalık olarak küçük iyileştirmeler yayınlayın… veya gerçekten daha iyi olduğunda.

Açık Kaynak Yapay Zeka hakkındaki yaygın mitler, kısmen çürütüldü 🧱

Efsane: Açık kaynaklı modeller her zaman daha kötüdür. Gerçek: Doğru verilerle hedeflenen görevler için, ince ayar yapılmış açık kaynaklı modeller, daha büyük, barındırılan modellerden daha iyi performans gösterebilir.
Efsane: Açık olmak güvensiz olmak demektir. Gerçek: Açıklık denetimi iyileştirebilir. Güvenlik, gizliliğe değil, uygulamalara bağlıdır [3].
Efsane: Ücretsizse lisansın önemi yoktur. Gerçek: Ücretsiz olduğunda önemi daha da artar, çünkü ücretsiz kullanım ölçeklenir. Siz açık haklar istersiniz, hisler değil [1][5]

Açık Kaynak Yapay Zeka 🧠✨

Açık Kaynak Yapay Zeka bir din değildir. Daha fazla kontrol, daha net yönetim ve daha hızlı yineleme ile geliştirme yapmanıza olanak tanıyan bir dizi pratik özgürlüktür. Birisi bir modelin "açık" olduğunu söylediğinde, hangi katmanların açık olduğunu sorun: kod, ağırlıklar, veri veya sadece erişim. Lisansı okuyun. Kullanım senaryonuzla karşılaştırın. Ve en önemlisi, gerçek iş yükünüzle test edin.

İlginç bir şekilde, en güzel yanı kültürel: Açık kaynaklı projeler katkılara ve incelemelere açık olup, bu da hem yazılımı hem de insanları daha iyi hale getiriyor. Kazandıran hamlenin en büyük model veya en gösterişli kıyaslama değil, gerçekten anlayabileceğiniz, düzeltebileceğiniz ve gelecek hafta geliştirebileceğiniz hamle olduğunu keşfedebilirsiniz. İşte Açık Kaynak Yapay Zekanın sessiz gücü bu; sihirli bir değnek değil, daha çok günü kurtaran, iyi kullanılmış bir çok amaçlı alet gibi.

Çok Uzun Zaman Oldu, Okumadım 📝

Açık Kaynak Yapay Zeka, yapay zeka sistemlerini kullanma, inceleme, değiştirme ve paylaşma konusunda anlamlı bir özgürlük anlamına gelir. Bu, çerçeveler, modeller, veriler ve araçlar gibi tüm katmanlarda kendini gösterir. Açık kaynak kodunu açık ağırlıklar veya açık erişimle karıştırmayın. Lisansı kontrol edin, gerçek görevlerinizle değerlendirin ve ilk günden itibaren güvenlik ve yönetişim için tasarım yapın. Bunu yaparsanız, hız, kontrol ve daha sakin bir yol haritası elde edersiniz. Şaşırtıcı derecede nadir, dürüst olmak gerekirse paha biçilmez 🙃.

Referanslar

[1] Açık Kaynak Girişimi - Açık Kaynak Tanımı (OSD): daha fazla bilgi edinin
[2] OSI - Yapay Zeka ve Açıklık Üzerine Derinlemesine İnceleme: daha fazla bilgi edinin
[3] NIST - Yapay Zeka Risk Yönetimi Çerçevesi: daha fazla bilgi edinin
[4] Meta - Llama Model Lisansı: daha fazla bilgi
[5] Sorumlu Yapay Zeka Lisansları (OpenRAIL): daha fazla bilgi edinin

En Yeni Yapay Zeka Ürünlerini Resmi Yapay Zeka Asistanı Mağazasında Bulun

Hakkımızda

Bloga geri dön