Nedir
Stable Diffusion, yazdığın metinleri ([prompt](/sozluk/prompt "Prompt · sözlük — Bir AI modeline verdiğin girdi metin. Modelin cevabının kalitesi, prompt'un netliğiyle doğrudan ilişkilidir.")) görselleştiren bir yapay zeka modelidir. Stability AI tarafından geliştirilen bu araç, 2022'de yayınlandığında [açık kaynak](/tags/open-source "Açık kaynak · etiket · toolcu'da aç") kodlu olması sayesinde binlerce geliştiricinin erişimine açıldı ve bu durum, yapay zeka görsel üretimini geniş kitlelere ulaştırdı.[1] Bu, kodlarının herkese açık olduğu ve isteyenin kendi bilgisayarına kurup ücretsiz kullanabileceği anlamına geliyor. [Midjourney](/tools/midjourney "Midjourney · araç · toolcu'da aç") veya DALL-E gibi rakiplerinin aksine, Stable Diffusion sana tam kontrol ve esneklik sunar.Temelde yaptığı iş, "güneşli bir havada bisiklete binen bir astronot, fotoğraf gerçekliğinde" gibi bir cümleyi alıp saniyeler içinde o görseli oluşturmaktır. Öğrenciler ödev kapakları veya sunumları için özgün görseller üretirken, ofis çalışanları raporlarına stok fotoğraf yerine daha yaratıcı illüstrasyonlar ekleyebilir. Küçük bir işletme sahibi, yeni ürünü için sosyal medya reklamı taslağı hazırlayabilir veya bir içerik üreticisi, blog yazısı için dikkat çekici bir kapak görseli oluşturabilir.
Kimler için uygun
**Öğrenciysen:** Proje sunumların, ödevlerin veya kişisel blogun için hızlıca görsel üretmek için harika. Stok fotoğraf sitelerinde saatler harcamak yerine, aklındaki sahneyi yazarak elde edebilirsin. Ama çok teknik veya bilimsel bir diyagram çizmesini beklememelisin; bu konularda zayıf kalır. Ayrıca tarihi figürleri veya olayları her zaman doğru tasvir edemez.Ofis çalışanıysan: Sunumlarına veya iç iletişim materyallerine özgün bir hava katmak için kullanabilirsin. Şirketinin konseptlerini görselleştirmek için de faydalıdır. Ama marka kimliğine yüzde yüz uygun görseller üretmek zordur. Logonun veya belirli renk paletinin birebir kullanımı için yine bir grafik tasarımcının elden geçirmesi gerekir.
İçerik üretiyorsan: Sosyal medya gönderilerin, YouTube kapak resimlerin veya blog yazıların için sınırsız bir görsel kaynağıdır. Farklı stiller deneyerek kendi görsel dilini oluşturabilirsin. Ancak insan anatomisi, özellikle eller ve parmaklar konusunda sık sık hata yapar.[2] Ürettiğin görselleri Photoshop gibi bir programda düzeltmen gerekebilir.
Küçük işletme sahibiysen: Ürünlerin için konsept görseller, reklam kampanyaları için taslaklar veya sosyal medya içerikleri oluşturmak için düşük maliyetli bir çözüm. Ama baskıya gidecek yüksek çözünürlüklü bir broşür veya ambalaj tasarımı için tek başına yetersiz kalır. Üretilen görsellerin çözünürlüğünü artırmak ve detayları netleştirmek için ek işlemler gerekir.
Neler yapar
Stable Diffusion sadece metinden görsel üretmekle kalmaz. Çok sayıda yeteneği vardır ve bu yetenekler topluluk tarafından geliştirilen eklentilerle sürekli artar.Metinden Görsel Üretimi (Text-to-Image)
Bu, en temel özelliğidir. Aklındaki sahneyi, objeyi veya konsepti metin olarak yazarsın ve model bunu görsele dönüştürür. Örneğin, "*A cat wearing sunglasses, sitting on a beach, cinematic lighting*" (Güneş gözlüğü takan bir kedi, kumsalda oturuyor, sinematik ışıklandırma) yazdığında bu sahneyi oluşturur. Sınırı ise, özellikle birden fazla nesne içeren karmaşık komutlarda nesnelerin konumunu veya ilişkisini karıştırabilmesidir. Bazen 6 parmaklı insanlar veya mantıksız gölgeler çizebilir.Görselden Görsele Dönüşüm (Image-to-Image)
Mevcut bir fotoğrafı veya kendi çizdiğin basit bir karalamayı yükleyerek onu dönüştürebilirsin. Örneğin, çocuğunun çizdiği bir canavar resmini yükleyip "*highly detailed fantasy creature, realistic*" (çok detaylı fantezi yaratığı, gerçekçi) komutuyla profesyonel bir illüstrasyona çevirebilirsin. Sınırı, orijinal görselin kompozisyonuna ve renklerine büyük ölçüde bağlı kalmasıdır. Radikal değişiklikler yapmak yerine mevcut yapıyı temel alır.Görsel İçi Düzenleme (Inpainting)
Bir fotoğrafın istemediğin bir bölümünü silip yerine başka bir şey eklemeni sağlar. Fotoğraftaki bir kalabalığın içinden bir kişiyi maskeleyip silebilir veya boş bir masanın üzerine bir fincan kahve ekleyebilirsin. Sınırı, eklenen yeni nesnenin ışık, gölge ve perspektifinin orijinal fotoğrafla her zaman yüzde yüz uyumlu olmamasıdır. Dikkatli bakıldığında sonradan eklendiği belli olabilir.Görsel Genişletme (Outpainting)
Mevcut bir görselin tuvalini dışa doğru genişletir. Elindeki bir portre fotoğrafının sadece yüzü kapsadığını düşünelim. Outpainting ile fotoğrafın kenarlarını genişleterek o kişinin omuzlarını, oturduğu sandalyeyi ve arkasındaki odayı yapay zekanın hayal gücüyle tamamlayabilirsin. Sınırı, genişletilen alanların bazen kendini tekrar eden desenler içermesi veya ana görselle anlamsal bütünlüğü yakalayamamasıdır.Kontrollü Görsel Üretimi (ControlNet)
Bu, Stable Diffusion'ın en güçlü özelliklerinden biridir. Üretim sürecine ekstra bir kontrol katmanı ekler. Örneğin, bir insanın pozunu başka bir fotoğraftan alıp, o pozu koruyarak farklı bir karakter (örneğin bir süper kahraman) çizmesini sağlayabilirsin.[3] Ya da bir odanın derinlik haritasını kullanarak aynı perspektife sahip farklı bir oda tasarlatabilirsin. Sınırı, kurulumunun ve kullanımının başlangıç seviyesi için biraz karmaşık olmasıdır.Özel Model Eğitimi ([Fine-tuning](/sozluk/fine-tuning "Fine-tuning · sözlük — Önceden eğitilmiş bir modeli, daha dar bir veri kümesi üzerinde ek eğitimle belirli bir göreve veya tona uyarlama süreci."))
Stable Diffusion'ı kendi görsellerinle eğitebilirsin. Bu sayede belirli bir sanat stilini, bir ürünün görünümünü veya kendi yüzünü modele öğretebilirsin. Örneğin, 20 tane kendi fotoğrafını kullanarak seni farklı senaryolarda (uzayda, kovboy olarak vb.) çizen bir model oluşturabilirsin. Bu işlem Dreambooth veya LoRA gibi tekniklerle yapılır.[4] Sınırı, bu işlemin teknik bilgi ve güçlü bir bilgisayar gerektirmesidir. Ayrıca iyi sonuçlar için kaliteli bir veri seti (görseller) hazırlamak zaman alır.Türkiye'den kullanmak
**VPN gerekir mi?** Hayır. Stability AI'ın resmi servisleri (DreamStudio, API) veya [Hugging Face](/tools/huggingface "Hugging Face · araç · toolcu'da aç") gibi platformlardaki demolar Türkiye'den doğrudan çalışır. Herhangi bir erişim engeli bulunmuyor. Kendi bilgisayarınıza kurduğunuzda ise zaten internete sadece model dosyalarını indirmek için ihtiyaç duyarsınız, kullanım tamamen çevrimdışı olabilir.Türkçe desteği nasıl? Stable Diffusion'ın resmi arayüzleri ve dokümantasyonu İngilizcedir. Türkçe arayüz bulunmuyor. Ancak topluluk tarafından geliştirilen arayüzlerden biri olan Automatic1111 WebUI için gönüllülerin hazırladığı Türkçe dil paketleri mevcut.
Türkçe komut (prompt) anlama kalitesine 1-5 arası bir puan verirsek, 3.5 alır. "İstanbul Boğazı'nda gün batımı, yağlıboya tablo" gibi net ve popüler komutlarda başarılı sonuçlar verir. Ancak deyimler, kültürel referanslar veya karmaşık cümle yapılarında zorlanır. Örneğin "Keloğlan ve dev" komutu, Keloğlan'ı doğru tasvir edemeyebilir. En iyi sonuçlar için komutları İngilizce yazmak veya bir çeviri aracıyla çevirip kullanmak daha garantidir.
TL ile ödeme ve vergi Stable Diffusion'ın kendisi ücretsizdir ama DreamStudio gibi bulut servislerini kullanmak istersen ödeme yapman gerekir. Ödemeler Dolar ($) üzerinden yapılır. Garanti, İş Bankası, Akbank, Yapı Kredi gibi bankaların uluslararası kullanıma açık kredi kartları ve sanal kartları genellikle sorunsuz çalışıyor. Papara veya Ininal gibi bazı ön ödemeli kartlarda kullanıcılar zaman zaman reddedilme sorunu yaşayabiliyor.[5] Ödeme sırasında bankan, Dolar tutarını o günkü kurdan TL'ye çevirir ve genellikle küçük bir kur farkı veya işlem ücreti ekler.
Yurtdışından alınan bir hizmet olduğu için faturaya Türkiye'deki KDV (%20) sonradan eklenebilir veya dijital hizmet vergisi kapsamında değerlendirilebilir. Bu durum, kullandığın platformun Türkiye'deki vergi yasalarına uyumu için attığı adımlara göre değişir. Örneğin, Stability AI'ın ödeme sayfasında son tutara verginin eklenip eklenmediğini kontrol etmelisin.
KVKK uyumu Resmi olarak Stability AI'ın Türkiye'de bir temsilcisi ve VERBİS (Veri Sorumluları Sicil Bilgi Sistemi) kaydı bulunmamaktadır. Ancak şirket, Avrupa Birliği'nin veri koruma yasası olan GDPR'a uyumlu olduğunu belirtiyor.[6] GDPR, KVKK ile büyük ölçüde benzer ilkelere dayandığı için verilerinin korunması konusunda belirli güvenceler sunar. Kendi bilgisayarına kurduğun versiyonda ise verilerin (yüklediğin fotoğraflar, yazdığın komutlar) hiçbir yere gönderilmez, tamamen yerel kalır. Bulut servislerini kullanırken gizlilik politikasını okumak en doğrusu olacaktır.
Planlar
Stable Diffusion'ın fiyatlandırması, onu nasıl kullandığına göre değişir. Tek bir abonelik paketi yoktur, farklı kullanım senaryoları için farklı modeller bulunur.1. Yerel Kurulum (Kendi Bilgisayarında)
- Fiyat: 0 TL (Tamamen ücretsiz).[7]
- Gereksinim: Güçlü bir bilgisayar. Özellikle en az 8 GB VRAM'e sahip bir NVIDIA ekran kartı (RTX 3060 veya üstü) önerilir. Kurulum ve kullanım için teknik bilgi gerekir.
- Ne yapabilirsin: Sınırsız sayıda görsel üretebilirsin. İnternet bağlantısı olmadan çalışır. Tüm kontrol sendedir; sansür veya kısıtlama yoktur. İstediğin modeli, eklentiyi kurabilirsin.
- Ne yapamazsın: Düşük donanımlı bir bilgisayarda çalıştıramaz veya çok yavaş sonuçlar alırsın. Resmi bir teknik destek alamazsın; sorunları topluluk forumlarında (Reddit, Discord) kendin çözmen gerekir.
2. Online Servisler (DreamStudio ve Diğerleri)
- Fiyat: Kredi tabanlı, kullandıkça öde. Örneğin, Stability AI'ın kendi platformu olan DreamStudio'da $10 (yaklaşık 390 TL, 1 USD ≈ 39 TL varsayıldı) karşılığında yaklaşık 1.000 kredi alırsın.[8] Bir görsel üretimi genellikle 5-20 kredi arası tutar.
- Gereksinim: Sadece bir web tarayıcısı.
- Ne yapabilirsin: Kurulum derdi olmadan, en güncel ve optimize edilmiş Stable Diffusion modellerini hemen kullanmaya başlayabilirsin. Herhangi bir bilgisayardan veya tabletten erişebilirsin.
- Ne yapamazsın: Kullanımın krediyle sınırlıdır, kredin bitince durur. Yerel kurulum kadar esnek değildir; her eklentiyi veya özel modeli kullanamazsın. Sürekli kullanımda maliyeti artar.
3. API Erişimi (Geliştiriciler İçin)
- Fiyat: Kullandıkça öde. Üretilen görselin boyutuna ve karmaşıklığına göre ücretlendirilir. Örneğin, 1024x1024 piksel bir görsel üretmek yaklaşık $0.02 (yaklaşık 0.78 TL) civarındadır.[9]
- Gereksinim: Kodlama bilgisi.
- Ne yapabilirsin: Stable Diffusion'ı kendi web sitene, uygulamana veya iş akışına entegre edebilirsin. Toplu görsel üretimi gibi işlemleri otomatikleştirebilirsin.
- Ne yapamazsın: Son kullanıcıya yönelik bir arayüzü yoktur. Direkt olarak görsel üretmek için değil, başka yazılımlara güç vermek için tasarlanmıştır.
Rakiplerine göre nasıl
Stable Diffusion, görsel üreten tek yapay zeka değil. En popüler iki rakibi [Midjourney](/tools/midjourney "Midjourney · araç · toolcu'da aç") ve DALL-E 3'tür. Hangisinin daha iyi olduğu, ne yapmak istediğine bağlıdır.Stable Diffusion vs. Midjourney
- Sanatsal Kalite: Midjourney, genellikle kutudan çıktığı haliyle daha sanatsal, estetik ve tutarlı görseller üretir. Özellikle kendine has bir görsel stili vardır. Stable Diffusion ise doğru model ve komutlarla Midjourney kalitesini yakalayabilir ama daha fazla deneme yanılma gerektirir.
- Kullanım Kolaylığı: Midjourney, Discord uygulaması üzerinden basit komutlarla çalışır. Çok daha kullanıcı dostudur. Stable Diffusion (yerel kurulum) ise arayüzü ve ayarlarıyla daha karmaşıktır.
- Kontrol ve Esneklik: Bu alanın galibi açık ara Stable Diffusion'dur. Inpainting, outpainting, ControlNet, özel model eğitimi gibi özelliklerle üretim süreci üzerinde tam kontrol sağlarsın. Midjourney daha kapalı bir kutu gibidir.[10]
- Fiyat: Stable Diffusion'ın ücretsiz bir kullanım yolu vardır. Midjourney ise tamamen ücretlidir ve en düşük planı aylık $10'dan başlar.
Stable Diffusion vs. DALL-E 3
- Komut Anlama: DALL-E 3 (genellikle ChatGPT Plus veya Microsoft Copilot üzerinden erişilir), yazdığın metni anlama konusunda en iyisidir. Uzun ve karmaşık cümleleri, nesneler arası ilişkileri Stable Diffusion'dan daha iyi yorumlar. Görsele metin ekleme konusunda da daha başarılıdır.
- Açıklık ve Topluluk: Stable Diffusion açık kaynaklıdır ve devasa bir topluluğu vardır. Bu sayede sürekli yeni modeller, eklentiler ve teknikler ortaya çıkar. DALL-E 3 ise OpenAI tarafından geliştirilen kapalı bir modeldir.
- Fotogerçekçilik ve Stiller: Fotogerçekçi insan portreleri konusunda Stable Diffusion, topluluk tarafından eğitilmiş özel modeller (checkpoint'ler) sayesinde genellikle daha iyi sonuçlar verir. Ayrıca binlerce farklı stilde eğitilmiş model bulmak mümkündür. DALL-E 3'ün stil yelpazesi daha sınırlıdır.
- Özet: "Yazdığımı harfiyen anlasın ve yapsın" diyorsan DALL-E 3. "Tam kontrol bende olsun, her detayıyla oynayayım, gerekirse kendi modelimi eğiteyim" diyorsan Stable Diffusion.
Yaygın sorunlar
**Neden görsellerde hatalar (6 parmak, bozuk yüzler) oluyor?** Stable Diffusion, insan anatomisini veya fizik kurallarını bilmez. Milyonlarca görseldeki piksellerin birbiriyle nasıl ilişkili olduğunu istatistiksel olarak öğrenir. İnsan eli gibi karmaşık ve çok çeşitli pozisyonlarda olabilen bir nesneyi çizerken, öğrendiği istatistikler bazen yetersiz kalır. Bu yüzden fazladan parmak veya bozuk uzuvlar çizebilir. Çözüm olarak "*negative prompt*" (istenmeyenleri belirttiğin komut) kısmına `deformed, bad anatomy, extra limbs` gibi ifadeler eklemek veya bu tür hataları düzelten özel modeller kullanmak işe yarar.Neden görsel üretimi çok yavaş? Eğer kendi bilgisayarında çalıştırıyorsan, yavaşlığın sebebi %99 ekran kartının (GPU) yetersiz olmasıdır. Çözünürlüğü artırmak, adım (steps) sayısını yükseltmek gibi işlemler GPU'ya daha fazla yük bindirir. Çevrimiçi bir servis kullanıyorsan, yavaşlık sunucuların o anki yoğunluğundan kaynaklanıyor olabilir. Hızlandırmak için daha düşük adım sayısı (örneğin 20-25) kullanabilir veya önce düşük çözünürlükte üretip sonra "upscaling" (büyütme) işlemiyle kaliteyi artırabilirsin.
Giremiyorum, site çalışmıyor, ne yapmalı? DreamStudio gibi online servisler zaman zaman bakıma girebilir veya aşırı yoğunluktan dolayı geçici olarak erişilemez olabilir. Stability AI'ın resmi sosyal medya hesaplarını veya durum sayfasını kontrol edebilirsin. Eğer yerel kurulumda bir sorun yaşıyorsan, bu genellikle bir güncelleme sonrası veya yeni bir eklenti kurduktan sonra olur. Sorunun çözümünü r/StableDiffusion gibi Reddit topluluklarında aramak en hızlı yoldur.[11]
Türkçe komutlarım istediğim gibi sonuç vermiyor, ne yapmalı? Modelin ana eğitim verisi İngilizce olduğu için Türkçe'nin nüanslarını kaçırabilir. Komutunu basit ve net tutmaya çalış. Eğer olmuyorsa, komutunu Google Translate veya DeepL gibi bir araçla İngilizce'ye çevirip tekrar dene. Genellikle çok daha iyi sonuçlar alırsın.
Sonuç
Stable Diffusion, görsel üretiminde İsviçre çakısı gibidir. Biraz öğrenme ve deneme süreci gerektirir ama karşılığında sana inanılmaz bir kontrol ve yaratıcılık özgürlüğü sunar.Eğer teknik konulara girmekten çekinmeyen, tam kontrol isteyen ve potansiyel olarak sıfır maliyetle çalışmak isteyen bir öğrenci, geliştirici veya meraklı bir içerik üreticiysen, Stable Diffusion senin için en doğru araçtır. Kendi bilgisayarına kurarak bu dünyanın derinliklerine inebilirsin.
Eğer amacın sadece hızlıca, kolayca ve en estetik sonuçları almaksa, "parası neyse vereyim, beni uğraştırmasın" diyorsan, o zaman Midjourney'e bir şans vermelisin. Eğer önceliğin yazdığın karmaşık cümlenin birebir anlaşılması ve görselde doğru yansıtılması ise, DALL-E 3'ün entegre olduğu ChatGPT Plus veya Copilot daha pratik bir çözüm olabilir.