Bir Rica

Bir süredir hrzafer.com’daki bazı yazılardaki resimlere ve kaynak kodlara erişilemiyor. Mesela örnek okul veritabanı yazısındaki şema resimleri görünmüyor ve örnek veritabanı dosyası indirilemiyor. Bunu söylemek biraz utanç verici ama bu benim basit bir ihmalkarlığımdan kaynaklandı. WordPress’i güncellerken yedek almayı ihmal ettim maalesef :(. Yıllardır sorunsuz gerçekleşen işlem bir sorun nedeniyle kesintiye uğrayınca bazı dosyalar da […]

GitHub Üzerinde Maven Repo’su Oluşturmak

Bu makalede adım adım Java projeleriniz için GitHub üzerinde Maven deposu (repository veya repo) oluşturmayı anlatacağım. Yazıya başlarken bir GitHub hesabınızın olduğunu ve Maven’ı biraz da olsa bildiğinizi kabul ediyorum. GitHub üzerindeki bazı Java projelerimin Maven kullanan geliştiriciler tarafından kolayca kullanılabilmeleri amacıyla GitHub üzerinde bana ait ancak herkesin erişimine açık bir Maven deposu oluşturmaya karar […]

Nüve ile Türkçe Cümle Sonu Tespiti

Önceki yazımda Türkî diller için bir doğal dil işleme kütüphanesi olan Nüve‘den bahsetmiştim. Nüve 1.1 versiyonu ile birlikte cümle sonu tespit yeteneği de kazanmış durumda. Nüve’nin cümleleme modülü kural tabanlı çalışıyor ve mükemmel olduğu söylenemez ancak bir çok metin için iş görecek kadar başarılı olduğunu söyleyebilirim. Kullanacak arkadaşlar da gördükleri hataları bildirirerek başarımın artmasına yardımcı […]

Türkçe Cümle Sonu Tespit Araçları için bir Karşılaştırma

Bu yazıda cümle sonu tespiti problemini ve Nüve başta olmak üzere Türkçe için belli başlı cümle sonu tespit araçlarını (Zemberek, OpenNLP, ITU Pipeline) incelemeye çalıştım. Doğal dil işleme ve metin analizi çalışmalarında zaman zaman metni cümlelerine ayırmaya (cümlelemeye) ihtiyaç duyulur. Literatürde bu probleme “cümle sonu tespiti” (sentence boundary detection) denir. Metindeki satırsonu karakterleri (newline, \n, […]

Türkî Diller için Doğal Dil İşleme Kütüphanesi: Nüve

İnsan dili veya doğal dil günlük yaşantımızdaki en önemli iletişim kanalımız. Bilgiyi doğal dil biçiminde duyarak ya da okuyarak beynimize alır (input) , beynimizde işler (processing) ve yazılı ya da sözlü olarak dışarı aktarırız (output). İletişim organlarımız ile birlikte beynimiz, bu işi mükemmel biçimde yerine getirirken bilgisayarlar doğal dili işleyebilme konusunda henüz emekleme aşamasındalar. Yine […]

Linux’ta Toplu Dosya İsimlendirme

Bir klasördeki çok sayıda dosyanın ismini dizisel biçimde 01.txt, 02.txt olarak değiştirmeniz gerektiğinde aşağıdaki komutu kullanabilirsiniz: find *.txt |   gawk ‘BEGIN{ a=1 }{ printf "mv \"%s\" %04d.txt\n", $0,  a++ }’ |   bash -name parametresinden sonraki ‘.txt’ değeri yalnızca txt uzantılı dosyaların isimlerinin değiştirileceğini belirtir. %04d.txt ifadesi ise 4 haneli olarak, yine txt uzantılı […]

Java OutOfMemoryError için Netbeans JVM Ayarları

Yaklaşık 650 MB’lık bir text dosyasını okumaya çalışınca aşağıdaki hatayı aldım: Exception in thread “main” java.lang.OutOfMemoryError: Java heap space Java sanal makinesi varsayılan olarak 256 MB maksimum bellek ayırıyor. Programınız ihtiyacı bunun üzerinde olunca yukarıdaki hatayı alıyorsunuz. Ancak JVM’ye aşağıdaki komutlarla ilk ve maksimum bellek miktarını belirtebiliyorsunuz. java -Xmx2048m -Xms256m

Visual Studio’da Projeye Gömülü Kaynak Eklemek

C#’ta yazmakta olduğum kütüphane bazı bilgileri dosyadan okuyor. Kütüphanenin dll’ini dağıtırken bu dosyanın da dll’e gömülü (embedded) olmasını istiyorum. Bu tür dosyalara kaynak dosyalar (resources) ismini verebiliriz. Kaynak dosyaların yalnızca okuma yapmak için kullanılabileceğini, yazma yapılamayacağını (readonly) hatırlattıktan sonra bunun nasıl yapılabileceğine geçelim: 1- Öncelikle kaynak dosyayı projeye dahil etmek için  projemize “Resources” isimli bir […]

Türkçe Fiil Çekimleri Uygulaması

Türkçe fiillerin çekimlerini otomatik üreten bir programı kodlamayı uzun zaman önce düşünmüştüm. O zamandan beri vakit buldukça azar azar geliştirdiğim uygulamanın ilk sürümünü sonunda yayınlayabildim. Uygulama bu hali ile kime ne kadar fayda sağlar bilemiyorum. Ama ileriki sürümlerinin ilk-orta-lise öğrencilerine ve Türkçe öğrenmek isteyen yabancılara yararlı olmasını hedefliyorum. Bu bağlamda sizin de görüş ve önerilerinizi […]

Windows Netbeans Maven Türkçe Karakter Problemi

Windows’ta Netbeans ile yeni bir Maven projesi açtığınızda Türkçe karakterlerin doğru görüntülenmediğini farkettim. Yaklaşık 3 saat süren çabalardan sonra bulabildiğim tek çözüm: System.out.println( "ÇİĞÇŞÜçığöşü–" ); kodunun çıktısı Ç??Ç?Üç??ö?ü– şeklinde görünüyor. Aynı şey dosyaya yazma yaparken de geçerli. Görebildiğim kadarıyla bu henüz çözülmemiş bir bug. Sorunun Netbeans’ten kaynaklandığını teyid etmek adına aynı kodu IntelliJIdea ile de […]