Özet:
Anlamsal ilişkilerin çıkarılması, Doğal Dil İşleme uygulamaları için büyük önem taşır. Bu uygulamalardan biride ontoloji/sözlük oluşturmaktır. Günümüzde sıkça kullanılan WordNet, insanlar tarafından elle oluşturulan bir sözlüktür. Birçok çalışmaya kaynak olan WordNet, ne kadar güvenilir ve etkili olsa da zahmetli ve zaman alıcıdır. Bu yüzden anlamsal ilişkilerin büyük elektronik dokümanlardan (derlem, sözlük, gazete, etc.) otomatik olarak çıkarılması önemli hale gelmiş, örüntü-tabanlı, dağılım benzerliği, makine öğrenmesi algoritmaları ya da hibrit yöntemler kullanılarak çözümler sunulmuştur. Bu çalışmada, tam ve yarı otomatik yöntemler kullanılarak, isimler için alt/üst, parça/bütün ve eş anlamlılık ilişkileri Türkçe dilinde, derlem kullanılarak çıkarılmaya çalışılmış ve birkaç model sunulmuştur. Alt/üst kavram ilişkisi için sunulan metot, sözlük-yapısal örüntülere ve anlamsal benzerliğe dayanır. Örüntüler, derleme uygulanarak aday alt kavramlar çıkarılmıştır. Sonrasında ise kesinliği arttırmak için benzerlik ölçütleri kullanılarak eleme yapılmıştır. Anma değerini arttırmak için farklı bir model olan istatistik tabanlı genişleme yöntemi kullanılmış, farklı skorlama ve ağırlıklandırma fonksiyonları modele dahil edilmiştir. Parça/bütün ilişkisi için, örüntü yaklaşımı kullanılmış ve Türkçe derleme uygulanmıştır. İki farklı örüntü yapısı kullanılmıştır. İlki literatürde daha önceden tanımlı olan örüntülerin Türkçe'ye çevrilmesi ile gerçekleştirilmiştir. Diğer ise önyükleme metodu ile otomatik olarak belirlenmiştir. Tanımlı örüntüler, Genel ve Sözlük tabanlı olarak iki sınıfa ayrılmıştır. Bu örüntüler derleme uygulandıktan sonra, çıkan durumlar üzerinden birbirleri ile kaç defa çıktığı bilgisi kullanılmıştır. Diğer metot da ise önceden belirlenen kelime çiftleri kullanılarak, derlemdeki örüntüler bulunmuş ve örüntülerin güvenilirliği hesaplanmıştır. Güvenli örüntüler yardımıyla yeni çiftler bulunmuş ve kelime çiftlerinin güvenilirliği hesaplanmıştır. Bazı ölçütler (bilgi kazancı, T-score gibi) kullanılarak karşılaştırma yapılmıştır. Son olarak bu örüntülerin ve metodun sistem doğruluğunu nasıl geliştirdiği incelenmiştir. Eş anlamlılık ilişkisi için kullanılan yaklaşım, eş anlamlı olan çiftlerin benzer anlamsal ve sözdizimsel karakterlere sahip olmasıdır. Bu çiftler aynı alt/üst ve parça/bütün ilişkilerini paylaşırlar. Eş anlam ilişkisini, alt/üst ya da parça/bütün ilişkisindeki gibi örüntüler kullanarak derlem içinden yakalamak Türkçe için zordur. Bu yüzden bağımlılık ilişkileri (nesne/özne, etc.) kullanılmıştır. Çalışmanın ilk amacı modeli geliştirecek sözdizimsel ve anlamsal özellikleri çıkarmaktır. Bunun için herbir özellik çapraz doğrulama yöntemi ile değerlendirilmiştir. Model, özelliklerin birleşimi ile başarılı sonuçlar vermiştir. Bu yaklaşıma ek olarak, WordNet ve tek/iki dilli sözlükler kullanılarak verilen bir kelimenin eş anlamlısı derlemden çıkarılmıştır. Çalışmadaki en büyük katkı, Türkçe derlem üzerinde alt/üst kavram, parça/bütün ve eş anlamlılık ilişkisinin yarı ve tam otomatik olarak çıkarılmasıdır. İkinci katkı, WordNet, sözlük gibi birçok kaynağın adapte edilmesi ile oluşturulan birleşik bir modelin kullanılmasıdır.