YTÜ DSpace Kurumsal Arşivi

Metin madenciliği ile metin sınıflandırma

Basit öğe kaydını göster

dc.contributor.advisor Yrd. Doç. Dr. Nilgün Güler Bayazıt
dc.contributor.author Pilavcılar, İsmail Ferhat
dc.date.accessioned 2018-07-27T12:22:42Z
dc.date.available 2018-07-27T12:22:42Z
dc.date.issued 2007
dc.identifier.uri http://localhost:6060/xmlui/handle/1/9329
dc.description Tez (Yüksek Lisans) - Yıldız Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2007
dc.description.abstract Bilgisayarların çıkısı ve gelismesiyle her geçen gün biraz daha değisen ve gelisen bir dünyadayasamaktayız. Bilgisayarlar yasantımıza birçok kolaylık katmakta, yapılan islerin yükünühafifletmekte, daha iyi sonuçlara, daha kısa yollardan ulasmamızı sağlamaktadır. Bilgisayarlaraynı isi otomatik olarak ve daha verimli yapacağından insan kaynaklı hatalar en azaindirgenir.Bilgisayarların gelisimine paralel olarak, insanlar daha fazla bilgiye erisim olanakları bulmusve günden güne, çok sayıda veriyi depolayan sistemler, yani veritabanları olusturulmus ve buveritabanlarının boyutları da günden güne büyümüstür.Çesitli tipte veritabanları mevcuttur. Metin halindeki verilerin bulunduğu veritabanlarındanbilgiyi kolayca elde etmek için metin kategorizasyon yöntemleri uygulanır. ?lk zamanlardainsan aracılığıyla yapılan sınıflandırma, günümüzde doküman sayısının çok hızlı bir sekildeartması dolayısıyla otomatik olarak yapılır hale gelmistir. Bunun için, daha öncedenkategorileri tanımlanmıs olan eğitim dokümanları yardımıyla metin halindeki verilersınıflandırılabilmektedir.Tezde, amaç doğrultusunda, metin halindeki verilerin sınıflandırılmasında kullanılan metinkategorizasyon teknikleri (Naive Bayes, k-NN) ve çesitli ağırlıklandırma yöntemleriincelenmis olup, daha sonra bu teknikleri kullanarak VisualBasic.NET programlama dili ilemetin kategorizasyon programı yazılmıs ve aynı zamanda ilgili tekniklerin doğrusınıflandırma olasılıkları açısından kıyaslamaları yapılmıstır. Bu tezde, metin sınıflandırmasıüzerinde çalısmak için Anadolu Ajansı adlı Türkçe bir veri kümesinin derlemesi sunulmustur.Anahtar Kelimeler: Metin kategorizasyonu, naive bayes ve k-nn algoritmaları, metinmadenciliği, sınıflandırma, joker (wild card) yöntemi.
dc.subject Vektör uzay modeli
dc.subject Algoritmalar
dc.title Metin madenciliği ile metin sınıflandırma
dc.type Tez


Bu öğenin dosyaları

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster