Bilgisayardaki dosyalardan benzerlik tespit etme programı: WCopyfind - Gerçek Öğretmen

6.3.19

Bilgisayardaki dosyalardan benzerlik tespit etme programı: WCopyfind

WcopyFind, 2002 yılında Virginia Üniversitesinde çalışan akademisyenler tarafından yapılan bir programdır.

İki aşamada işlemlerini gerçekleştirir. İlk aşamada bütün dokümanları yükler ve çırpı kodlarını oluşturur. İkinci aşamada çırpı kodu oluşturulmuş doküman çiftlerini karşılaştırır ve rapor oluşturur. Programın ara yüzünde kullanıcıya bazı ayarlar sunulmaktadır. Karşılaştırma ayarlarında büyük/küçük harf, noktalama işaretleri, sayılar ve diğer karakterlerin kaldırılması, eşleşecek en kısa sözcük grubu, eşleşen kelimelerin minimum yüzdesi ve dil ayar durumu mevcuttur. Türkçe dilini desteklemektedir.

Her doküman bir kez okunduktan sonra 32-bit çırpı kodlarına dönüştürülür. Bu 32-bit çırpı kodları daha sonra doküman-sıralı listelere dönüştürülür. Karşılaştırma işlemi bu çırpı kodlar üzerinden gerçekleştirilir. Eşleştirme sırasında 4 karakterden kısa kelimeler incelenmemektedir.

Karşılaştırma işlemi bittikten sonra html uzantılı bir rapor oluşturulmaktadır. Program oluşturulan raporda iki dosyayı aynı sayfa içerisinde yan yana görmeyi mümkün kılmaktadır. Aynı zamanda metinler arasında ortak sözcükleri de .txt dosyası şeklinde kullanıcıya rapor etmektedir.

PROGRAMI İNDİR

DOSYAYI İNDİR


KAYNAK:
Kaya, M. & Özel, S. A. (2014). Türkçe Dokümanlardaki Benzerliklerin Tespiti İçin Mevcut Yazılımların Karşılaştırılması ve Türkçe Karakter Kullanımı ile Kök Almanın Etkisinin İncelenmesi. Çukurova Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 29(2), 115-129.

Hiç yorum yok:

Yorum Gönder

Yorumunuz için teşekkür ederiz.