Crexta – Crawl and Extract Data

13. Haz, 2011

2009 yılından bu yana üzerinde çalıştığım ve bir türlü hayata geçirmeyi başaramadığım projem “TurkCrawler”‘ı nihayet bitirmek üzereyim. Önümüzdeki aylarda bu framework alt yapısını Crexta (CRawl and EXtract DaTA) adı altında yayına alacağım. Proje ismi için TurkCrawler çok uygun bir isim değildi, bu nedenle Crexta (ya da belki de Crexda) olarak projenin ismini değiştirdim. Çok uzun soluklu bir proje oldu benim için ve tamamen kişisel olarak, .NET Framework alt yapısını kullanarak programladığım bir proje.

Peki nedir Crexta? Kısaca; internette yer alan bilgilere, istenilen formatta ve istenilen şekilde ulaşabilmeyi sağlayan bir alt yapı. Bu alt yapıyı kullanarak kullanıcılar, internet üzerinde ihtiyaç duydukları bilgileri tek bir noktada toplayabilir ve istedikleri bilgilere kolayca ve hızlı bir şekilde ulaşabilirler. Hatta bu alt yapıyı kullanarak dikey arama motorları hazırlamak bile mümkün, ki benim projeye başlarken kafamdaki hedef, uygulama geliştiren arkadaşlar için açık kaynak kodlu bir dikey arama motoru alt yapısı (framework) hazırlamaktı. Zaman içerisinde proje gelişip farklı bir boyut kazandı. Gayet de güzel oldu…

Detayları önümüzdeki aylarda paylaşacağım.

Sevgiler, saygılar

 

Kategoriler: Genel, Projeler · Etiketler: , ,

Fikrini Söyle