AraKullanıcı girişiGezintiEn son ağ günlüğü gönderileri
En Çok Okunanlar
Kimler yeni
İçerik paylaşımı |
WEB İÇERİK TARAMA VE EBEVEYN KONTROLU1. Giriş Çocukların denetimsiz internet kullanımı önemli tehlike ve riskleri de beraberinde getiriyor. İnternet kullanımının çığ gibi yayıldığı günümüzde çocuklar da neredeyse sonsuz bir bilgi ve iletişim olanağına sahip oldular. Çocuklar internet sayesinde ansiklopediler, güncel olaylar, kütüphaneler ve diğer birçok değerli malzemeye kolayca erişiyorlar. Ayrıca sadece "tık"layarak birçok alanda "gezinebilme" olanağı çocuklarda doğal olarak var olan dürtüsel davranış, merak ve çabuk haz veya yanıt alma ihtiyacına da yanıt veriyor. Buna karşın çocukların denetimsiz bir şekilde internet kullanmalarının ciddi risk ve tehlikeleri de mevcut. İnternet kullanımını deneteme ve sağlıklı hale getirmede web içerik tarama ve ebeveyn kontrolü çözümü devreye girmektedir. Bu çalışmada hem sosyo-psikolojik hem de teknolojik alanlarda vurguları birlikte ve birbirini tamamlayıcı bir biçimde yapılacaktır. İnternet nesillerin eğitimi yada dejenerasyonu için de kullanılabileceği için özellikle teknolojisi ile birlikte içeriğinin daha önemli olduğu bir kavramı tartışacağız. İçeriğin önemi ortaya çıkınca içeriğin lokalizasyonu ve içeriğin lokalizasyonundan ahlaki ve sosyal değerlerin yerel manalarına da atıfta bulunacağız. Teknolojisi bakımından URL filtreleme, içerik filtreleme ve resim analizi kullanılan metotlardır. Bu çalışma hem içerik sağlama hem de metin içerik taramada yani yöntemler öne sürülecek hem de bu sistemlerin sosyal niteliklerinden dolayı yerelliklerine vurgu yapacaktır. 2. İÇERİK FİLTRELEME İçerik filtrelemek için kullanılan teknikler: İçerik taramada birkaç metot kullanılır. Kelime Analizi: Sayfa metninde kelime arama · Özel kelimeler Bununla birlikte cinsel eğitim siteleri Resim tanıma: Sayfanın içindeki resmi algılama yöntemiyle karar verme mekanizmasına sahiptir. Kolaylıkla tahmin edilebileceği gibi yukarıdaki yöntemlerden içerik tarama yöntemi büyük ölçekte yerelleştirme gerektiren bir yöntemdir. Mesela “PKK” yabancı bir yazılım dolayısı ile yabancı bir içerik için zararlı bir içerik değilken Türkiye ve Türkler yani bizim için zararlı bir içeriktir. Ayrıca yukarıda bahsedilen yöntemlerden URL yasaklama ve içerik tarama güncellenen ve güncellenebilir içeriği destekleyen mekanizmalara sahip olmalıdırlar. Bu yöntemleri kullanırken kullanıcı memnuniyeti de hiçbir zaman gözden kaçırılmamalıdır. Sizin karar verme mekanizmanın doğruluk oranı çok yüksek olabilir ama kullanıcı internette gezmek için çok beklerse memnuniyetsizliği artar. Dolayısı ile içerik taramada başarı ve performans birbirinin tamamlayıcısıdır. Biri için diğerinden vazgeçilemez. 3. TEMİZ İÇERİK ALGILAMA Bazı kelimeler kullanım yerine göre çok uygunsuz bir site veya içeriği uygun olabilecek bir siteye işaret ediyor olabilirler. Örneğin; Virgin kelimesi bir sitede geçiyorsa o site engelleniyor. Bunun gibi hem iyi sitelerde hem de kötü sitelerde geçebilen bir sürü kelime var ve bu kelimeleri kullanan milyonlarca iyi site olabilir. Virgin bakire anlamının yanında el değmemiş anlamına da geliyor. Bu kelimenin geçtiği site sanat içerikli bir site de olabilir. Kelime filtrelerken kullanılan üstün teknolojisi ile Webjini, sitelerin uygun olup olmadığına karar vermede hem kısa sürede hem de amaca yönelik hareket edilmesini sağlar. Bu teknolojiyi kısaca aşağıdaki örnekle açıklayabiliriz; Bunun gibi belli kelimelere puanlar verilerek sitenin olumlu olup olmadığı konusunda daha kesin bir kanıya varılabilir. Bu çalışmada Dr. Ertuğrul Akbaş ve ekibi tarafından geliştirilen Webjini [3] motoru kullanıldı. Temiz içerik algılamada en önemli tekniklerden biri HTML sayfasını hafızada oluşturmak ve HTML tag larını sıyırmaktır. Webjini motoru bu yeteneğe sahip olduğu için bu motorda birkaç yenilik ile bu sağlanmıştır. Diğer bir yenilik de gelen isteğin dilinin tespit edilmesi bunu için kelime frekans analizleri-smoothed frequency probability distribution, compared using cross-entropy, simple frequency rank- kullanıldı Dil tespiti dinamik içerik tarama ve temiz içerik algoritmasında kullanılır. Linguistik analiz yeteneği yine bir filtreleme motorunun gücünü gösteren bir yetenektir. Webjini motoru bu yeteneğe sahip olduğu için bu motorda birkaç yenilik ile bu sağlanmıştır. 4. CRAWLER ANALİZİ Bu çalışmada kullanılan webjini motoru URL ve dinamik içerik taramayı birlikte yapabilme yeteneğine sahip bir motor barındırmaktadır. URL tarama kesinliği %100 olan teknik için offline sayfa analizi, bunun merkezi bir veritabanında toplanması ve daha sonra bunun güncellemeler ile kullanıcılara dağıtılması adımlarını içeren bir algoritmadır. Bu analiz merkezi yada yük dağılımı yapılmış arka serverlarda metin, resim ve editörler aracılığı ile toplanan URL lerin merkezi sistemden dağıtılması –Push Method- için offline olarak geliştirilen metin tarama, resim tarama ve obje analizi yapılarak daha sonra istenirse editörel bir onaydan sonra URL veritabanına kaydedilmesinin sağlanmasına bu çalışmada crawler analizi denmiştir. 5. TEKNOLOJİK VE SOSYO-KÜLTÜREL GEREKSİNİMLER Bir çözümün kullanılabilmesi için teknolojik altyapı ve gereksinimlerin karşılanması olmazsa olmaz şarttır. Bu özellikler: Tarama Yeteneği: adres satırı ve başlık haricinde sayfanın tamamında içerik tarayabilmesidir. Ve bu konuda kararlı (stable ) bir motora (engine) sahip olması ve kişiye ve kültüre göre özelleştirilebilmelidir. Bunu sağalmak için kelime ve cümleler gibi tarama verileri kullanıcılar tarafından eklenebilmeli. Linguistik Analiz: Analiz yaparken şu temel hatayı yapmamalı. ‘kale’ kelimesini yasaklayınca ‘makale’ kelimesini yasaklamamalı. Türkçe konusunda da duyarlı olmalı HTML Encoding: Sağlıklı birşekilde içerik tarama ve dinamik içerik tarama yöntemlerinin uygulanabilmesi için sistemin <, >, " and &, gibi HTML, XML, ve SGML formatlarında tanımlanmış yada Temiz İçerik Algılama: Zararsız içerik tanıma teknolojisine sahip olmalı. Veritabanı Genişliği ve Yerel Veritabanı Desteği: Türkçe bir yasaklı URL listesine sahip olmalı ve bu işe atanmış editörler vasıtasıyla özellikle Türkçe siteleri devamlı tarayıp veritabanını güncellemelidir. Reverse DNS Teknolojisini Desteklemelidir: İsim ya da ip temelli arama yapabilmeli. Güvenli bölge tanımlama özelliği: İçerik Tarama Yaparken Kelime Derecelendirme Yapabilme Özelliği: İşletim Sistemi Desteği: Tarama Yaparken Bütün Trafiği Dondurmamalı URL veritabanı kullanma dinamik içerik ve resin tanıma ise dinamik tarama olarak da kullanılır. Bu çalışmada hem statik hem dinamik yöntemler bir arada kullanılmıştır. 6. TEKNOLOJİ İçerik filtrelemede kullanılan iki yöntem paket filtreleme ve proxy temelli filtrelemedir. Proxy özellikle yüksek trafik durumunda tercih edilen yöntemdir. Proxy temelli filtrelemenin paket analizi (sniffer) temelli filtrelemeye göre avantajı daha hızlı olmasıdır. Paket analizi temelli sistemlerde özellikle network web yoğun kullanıldığında yavaşlama problemleri olduğu raporlanmıştır. Bu problem özellikle temiz içerikli sayfaları yoğun kullanırken hissedilebilir. Bu çalışmada Proxy temelli webjini motorunda iyileştirmeler yapılarak temiz içerik tarama ve profil analizine aşağıdaki parametreler eklenerek yenilik ve farklılık sağlanmıştır: İncelenen Parametreler: 7. YERELLEŞTİRME Bu tür çözümlerin yerelleştirilmesi ihtiyacından makalenin başında da bahsetmiştik. Özellikle yerel ahlaki ve kültürel farklılıklar ve duyarlıklılar hem çözümün tasarımında hem de içeriğin tasarım ve güncellenmesinde yerel destek şart. Bu bağlamda bir çözümde olması gereken yerel özellikler Yerelleştirme ihtiyacı halihazırda zaten dünyada uygulanmaktadır. Bu konuda devletler ISP leri kullanmaktadır [4]. ISP çözümü verimli ve kabul gören bir çözüm değildir [1] 8. SONUÇLAR Ebeveyn kontrolü ve içerik filtrelemede kullanılan yöntemleri özetlersek: · Özel amaçlarla geliştirilmiş browserlar: Yukarıdaki teknikleri ve teknolojileri birlikte uygulanabileceği ve özellikle çok kullanıcılı ve profesyonel ortamlarda ortaya çıkan · Kullanıcı bazlı filtreleme gibi ihtiyaçları da karşılayabilen en uygun yöntem olarak proxy seçilmiştir [3,6]. Proxy ile ilgili rapor edilen tek handikap sistemde biraz yavaşlama olmasıdır. Bu pratikte önbellekleme (caching)kullanılarak çözülür. Yukarıdaki teknikleri uygularken performans da göz ardı edilmemsi gerekir. Kullanıcı memnuniyeti bu tür çözümlerin olmazsa olmazıdır[7] KAYNAKLAR [1] Effectiveness of Internet Filtering Software Products, Mathematical and Information Sciences, 2001 [7] Automatic Online Porn Detection and Tracking, Johnson I Agbinya, Bernard Lok, Yeuk Sze Wong and Sandro Da Silva [9] Characterizing Objectionable Image Content (Pornography and Nude Images) of Specific Web Segments: Chile as a Case Study [10] http://www.ics.uci.edu/~mlearn/MLOther.html
Not: Bu makale Ağ ve Bilgi Güvenliği Ulusal Sempozyumu nda yayınlanmıştır.
__________________________ (3 votes)
|
Benzer yazılar
EtiketlerŞifre
Ağ
Antivirüs
botnet
Cisco
Cross Site Scripting
DDoS
Denetim
DoS
Ebeveyn Kontrolü
Exploit
Firefox
Firewall
Güvenlik
Güvenlik Açıkları
Güvenlik Duvarı
Google
GP
Hack
Hacker
hacking
Hafıza Taşması
IP
Kablosuz Ağ
Kimlik Doğrulama
Kriptografi
Kurtçuk
Kurulum
Linux
Microsoft
Olta Saldırısı
Phishing
Rootkit
Saldırı
Servis Kullanımı Engelleme
Spam
SQL Injection
Sunucu
Trojan
Veritabanı
Virüs
Vista
VPN
web filtreleme
Web Güvenliği
Windows
worm
XSS
En son forum mesajlarıYaklaşan Aktiviteler |
Son yorumlar
16 saat 13 dk önce
16 saat 12 dk önce
2 gün 18 saat önce
6 gün 15 dk önce
6 gün 8 saat önce
6 gün 8 saat önce
1 hafta 20 saat önce
1 hafta 1 gün önce
1 hafta 1 gün önce
1 hafta 1 gün önce