Günümüzde teknolojinin hızla
gelişmesi ile sosyal medyanın gücü giderek artmaktadır. İnsanlar
gerek iletişim kurmada gerekse görüş ve önerilerini bildirmede çeşitli blog,
e-ticaret siteleri, formlar ve sosyal paylaşım platformlarından faydalanmaktadır.
Bu platformlardan en çok tercih edilenlere örnek verecek olursak Twitter,
Facebook, Instagram, Linkedin, Pinterest, Medium gibi siteler ve dahası
sıralanabilir. İnsanların belirtilen sitelerde fikirlerini paylaştıkları postlar ve yorumlar sonucunda milyonlarca veri oluşmaktadır. Bu verilere yapılan
analiz ve araştırmalar doğrultusunda anlamlı ifadeler çıkarılmaktadır.
Kullanıcılar bu platformlarda fikir bildiren yorumlar yaptığı gibi, duygu
durumlarını ve ruh hallerini belirten yorumlar da yapmaktadır. Hatta gündelik
yaşamda psikolojik ve ruhsal durumunu belirtmekte zorlanan insanlar sosyal
medyayı kullanarak kendilerini daha özgür ve rahat ifade edebilir. Bu nedenle
metinlerdeki ifade ve duygular farklı araştırma alanlarına araç olmaktadır.
Bazen Pazarlama ve Müşteri hizmetlerinde ürün veya hizmet için sonuçlar
çıkarmada kullanılırken bazense bir psikologun, hastasının yaşantısını ve
ruhsal durumunu takip etmesinde kullanılabilir.
Örneğin bir e-ticaret sitesinde
herhangi bir ürün hakkında kullanıcının yaptığı yorum ve değerlendirmeler
sonucunda satıcı firma ürün veya hizmetteki eksiklikleri tespit edip ona uygun
strateji geliştirebilir. Veya yaptığı çıkarımlar sonucunda ürün veya hizmetleri
arasında karşılaştırmalar yapabilir, piyasaya yeni sunacağı ürün ve özellikleri
hakkında karar verebilir. Veya seçim öncesi politikacılar, halkın
attığı tweetler, instagramda paylaştığı post ve atılan hashtagleri
kullanarak geri bildirimler alabilir. Bunun sonucunda seçim öncesi
politika ve kampanyalar geliştirerek stratejik açıdan diğer partilerden
üstünlük sağlayabilir. Peki, bu metinlerin içerdiği duygu durumu nasıl tespit
ediliyor?
Duygu Analizi (Sentiment Analysis)
internet ortamındaki yorum ve metinlerin yazılım sistemlerinin kullanılması ile
duygu içerip içermediğini saptamaktadır. İlk çalışmalarda duygusal kutupsallık
üzerine metindeki duygu durumunu nötr, olumlu veya olumsuz olacak şekilde tek
yönlü tespitler yapılırken günümüzde farklı yöntemlerin kullanımı ile aynı
metinden birden fazla duygu durumu tespiti yapılabilmektedir. Böylece
çalışmalar yerini duygu analizindeki metindeki duyguyu etiketlemenin dışına
çıkarak yerini daha açık uçlu sonuçların elde edildiği fikir madenciliği
çalışmalarına bırakmıştır.
Birçok farklı nedenden dolayı duygu analizi
kullanılmaktadır. Cümlenin öznel yargı belirtip belirtmediğinin saptanması,
herhangi bir fikrin kişiye ne kadar yardımcı olacağının saptanması ( alışveriş
siteleri vb.), bir fikrin kötü amaçla yazılıp yazılmadığının tespiti, metindeki
duygudan görüş belirten cümlelerin ve ana konunun saptanması, alay ve ironi
içeren cümlelerin saptanması duygu analizi kullanım nedenleri arasındadır.
Duygu ve Fikir Analizinde Kullanılan Yöntemler
Duygu ve fikir analizinde yapılan
çalışmalarda duygu polaritesinin tespiti gereklidir. Bu nedenle kullanılan
birçok yöntem vardır. Bu yöntemler iki ana grupta ele alınabilir. Bu
yöntemlerden biri makine öğrenmesine dayalı iken diğeri sözcük tabanlı
yöntemdir. Genellikle makine öğrenmesine dayalı yöntemler belirli bir alana
yönelik çalışmalarda tercih edilirken sözcük tabanlı yöntemler metinde yapılan
analiz sonucu ölçeklenebilirlikle ilgili çalışmalarda tercih edilir. Gelin bu
yöntemleri daha ayrıntılı inceleyelim.
1.
Makine Öğrenmesine Dayalı Yöntemler
Makine öğrenmesi duygu sınıflandırma
problemlerinde sıklıkla kullanılır. Bu nedenle farklı sınıflandırma
algoritmaları kullanılmaktadır. Makine öğrenmesine dayalı yöntemlerde sistem
önceden belirlenmiş eğitim verisi ile etiketlenir. Özelliklerin belirlenmesinde
özellik vektörü belirlenir ve bu sırada birçok yöntem kullanılır. Bular; Kelime
Torbası Modeli ( kelimelerin metinde tek tek veya ikili olacak şekilde geçip
geçmediğine dayalı model), Terim Frekansı-Ters doküman Frekansı ( bir kelimenin
o dökümanda geçme sayısı, o kelimeyi içeren toplam doküman sayısı ve tüm
dökümanların sayısına göre yapılan hesaplama) , Sözcük Türü ( metindeki kelimenin
sıfat, fiil, zarf vb. türlerinin özellik vektörünün oluşumunda
kullanılmasıdır), Nokta Tabanlı Karşılıklı Bilgi ( iki terim arası anlamsal karışıklığı önlemek için kullanılan skorlama yöntemi) şeklinde
sıralanabilir.
Makine öğrenmesine dayalı yöntemlerin
kullanımında bazı dezavantajlar da vardır. Bir metne göre eğitilmiş eğitim
verisi başka bir metin için kullanılamayabilir. Örneğin bir alışveriş sitesi
için eğitilen veri seti ve sistem, bir siyasi parti hakkında atılan tweetlerin
analizinde kullanılamaz.
Makine öğrenmesine dayalı metin
sınıflandırma yöntemleri Denetimli Öğrenme ve Denetimsiz Öğrenme olacak şekilde
sınıflandırılır. Denetimli öğrenmede etiketli veri setlerine ihtiyaç duyulurken denetimsiz öğrenmede etiketsiz veri setleri kullanılır. Denetimli öğrenmede
kullanılan sınıflayıcılar Naive Bayes, Destek Vektör Makinesi ve Maksimum
Entropi şeklinde sıralanabilir. Daha çok film yorumlarındaki duygu analizi
tespitleri için kullanılmaktadır. Denetimsiz öğrenmede kümeleme işlemleri için
kullanılır. Denetimsiz öğrenmede kullanılan yöntemlere örnek olarak PMI (
Pointwise Mutual Information) ve LDA ( Latent Dirichlet Allocation)
verilebilir.
2.
Sözcük Tabanlı Yöntemler
Metinlerde sözcük tabanlı analiz yapılırken
genel olarak 3 yöntem kullanılmaktadır. Bunlar; Koşullu Rastgele Alanlar (
doğal dil işlemede kelimenin kullanım amacının kelimeden önceki ve sonraki
kelimeler ile bulunduğu cümleden önceki ve sonraki cümlelerin de göz önünde bulundurularak
uygulanan istatistiksel tabanlı yöntemler), Bağlılık Ağacı ( cümledeki öğelerin
birbirlerini etkileme ve bağlılığını inceleyen yöntem), Kural Tabanlı Yaklaşım
( sözcük türleri ile farklı doğal dil işleme özelliklerine dayanan kuralların
belirlenip cümle yapılarının analiz edilmesi yöntemi ) şeklinde sıralanabilir.
Duygu analizi çalışmalarında konu
aralarında bahsettiğimiz sorunlar gibi birçok sorunla karşılaşılmaktadır.
Örneğin:
·
Aynı kelimelerin
farklı alanlarda, farklı anlamlarda kullanılması,
·
Cümlelerdeki alaycı
ifadelerin bulunması,
· Metinin bütünü tek bir
duygu ile ilerlerken bir cümlenin veya ifadenin bütünü etkilemesi,
·
Bazı olumsuzluk
ifadelerinin akabinde duygu durumunu tersine çevirmesi,
·
Var olan sözlüklerin,
analizler açısından yetersizliği.
Genel olarak Duygu ve Fikir Analizi hakkındaki bilgiler bu şekilde
olmakla beraber daha detaylı araştırmalar ve örneklere de ulaşılabilir. Bu
konuda teorik açıdan analiz yapacak düzeyde olmayanlarımız veya çalışma ve ilgi
alanı bu yönde olmayanlarımız için aslında konunun günlük hayatımızdaki yerine
değinmek istedim. Günün neredeyse yarısını beklide fazlasını ayırdığımız sosyal
paylaşım platformlarına hepimiz izimizi bırakmaktayız. Yaptığımız yorumlar,
verdiğimiz oylar ve paylaşımlarımız aslında birer parmak izi niteliği taşırken
kişiliğimize dair bilgiler de vermektedir. Bunun sonucunda yapılan analizlerde
iz taşıdığımız gibi bizler de kendi çapımızda metin incelemesi yaparak fikir ve
duygu analizi ve tahminlerde bulunabiliriz. Yaptığımız analiz sonuçlarını
günlük hayatta bazı merak konularının giderilmesinden problem çözümüne kadar
geniş bir yelpazede kullanabiliriz.