Makine Öğrenmesi etiketine sahip kayıtlar gösteriliyor. Tüm kayıtları göster
Makine Öğrenmesi etiketine sahip kayıtlar gösteriliyor. Tüm kayıtları göster

5 Mayıs 2020 Salı

Duygu ve Fikir Analizi



   Günümüzde teknolojinin hızla gelişmesi ile sosyal medyanın gücü giderek artmaktadır.  İnsanlar gerek iletişim kurmada gerekse görüş ve önerilerini bildirmede çeşitli blog, e-ticaret siteleri, formlar ve sosyal paylaşım platformlarından faydalanmaktadır. Bu platformlardan en çok tercih edilenlere örnek verecek olursak Twitter, Facebook, Instagram, Linkedin, Pinterest, Medium gibi siteler ve dahası sıralanabilir. İnsanların belirtilen sitelerde fikirlerini paylaştıkları postlar ve yorumlar sonucunda milyonlarca veri oluşmaktadır. Bu verilere yapılan analiz ve araştırmalar doğrultusunda anlamlı ifadeler çıkarılmaktadır. Kullanıcılar bu platformlarda fikir bildiren yorumlar yaptığı gibi, duygu durumlarını ve ruh hallerini belirten yorumlar da yapmaktadır. Hatta gündelik yaşamda psikolojik ve ruhsal durumunu belirtmekte zorlanan insanlar sosyal medyayı kullanarak kendilerini daha özgür ve rahat ifade edebilir. Bu nedenle metinlerdeki ifade ve duygular farklı araştırma alanlarına araç olmaktadır. Bazen Pazarlama ve Müşteri hizmetlerinde ürün veya hizmet için sonuçlar çıkarmada kullanılırken bazense bir psikologun, hastasının yaşantısını ve ruhsal durumunu takip etmesinde kullanılabilir.

   Örneğin bir e-ticaret sitesinde herhangi bir ürün hakkında kullanıcının yaptığı yorum ve değerlendirmeler sonucunda satıcı firma ürün veya hizmetteki eksiklikleri tespit edip ona uygun strateji geliştirebilir. Veya yaptığı çıkarımlar sonucunda ürün veya hizmetleri arasında karşılaştırmalar yapabilir, piyasaya yeni sunacağı ürün ve özellikleri hakkında karar verebilir. Veya seçim öncesi politikacılar, halkın attığı  tweetler, instagramda paylaştığı post ve atılan hashtagleri kullanarak geri bildirimler alabilir. Bunun sonucunda seçim öncesi politika ve kampanyalar geliştirerek stratejik açıdan diğer partilerden üstünlük sağlayabilir. Peki, bu metinlerin içerdiği duygu durumu nasıl tespit ediliyor?


   Duygu Analizi (Sentiment Analysis) internet ortamındaki yorum ve metinlerin yazılım sistemlerinin kullanılması ile duygu içerip içermediğini saptamaktadır. İlk çalışmalarda duygusal kutupsallık üzerine metindeki duygu durumunu nötr, olumlu veya olumsuz olacak şekilde tek yönlü tespitler yapılırken günümüzde farklı yöntemlerin kullanımı ile aynı metinden birden fazla duygu durumu tespiti yapılabilmektedir. Böylece çalışmalar yerini duygu analizindeki metindeki duyguyu etiketlemenin dışına çıkarak yerini daha açık uçlu sonuçların elde edildiği fikir madenciliği çalışmalarına bırakmıştır.

   Birçok farklı nedenden dolayı duygu analizi kullanılmaktadır. Cümlenin öznel yargı belirtip belirtmediğinin saptanması, herhangi bir fikrin kişiye ne kadar yardımcı olacağının saptanması ( alışveriş siteleri vb.), bir fikrin kötü amaçla yazılıp yazılmadığının tespiti, metindeki duygudan görüş belirten cümlelerin ve ana konunun saptanması, alay ve ironi içeren cümlelerin saptanması duygu analizi kullanım nedenleri arasındadır.

Duygu ve Fikir Analizinde Kullanılan Yöntemler

   Duygu ve fikir analizinde yapılan çalışmalarda duygu polaritesinin tespiti gereklidir. Bu nedenle kullanılan birçok yöntem vardır. Bu yöntemler iki ana grupta ele alınabilir. Bu yöntemlerden biri makine öğrenmesine dayalı iken diğeri sözcük tabanlı yöntemdir. Genellikle makine öğrenmesine dayalı yöntemler belirli bir alana yönelik çalışmalarda tercih edilirken sözcük tabanlı yöntemler metinde yapılan analiz sonucu ölçeklenebilirlikle ilgili çalışmalarda tercih edilir. Gelin bu yöntemleri daha ayrıntılı inceleyelim.

     1.     Makine Öğrenmesine Dayalı Yöntemler

   Makine öğrenmesi duygu sınıflandırma problemlerinde sıklıkla kullanılır. Bu nedenle farklı sınıflandırma algoritmaları kullanılmaktadır. Makine öğrenmesine dayalı yöntemlerde sistem önceden belirlenmiş eğitim verisi ile etiketlenir. Özelliklerin belirlenmesinde özellik vektörü belirlenir ve bu sırada birçok yöntem kullanılır. Bular; Kelime Torbası Modeli ( kelimelerin metinde tek tek veya ikili olacak şekilde geçip geçmediğine dayalı model), Terim Frekansı-Ters doküman Frekansı ( bir kelimenin o dökümanda geçme sayısı, o kelimeyi içeren toplam doküman sayısı ve tüm dökümanların sayısına göre yapılan hesaplama) , Sözcük Türü ( metindeki kelimenin sıfat, fiil, zarf vb. türlerinin özellik vektörünün oluşumunda kullanılmasıdır), Nokta Tabanlı Karşılıklı Bilgi ( iki terim arası anlamsal karışıklığı önlemek için kullanılan skorlama yöntemi) şeklinde sıralanabilir.

   Makine öğrenmesine dayalı yöntemlerin kullanımında bazı dezavantajlar da vardır. Bir metne göre eğitilmiş eğitim verisi başka bir metin için kullanılamayabilir. Örneğin bir alışveriş sitesi için eğitilen veri seti ve sistem, bir siyasi parti hakkında atılan tweetlerin analizinde kullanılamaz.

   Makine öğrenmesine dayalı metin sınıflandırma yöntemleri Denetimli Öğrenme ve Denetimsiz Öğrenme olacak şekilde sınıflandırılır. Denetimli öğrenmede etiketli veri setlerine ihtiyaç duyulurken denetimsiz öğrenmede etiketsiz veri setleri kullanılır. Denetimli öğrenmede kullanılan sınıflayıcılar Naive Bayes, Destek Vektör Makinesi ve Maksimum Entropi şeklinde sıralanabilir. Daha çok film yorumlarındaki duygu analizi tespitleri için kullanılmaktadır. Denetimsiz öğrenmede kümeleme işlemleri için kullanılır. Denetimsiz öğrenmede kullanılan yöntemlere örnek olarak PMI ( Pointwise Mutual Information) ve LDA ( Latent Dirichlet Allocation) verilebilir.  


2.     Sözcük Tabanlı Yöntemler

   Sözcük tabanlı yöntemde cümleler doğal dil işleme araç ve yöntemleri kullanılarak cümlelerdeki duygu belirten terimler tespit edilir. Bu terimler daha önceden duygu yönü ve sayısal olarak duygu skorunu tutan bir veritabanınca eşleşir. Bu veritabanına duygu sözlüğü de denmektedir. Doğal dil işleme araçlarının ve duygu sözlüğünün kullanımı tek bir çalışma alanında değil herhangi bir çalışmada kullanılabilir. Fakat kullanıcıların dolaylı anlatımlar ile görüş bildirdikleri durumlarda duygu terimleri kullanılmadığından başarısızlık söz konusu olabilmektedir. Bu gibi durumlarda makine öğrenmesine dayalı yöntemler ile daha başarılı sonuçlar elde edilmektedir.


 Metinlerde sözcük tabanlı analiz yapılırken genel olarak 3 yöntem kullanılmaktadır. Bunlar; Koşullu Rastgele Alanlar ( doğal dil işlemede kelimenin kullanım amacının kelimeden önceki ve sonraki kelimeler ile bulunduğu cümleden önceki ve sonraki cümlelerin de göz önünde bulundurularak uygulanan istatistiksel tabanlı yöntemler), Bağlılık Ağacı ( cümledeki öğelerin birbirlerini etkileme ve bağlılığını inceleyen yöntem), Kural Tabanlı Yaklaşım ( sözcük türleri ile farklı doğal dil işleme özelliklerine dayanan kuralların belirlenip cümle yapılarının analiz edilmesi yöntemi ) şeklinde sıralanabilir.

  Duygu analizi çalışmalarında konu aralarında bahsettiğimiz sorunlar gibi birçok sorunla karşılaşılmaktadır. Örneğin:

·       Aynı kelimelerin farklı alanlarda, farklı anlamlarda kullanılması,
·       Cümlelerdeki alaycı ifadelerin bulunması,
·    Metinin bütünü tek bir duygu ile ilerlerken bir cümlenin veya ifadenin bütünü etkilemesi,
·       Bazı olumsuzluk ifadelerinin akabinde duygu durumunu tersine çevirmesi,
·       Var olan sözlüklerin, analizler açısından yetersizliği.

  Genel olarak Duygu ve Fikir Analizi hakkındaki bilgiler bu şekilde olmakla beraber daha detaylı araştırmalar ve örneklere de ulaşılabilir. Bu konuda teorik açıdan analiz yapacak düzeyde olmayanlarımız veya çalışma ve ilgi alanı bu yönde olmayanlarımız için aslında konunun günlük hayatımızdaki yerine değinmek istedim. Günün neredeyse yarısını beklide fazlasını ayırdığımız sosyal paylaşım platformlarına hepimiz izimizi bırakmaktayız. Yaptığımız yorumlar, verdiğimiz oylar ve paylaşımlarımız aslında birer parmak izi niteliği taşırken kişiliğimize dair bilgiler de vermektedir. Bunun sonucunda yapılan analizlerde iz taşıdığımız gibi bizler de kendi çapımızda metin incelemesi yaparak fikir ve duygu analizi ve tahminlerde bulunabiliriz. Yaptığımız analiz sonuçlarını günlük hayatta bazı merak konularının giderilmesinden problem çözümüne kadar geniş bir yelpazede kullanabiliriz.