On Clustering Covid-19 Tweets with Text Min- ing Perspective


Bakal M. G. , Abar H., Öztürk İ., Abar O., Abar O. (Editor)

in: Text Mining Applications Using Real-World Data in Python, Orhan Abar, Editor, Nobel Yayınevi, Ankara, pp.1-22, 2021

  • Publication Type: Book Chapter / Chapter Research Book
  • Publication Date: 2021
  • Publisher: Nobel Yayınevi
  • City: Ankara
  • Page Numbers: pp.1-22
  • Editors: Orhan Abar, Editor

Abstract

Over the last two decades, the amount of existing data sources in the world have dramatically increased due largely to digitalization. In parallel, data analysis has become a crucial topic for researchers in many areas. One of the essential perspectives in data analysis is text mining. In various forms, textual data is the most generated data element compared to multimedia data. Since the available data sizes are exponentially increasing, we need intelligent computational methodologies to handle massive datasets. Data mining approaches, specifically text mining techniques, come into prominence. The application of both text mining and machine learning techniques together on data analysis provides decent solutions. For that purpose, this book is prepared with four major chapters discussing various aspects of data analysis with text mining methods, such as clustering, classification, sentiment analysis, and prediction tasks implemented in the Python programming language.

Son yirmi yılda, dünyadaki mevcut veri kaynağı miktarı, büyük ölçüde dijitalleşme nedeniyle ciddi manada artış göstermiştir. Buna paralel olarak, veri analizi birçok alanda araştırmacılar için kritik bir konu haline gelmiştir. Veri analizinde temel bakış açılarından biri de metin madenciliğidir. Çeşitli biçimlerde metinsel veriler, multimedya verilerine kıyasla en çok üretilen veri öğesidir. Kullanılabilir veri boyutları katlanarak arttığından, büyük veri kümelerini işlemek için akıllı hesaplama metodolojilerine ihtiyacımız olmaktadır. Veri madenciliği yaklaşımları, özellikle metin madenciliği teknikleri ön plana çıkmaktadır. Veri analizinde hem metin madenciliği hem de makine öğrenmesi tekniklerinin birlikte uygulanması iyi çözümler sunmaktadır. Bu amaçla, bu kitap, Python programlama dilinde uygulanan kümeleme, sınıflandırma, duygu analizi ve tahmin görevleri gibi metin madenciliği yöntemleriyle veri analizinin çeşitli yönlerini tartışan dört ana bölümle hazırlanmıştır.