Ketika Machine Learning 'Membaca' Piala Dunia
- Search Engine Journal
VIVA Tekno – Meski Piala Dunia 2022 di Qatar telah usai, namun gegap gempitanya masih terasa. Media sosial Twitter berkontribusi besar dalam memberitakan turnamen sepak bola empat tahunan tersebut.
Dalam blog resmi Twitter disebutkan ada lebih dari 147 miliar tayangan (impression) dari berbagai tweet tentang Piala Dunia 2022. Ini melampaui tweet tentang Piala Dunia 2018 dan lebih dari dua kali lipat dari jumlah tayangan tweet tentang Olimpiade 2020.
Sekelompok tim dari perusahaan yang bergerak di bidang pembelajaran mesin (machine learning/ML) Pacmann ikut meramaikan momentum ini.
Mereka pun melakukan analisis menggunakan machine learning model, yaitu Named-Entity Recognition dan Emotion Analysis.
Melalui analisis Named-Entity Recognition, Pacmann menganalisis sekitar 280 ribu cuitan berbahasa Indonesia di Twitter dari 19 November hingga 19 Desember 2022 dengan kata kunci “piala dunia” dan “pildun”.
Metode ini digunakan untuk mendeteksi popularitas pemain dan tim yang berlaga. Named-Entity Recognition adalah salah satu tasks dari Natural Language Processing (NLP) yang digunakan untuk mengekstraksi informasi seperti nama, organisasi, lokasi, hingga waktu, dari kumpulan dataset tak terstruktur seperti cuitan.
Siapa pemain terpopuler?
Berdasarkan analisis tersebut nama Lionel Messi dengan perolehan cuitan dua kali lipat lebih banyak dibandingkan Cristiano Ronaldo. Pemain populer selanjutnya ditempati oleh Kylian Mbappe dan Neymar Junior.
Menariknya, Karim Benzema juga jadi pemain paling populer kelima walau tidak sekalipun bermain di turnamen tersebut.
"Hasil analisa ini bisa jadi informasi tambahan soal pemain terbaik sepanjang sejarah sepak bola. Saya yakin tidak semua orang setuju. Tapi, satu hal yang pasti, Lionel Messi dan Cristiano Ronaldo pemain sepak bola terpopuler dekade ini," kata CEO & Chief Data Scientist Pacmann and Valiance Adityo Sanjaya, Sabtu, 24 Desember 2022.
Sementara tim terpopuler selama Piala Dunia 2022 adalah Argentina, dilanjutkan oleh Portugal dan Kroasia. Hal menarik lain yang ditemukan adalah Maroko, salah satu tim kuda hitam yang menduduki posisi tim terpopuler keempat atas prestasi mereka yang bisa mencapai babak semifinal.
Selain menggunakan Named-Entity Recognition, tim Pacmann juga menganalisis data percakapan menggunakan Emotion Analysis – merupakan proses yang menggunakan teknik komputasi untuk mengidentifikasi dan mengekstraksi emosi yang terkandung di dalam teks.
Masih dari analisis yang sama, lebih dari separuh percakapan seputar Piala Dunia 2022 di Twitter memuat Happiness Emotion. Penerapan Emotion Analysis serupa dengan Sentiment Analysis dapat membantu pelaku bisnis memantau pembicaraan atau ulasan tentang suatu produk dan layanan mereka.
"Use case ini menjelaskan seberapa penting dan bermanfaat data, kalau kita tahu bagaimana cara mengolah dan menganalisisnya," jelas Adityo.
Sebagai informasi, Pacmann adalah perusahaan yang mengajarkan soal data dan bisnis. Saat ini, Pacmann telah mendirikan tiga sekolah, yakni Sekolah Data, Sekolah Bisnis, dan Sekolah Engineering.
Masing-masing sekolah menawarkan kurikuluan end-to-end, mendalam, teraktual, serta sesuai dengan kebutuhan industri. Pacmann juga memiliki unit bisnis khusus bernama Valiance yang fokus pada penerapan dan pengembangan machine learning algorithm, hingga konsultasi pengelolaan data untuk bisnis dan perusahaan.