Analisis Sentimen - Tips Excel

Analisis Sentimen di Excel! Ada tambahan gratis dari Microsoft Labs yang memungkinkan Anda melakukan analisis sentimen di Excel. Bagaimana jika Anda harus membaca ratusan komentar survei untuk mengetahui pendapat orang tentang perusahaan Anda? Excel dapat menetapkan probabilitas yang menunjukkan seberapa positif atau negatif setiap komentar.

Menonton video

  • Mudah untuk mengukur data survei jika berupa pilihan ganda
  • Anda dapat menggunakan tabel pivot untuk mengetahui persentase yang dimiliki setiap jawaban
  • Tapi bagaimana dengan jawaban teks bentuk bebas? Ini sulit untuk diproses jika Anda memiliki ratusan atau ribuan.
  • Analisis Sentimen adalah metode berbasis mesin untuk memprediksi apakah sebuah jawaban positif atau negatif.
  • Microsoft menawarkan alat yang melakukan Analisis Sentimen di Excel - Pembelajaran Mesin Azure.
  • Analisis sentimen tradisional mengharuskan manusia untuk menganalisis dan mengkategorikan 5% pernyataan.
  • Analisis sentimen tradisional tidak fleksibel - Anda akan membuat ulang kamus untuk setiap industri.
  • Excel menggunakan MPQA Subjectivity Lexicon (baca tentang itu di http: // bit. Ly / 1SRNevt)
  • Kamus generik ini mencakup 5.097 kata negatif dan 2.533 kata positif
  • Setiap kata memiliki polaritas kuat atau lemah
  • Ini berfungsi baik untuk kalimat pendek, seperti Tweet atau kiriman Facebook
  • Itu bisa tertipu oleh negatif ganda
  • Untuk menginstal, masuk ke Sisipkan, Penyimpanan Excel, cari Pembelajaran Mesin Azure
  • Tentukan rentang masukan dan dua kolom kosong untuk rentang keluaran.
  • Judul untuk rentang masukan harus cocok dengan skema: tweet_text
  • Artikel pendamping di: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/

Transkrip Video

Pelajari Excel dari Podcast, Episode 2062: Analisis sentimen di Excel

Oh, hei, itu adalah malam Thanksgiving dan kami sedang duduk-duduk di sekitar pai labu dan Jes, teman kami, mulai berbicara tentang melakukan analisis sentimen pada data Twitter. Dan saya berkata, "Hei, Anda tahu bahwa Excel memiliki cara untuk melakukan analisis sentimen." Dan saya menyadari bahwa saya tidak memiliki video yang bagus tentang ini atau video apa pun tentang ini, jadi video ini tentang melakukan analisis sentimen di Excel.

Sekarang pertanyaan pertama adalah, apa sih analisis sentimen itu? Dan jika Anda melakukan survei terhadap pelanggan Anda dan mereka memiliki pilihan ganda di mana mereka dapat memilih dari 1 hingga 5, itu sangat, sangat mudah untuk dianalisis. Anda bisa membuat tabel pivot kecil: Sisipkan tabel pivot, Lembar Kerja yang Ada di sini, klik OK. Kami ingin mengetahui pertanyaan di sana atau jawaban atas pertanyaan itu, lalu berapa banyak jawaban untuk masing-masing pertanyaan, dan itu memberi kami angka absolut. Anda bahkan dapat masuk ke sini dan mengubah ini dari Pengaturan Bidang ke Tampilkan nilai sebagai% dari Total Kolom, seperti itu.

Baiklah, agar Anda bisa melihat untuk setiap jawaban berapa persentase orang yang mendapat jawaban. Baiklah, tetapi analisis sentimen adalah untuk saat Anda memiliki jawaban yang sangat panjang di mana Anda berkata, "Hei, baiklah, baiklah Anda tahu, beri tahu kami mengapa Anda memberi kami jawaban itu?" Dan mereka, Anda tahu, menggunakan kalimat atau paragraf. Nah, jika Anda memiliki ratusan atau ribuan ini, sangat sulit bagi seseorang untuk membaca dan membaca semuanya dan mencari tahu apa yang terjadi, oke?

Jadi ada dua jenis analisis sentimen. Biasanya di masa lalu Anda akan menggunakan algoritma pembelajaran yang diawasi manusia. Jadi jika Anda memiliki 5.000 jawaban, lanjutkan, Anda tahu, 200 di antaranya dan pilih kata dan frasa positif dan negatif. Anda pada dasarnya membuat kamus kata-kata positif dan negatif; tapi, tahukah Anda, ini sangat membatasi. Jika Anda melakukan ini untuk tempat yang melakukan perbaikan mobil dan kemudian memiliki pelanggan yang berbeda, Anda tahu, yang melakukan pembersihan karpet, kedua kamus itu sama sekali berbeda. Anda harus melakukan pembelajaran mesin atau pembelajaran yang diawasi manusia berulang kali. Jadi, Excel menggunakan hal yang disebut MPQA Subjectivity Lexicon dan Anda dapat menggunakan Google ini. Ada info tentangnya - 5.097 kata negatif, 2533 kata positif. Sehingga,ini berfungsi baik untuk kalimat pendek atau Tweet atau kiriman Facebook. Tetapi satu hal yang saya perhatikan adalah jika seseorang menulis dengan negatif ganda, saya tidak dapat mengatakan bahwa saya tidak membenci fitur ini, pembelajaran mesin akan gagal di sana. Dan sih, saya gagal. Saya tidak tahu apakah mereka bahagia atau tidak.

Baiklah, jadi inilah yang kami lakukan. Di Excel 2013 atau Excel 2016, keluar ke tab Sisipkan, masuk ke Bursa, saat kotak pencarian muncul, cari Mesin Azure dan Anda mendapatkan Pembelajaran Mesin Azure di sana. Kami klik Tambahkan. Baiklah, dan dua alat berbeda di sini: Prediktor Korban Titanic, yang menyenangkan; dan, Add-in Excel analisis Sentimen Teks. Ayo gunakan yang itu. Baiklah, ini beberapa hal yang akan membuat Anda tersandung. Judul Anda: Ambil satu paragraf untuk menjelaskan jawaban Anda. Itu harus cocok dengan Skema dan Skema mengatakan bahwa judulnya harus bertuliskan tweet_text. Jadi, di sini: tweet_text, tentu saja, masalah case-sensitive, oke. Dan kemudian tutup Skema, lalu Prediksi, Input: A1 hingga 100, Data saya memiliki header, Output: DataB1, Sertakan header. Mereka akan memberi kita 2 kolom.Pastikan Anda memiliki 2 kolom kosong di sana; jika tidak, itu akan menimpa data. Anda memiliki 2 pilihan: Beberapa baris sekaligus atau Sebagai kelompok. Ini hanya seratus, jadi tidak masalah. Saya akan memilih Predict dan BAM! Secepat itu.

Baiklah sekarang, kita mendapatkan 2 kolom: kita mendapatkan Sentimen dan Skor, baiklah. Jadi, mari kita gambarkan skor di sini sebagai persentase dengan sekelompok tempat desimal. Baiklah, jadi 47,496, ini berubah dari 0 menjadi 100%. Mendekati 100 sangat positif, mendekati 0 sangat negatif, oke? Jadi di sini, ada satu masalah kecil yang membuat saya gila. Tidak dapat menemukan solusinya, jadi Anda dapat melihat mengapa itu dinilai sangat negatif. Mari kita lihat salah satu yang muncul dengan sangat positif. Baiklah, jadi Anda tahu, jadi kami punya beberapa kata-kata bahagia di sini: tolong dan terima kasih, tanda seru, dan sebagainya. Itu mungkin berkontribusi pada skor tinggi. Baiklah, apakah ini sempurna? Tidak, tetapi ini akan memberi Anda cara yang cepat dan cepat untuk memberi tahu Anda, Anda tahu, berapa banyak orang yang sangat bahagia atau sangat negatif tentang jawaban tersebut.

Dan tentu saja, sekali lagi, di sini kita dapat melakukan ini dengan tabel pivot: Sisipkan, Tabel Pivot, buka Lembar Kerja yang Ada di sini, klik OK, dan kami tertarik dengan Sentimen, dan mungkin dengan Skor rata-rata untuk masing-masing. Jadi kami akan mengubah ini di bawah Pengaturan Bidang menjadi Rata-rata, klik OK. Jadi, atau mungkin bahkan seorang Count. Saya kira kami ingin tahu Count, berapa banyak orang. Jadi kita akan mengambil bidang lain, jadi, kita tahu berapa banyak orang yang negatif. Ooh, berapa orang yang netral, berapa orang yang positif dan berapa skor rata-rata masing-masing.

Baiklah, jadi jika Anda memiliki data survei dan itu adalah pilihan ganda, mudah menggunakan tabel pivot untuk mengetahui persentase yang dimiliki setiap jawaban. Tetapi untuk jawaban teks bentuk bebas, sulit untuk diproses. Jika Anda memiliki ratusan atau ribuan di antaranya, analisis sentimen adalah metode berbasis mesin untuk memprediksi apakah sebuah jawaban positif atau negatif. Microsoft menawarkan alat gratis untuk ini. Berfungsi di Excel 2013 atau Excel 2016, yang disebut Pembelajaran Mesin Azure. Biasanya harus melalui dan mengkategorikan 5% pernyataan secara manual dengan tangan. Ini tidak fleksibel, Anda harus mengkategorikan ulang untuk setiap kumpulan data baru, tetapi Excel menggunakan Leksikon Subjektivitas MPQA ini. Ini kamus umum. Ini akan berfungsi untuk kalimat pendek, Tweet, posting Facebook. Saya bisa tertipu oleh negatif ganda. Jadi buka saja Excel Store,cari Azure Machine Learning. Tentukan masukan dan dua kolom untuk rentang keluaran. Jangan lupa untuk mengubah tajuk agar sesuai dengan Skema, tweet_text, dalam kasus khusus ini.

Baiklah, jadi begitulah. Lain kali Anda memiliki sejumlah besar data untuk dianalisis, periksa menggunakan Azure Machine Learning, Add-in gratis untuk Excel 2013. Terima kasih telah mampir, sampai jumpa di lain waktu untuk netcast lain dari.

Unduh berkas

Unduh file contoh di sini: Podcast2062.xlsm

Artikel yang menarik...