Analisis Sentimen - Petua Excel

Analisis Sentimen dalam Excel! Terdapat tambahan percuma dari Makmal Microsoft yang akan membolehkan anda melakukan analisis sentimen di Excel. Bagaimana jika anda harus melalui ratusan komen tinjauan untuk melihat pendapat orang tentang syarikat anda? Excel boleh memberikan kebarangkalian untuk menunjukkan seberapa positif atau negatif setiap komen.

Tonton Video

  • Sangat mudah untuk mengukur data tinjauan ketika itu adalah pilihan ganda
  • Anda boleh menggunakan jadual pangsi untuk mengetahui berapa peratusan setiap jawapan
  • Tetapi bagaimana dengan jawapan teks bentuk bebas? Perkara ini sukar diproses jika anda mempunyai ratusan atau ribuan daripadanya.
  • Analisis Sentimen adalah kaedah berasaskan mesin untuk meramalkan apakah jawapannya positif atau negatif.
  • Microsoft menawarkan alat yang melakukan Analisis Sentimen dalam Excel - Pembelajaran Mesin Azure.
  • Analisis sentimen tradisional memerlukan manusia untuk menganalisis dan mengkategorikan 5% pernyataan.
  • Analisis sentimen tradisional tidak fleksibel - anda akan membina semula kamus untuk setiap industri.
  • Excel menggunakan MPQA Subjectivity Lexicon (baca mengenai itu di http: // bit. Ly / 1SRNevt)
  • Kamus generik ini merangkumi 5,097 kata negatif dan 2,533 positif
  • Setiap perkataan diberikan polaritas yang kuat atau lemah
  • Ini sesuai untuk ayat pendek, seperti Tweet atau catatan Facebook
  • Ia boleh tertipu dengan negatif dua kali
  • Untuk memasang, pergi ke Insert, Excel Store, cari Pembelajaran Mesin Azure
  • Tentukan julat input dan dua lajur kosong untuk julat keluaran.
  • Tajuk untuk julat input harus sesuai dengan skema: tweet_text
  • Artikel pendamping di: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/

Transkrip Video

Belajar Excel dari Podcast, Episode 2062: Analisis sentimen dalam Excel

Oh hei, itu adalah malam Kesyukuran dan kami duduk di sekitar pai labu dan Jes, rakan kami, mula bercakap tentang melakukan analisis sentimen pada data Twitter. Dan saya berkata, "Hei, anda tahu bahawa Excel mempunyai cara untuk melakukan analisis sentimen." Dan saya menyedari bahawa saya tidak mempunyai video yang bagus atau video mengenai ini, jadi video ini adalah mengenai melakukan analisis sentimen di Excel.

Sekarang soalan pertama adalah, apa sebenarnya analisis sentimen? Dan jika anda melakukan tinjauan terhadap pelanggan anda dan mereka mempunyai pilihan pelbagai pilihan di mana mereka boleh memilih dari 1 hingga 5, baiklah, sangat mudah untuk dianalisis. Anda hanya boleh membuat jadual pangsi kecil: Masukkan jadual pangsi, Lembaran Kerja Sedia Ada di sini, klik OK. Kami ingin mengetahui soalan di sana atau jawapan untuk soalan itu, dan kemudian berapa banyak jawapan yang ada untuk masing-masing, dan itu memberi kita jumlah mutlak. Anda bahkan boleh masuk ke sini dan mengubahnya dari Tetapan Medan untuk Menunjukkan nilai sebagai% daripada Jumlah Lajur, seperti itu.

Baiklah, supaya anda dapat melihat setiap jawapan berapa peratus orang yang mendapat jawapan. Baiklah, tetapi analisis sentimen adalah apabila anda mempunyai jawapan yang sangat panjang di mana anda berkata, "Hei, baiklah, anda tahu, beritahu kami mengapa anda memberi kami jawapan itu?" Dan mereka, anda tahu, menggunakan ayat atau perenggan. Sekiranya anda mempunyai ratusan atau ribuan ini, sangat sukar bagi seseorang untuk mengalaminya dan membacanya dan mengetahui apa yang berlaku, baiklah?

Jadi ada dua jenis analisis sentimen. Biasanya pada masa lalu anda akan menggunakan algoritma pembelajaran yang diawasi oleh manusia. Oleh itu, jika anda mempunyai 5,000 jawapan, baca, anda tahu, 200 daripadanya dan pilih kata dan frasa positif dan negatif. Anda pada dasarnya membina kamus perkataan positif dan negatif; tapi, anda tahu, ini sangat mengehadkan. Sekiranya anda melakukan ini untuk tempat yang melakukan pembaikan kereta dan kemudian mempunyai pelanggan yang berbeza, anda tahu, siapa yang melakukan pembersihan karpet, kedua-dua kamus itu sama sekali berbeza. Anda harus melakukan pembelajaran mesin atau pembelajaran yang diawasi oleh manusia berulang-ulang kali. Oleh itu, Excel menggunakan perkara ini yang disebut MPQA Subjectivity Lexicon dan anda boleh pergi ke Google ini. Ia mempunyai maklumat mengenainya - 5,097 kata negatif, 2533 kata positif. Dan juga,ia berfungsi dengan baik untuk ayat pendek atau Tweet atau catatan Facebook. Tetapi satu perkara yang saya perhatikan ialah jika seseorang menulis dengan dua negatif, saya tidak boleh mengatakan bahawa saya tidak membenci ciri ini, baik, pembelajaran mesin akan gagal di sana. Dan ya, saya gagal. Saya tidak dapat mengetahui sama ada mereka gembira atau tidak.

Baiklah, jadi inilah yang kami lakukan. Dalam Excel 2013 atau Excel 2016, pergi ke tab Sisipkan, pergi ke Kedai, apabila kotak carian muncul untuk mencari Mesin Azure dan anda mendapat Pembelajaran Mesin Azure di sana. Kami mengklik Tambah. Baiklah, dan dua alat berbeza di sini: Titanic Survivor Predictor, yang menyeronokkan; dan, Analisis Sentimen Teks Excel Add-in. Mari gunakan yang itu. Baiklah, berikut adalah beberapa perkara yang akan membuat anda kecewa. Tajuk anda: Ambil satu perenggan untuk menjelaskan jawapan anda. Ia harus sesuai dengan Skema dan Skema mengatakan bahawa tajuk harus mengatakan tweet_text. Jadi, di sini: tweet_text, tentu saja, perkara sensitif kes, baiklah. Dan kemudian tutup Skema, dan kemudian Ramalkan, Input: A1 hingga 100, Data saya mempunyai tajuk, Keluaran: DataB1, Sertakan tajuk. Mereka akan memberi kami 2 ruangan.Pastikan bahawa anda mempunyai 2 lajur kosong di sana; jika tidak, ia akan mengganti data. Anda mempunyai 2 pilihan: Beberapa baris dalam satu masa atau Sebagai kumpulan. Ini hanya seratus, jadi itu tidak menjadi masalah. Saya akan memilih Ramalan dan BAM! Sepantas itu.

Baiklah sekarang, kami mendapat 2 lajur: kami mendapat Sentimen dan Skor, baiklah. Oleh itu, mari kita gambarkan skor di sini sebagai peratusan dengan banyak perpuluhan. Baiklah, jadi 47.496, ini meningkat dari 0 hingga 100%. Hampir 100 sangat positif, dekat dengan 0 sangat negatif, okey? Jadi di sini, kita mempunyai masalah di mana ada masalah kecil, menjadikan saya gila. Tidak dapat mencari penyelesaiannya, jadi anda dapat melihat mengapa ia dinilai sangat negatif. Mari lihat yang muncul sangat positif. Baiklah, jadi anda tahu, jadi kami mempunyai beberapa kata gembira di sini: tolong dan terima kasih, tanda seru dan sebagainya. Itu mungkin menyumbang kepada skor tinggi. Baiklah, adakah ia sempurna? Tidak, tetapi ini akan memberi anda kaedah yang cepat dan cepat untuk memberitahu anda, anda tahu, berapa banyak orang yang sangat gembira atau sangat negatif mengenai jawapan tersebut.

Dan tentu saja, di sini kita dapat melakukannya dengan jadual pangsi: Masukkan, Jadual Pangsi, pergi ke Lembaran Kerja yang Ada di sini, klik OK, dan kita berminat dengan Sentimen, dan mungkin dengan Skor rata-rata adalah untuk masing-masing. Oleh itu, kami akan mengubahnya di bawah Tetapan Medan menjadi Purata, klik OK. Jadi, atau mungkin juga Count. Saya rasa kami ingin mengetahui Count, berapa orang. Oleh itu, kita akan mengambil bidang lain, jadi kita tahu berapa banyak orang yang negatif. Ooh, berapa banyak orang yang berkecuali, berapa banyak orang yang positif dan berapa skor rata-rata setiap orang

Baiklah, jadi jika anda mempunyai data tinjauan dan ia adalah pilihan ganda, mudah gunakan jadual pangsi untuk mengetahui berapa peratusan setiap jawapan. Tetapi untuk jawapan teks berbentuk bebas, sukar untuk diproses. Sekiranya anda mempunyai ratusan atau ribuan daripadanya, analisis sentimen adalah kaedah berasaskan mesin untuk meramalkan apakah jawapannya positif atau negatif. Microsoft menawarkan alat percuma untuk ini. Berfungsi di Excel 2013 atau Excel 2016, yang disebut Azure Machine Learning. Biasanya perlu melalui dan mengkategorikan 5% pernyataan secara manual dengan tangan. Ia tidak fleksibel, anda harus mengkategorikan semula untuk setiap set data baru, tetapi Excel menggunakan Leksik Subjektiviti MPQA ini. Ini kamus umum. Ini akan berfungsi untuk ayat pendek, Tweet, catatan Facebook. Saya boleh tertipu dengan negatif dua kali. Jadi pergi ke Excel Store,cari Pembelajaran Mesin Azure. Tentukan input dan dua lajur untuk julat output. Jangan lupa untuk mengubah tajuk agar sesuai dengan Skema, tweet_text, dalam kes ini.

Baiklah, jadi anda pergi. Lain kali anda mempunyai sejumlah besar data untuk dianalisis, lihat menggunakan Azure Machine Learning, Add-in percuma untuk Excel 2013. Terima kasih kerana berhenti, kami akan berjumpa anda di lain waktu untuk mendapatkan siaran lain dari.

Muat turun fail

Muat turun fail sampel di sini: Podcast2062.xlsm

Artikel menarik...