在線詞頻統(tǒng)計工具
詞頻統(tǒng)計的意義
詞頻統(tǒng)計分析:是文本挖掘的重要方法,通過關(guān)鍵詞出現(xiàn)頻次多少的變化,來確定熱點及其變化趨勢
不管你是在工作還是生活中,都會有詞頻統(tǒng)計的需求
比如:我最近迷上了周杰倫的歌,我想分析周杰倫的歌曲的高頻詞
比如:我要做關(guān)于淘寶國產(chǎn)手機評論分析,了解下大家都主要說了哪些總要的信息,并幫助商家如何提升產(chǎn)品質(zhì)量和業(yè)績
比如:我在政府機構(gòu)上班,需要對每次行業(yè)報告做詞頻挖掘分析,了解本次報告重點出現(xiàn)的關(guān)鍵詞與以往的報告做對比
甚至不少大學(xué)生也會應(yīng)用到詞頻統(tǒng)計工具,幫助他寫論文報告、幫助他快速了解一本書的中心思想等等
此處使用一款國內(nèi)非常良心的詞頻統(tǒng)計分析工具“微詞云.強大的文字云藝術(shù)生成器”,你不需要懂任何代碼程序,只要把文本內(nèi)容復(fù)制導(dǎo)入到“ 微詞云”中就可以完成詞頻統(tǒng)計了。
微詞云詞頻統(tǒng)計功能特點
- 支持千萬大文本分詞量:最高上傳文本量20M
- 自定義詞典功能:關(guān)心詞一個都不拉,分析更精準
- 提供多緯度篩詞:過濾未知詞、單個詞、詞頻為1的詞、根據(jù)不同詞性進行過濾詞
- 詞頻統(tǒng)計下載:支持下載全部的分詞詞頻統(tǒng)計結(jié)果
- 支持詞云圖可視化:可以在這里做出非常漂亮的詞云圖哦
詞頻統(tǒng)計分析案例
我以384首的周杰倫歌詞析案例進行分享微詞云如何實現(xiàn)詞頻統(tǒng)計的
先進入微詞云(weiciyun.com)的首頁:點擊【創(chuàng)建詞云】
tep1: 點擊【導(dǎo)入單詞】,把文本輸入到【分詞篩詞后導(dǎo)入】中
把周杰倫的歌詞文本復(fù)制粘貼到文本框中,點擊【開始分詞】
tep2: 進入到詞性篩詞界面,先通過【詞性】進行篩選不需要的詞(不需要的詞,就取消勾選就可以了)
篩選完詞后,點擊右下角的【確定使用所選單詞】以上就完成了基本的文本分詞詞頻統(tǒng)計的功能
詞頻中的高級功能
自定義詞典: 希望分詞更精準(例如手感好,系統(tǒng)被分成“手感和好”了)建議在分詞頁使用【自定義詞典】功能;把不想被分開的關(guān)鍵詞輸入到自定義詞典中就可以了;使用自定義詞典功能
位置:自定義詞典功能:在單詞導(dǎo)入的右上角上
詞頻top20
我們來看下周杰倫歌詞的top前20詞頻可視化
詞頻top10
通過詞頻可視化可以看出,周杰倫的哥很悲傷,“回憶”“離開”充滿著孤單的情感。主要偏愛情的歌曲比較多
重點功能:保存草稿
詞頻可視化python顏色組
可以根據(jù)篩詞后的數(shù)據(jù)做出不同形狀的詞頻可視化詞云圖,微詞云還支持”python“顏色模版哦
在配置中的顏色組中可以找到
情感詞展示
對文本的關(guān)鍵詞進行細致分析,例如周杰倫歌詞中的情感詞,可以手動返回到到篩詞頁進行在次篩詞下
點擊【單詞導(dǎo)入】即可進入到篩詞頁
周杰倫的情感中,被“愛情,媽媽,眼淚,安靜和思念”籠罩著,情感比較豐富
結(jié)尾
未來微詞云還會繼續(xù)優(yōu)化更多的數(shù)據(jù)分析功能。以上也我也只是用到其中的一部分功能而已,希望對大家做數(shù)據(jù)分析有幫助。