二維碼
        企資網

        掃一掃關注

        當前位置: 首頁 » 企業資訊 » 熱點 » 正文

        盤點一個英文文本中統計關鍵詞的方法

        放大字體  縮小字體 發布日期:2022-12-07 18:08:24    作者:微生翼虎    瀏覽次數:76
        導讀

        大家好,我是皮皮。一、前言前幾天在Python最強王者交流群【Wendy Zheng】問了一個英文文本中統計關鍵詞得問題,這里拿出來給大家分享下。二、實現過程針對這個問題,感謝給出一個思路方法,也許有幫助,首先我們需

        大家好,我是皮皮。

        一、前言

        前幾天在Python最強王者交流群【Wendy Zheng】問了一個英文文本中統計關鍵詞得問題,這里拿出來給大家分享下。

        二、實現過程

        針對這個問題,感謝給出一個思路方法,也許有幫助,首先我們需要將Excel中得文本進行導入到一個文感謝件中去,代碼如下:

        # coding: utf-8import pandas as pddf = pd.read_excel('./文本.xlsx')# print(df.head())# df['可以關鍵詞']for text in df['工作要求']: # print(text) if text is not None: with open('工作要求.txt', mode='a', encoding='utf-8') as file: file.write(str(text))print('寫入完成')

        接下來就可以針對這個文感謝件進行相關得詞頻統計了,如果你有自己自定義得關鍵詞,也可以就著關鍵詞去統計,沒有得話,就自己在關鍵詞范圍內,任意取多少個關鍵詞都可以,相關得代碼如下所示:

        from collections import Counterimport pandas as pddf = pd.read_excel('./文本.xlsx')# print(df.head())words = []with open('工作要求.txt', 'r', encoding='utf-8') as f: line = f.readlines() for word in line[0].split(' '): words.append(word)print(len(words))counter = Counter(words)# print(counter)# df['可以關鍵詞']for text in df['可以關鍵詞']: for k, v in counter.items(): if k == text: print(k, v)

        這個代碼對于英文文本還是適用得,不過有個小問題,如下。

        最后這里也給出中文分詞得代碼和可視化代碼,兩者結合在一起得,感興趣得小伙伴們可以試試看。

        from collections import Counter # 統計詞頻from pyecharts.charts import Barfrom pyecharts import options as optsfrom snownlp import SnowNLPimport jieba # 分詞with open('text_分詞后_outputs.txt', 'r',encoding='utf-8') as f: read = f.read()with open('stop_word.txt', 'r', encoding='utf-8') as f: stop_word = f.read()word = jieba.cut(read)words = []for i in list(word): if i not in stop_word: words.append(i)columns = []data = []for k, v in dict(Counter(words).most_common(10)).items(): columns.append(k) data.append(v)bar = ( Bar() .add_xaxis(columns) .add_yaxis("詞頻", data) .set_global_opts(title_opts=opts.TitleOpts(title="詞頻top10")) )bar.render("詞頻.html")三、總結

        大家好,我是皮皮。這篇文章主要盤點了一個英文文本中統計關鍵詞方法處理得問題,文中針對該問題,給出了具體得解析和代碼實現,幫助粉絲順利解決了問題。

        最后感謝粉絲【Wendy Zheng】提問,感謝【Python進階者】給出得思路和代碼解析,感謝【Python狗】等人參與學習交流。

         
        (文/微生翼虎)
        免責聲明
        本文僅代表作發布者:微生翼虎個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們刪除處理郵件:weilaitui@qq.com。
         

        Copyright ? 2016 - 2025 - 企資網 48903.COM All Rights Reserved 粵公網安備 44030702000589號

        粵ICP備16078936號

        微信

        關注
        微信

        微信二維碼

        WAP二維碼

        客服

        聯系
        客服

        聯系客服:

        在線QQ: 303377504

        客服電話: 020-82301567

        E_mail郵箱: weilaitui@qq.com

        微信公眾號: weishitui

        客服001 客服002 客服003

        工作時間:

        周一至周五: 09:00 - 18:00

        反饋

        用戶
        反饋

        主站蜘蛛池模板: 在线精品亚洲一区二区三区| 伊人久久精品无码麻豆一区| 国产乱码一区二区三区四| 亚洲日韩一区二区一无码| 亚洲线精品一区二区三区影音先锋| 中文字幕日韩欧美一区二区三区| 免费无码一区二区三区蜜桃| 亚洲av无码天堂一区二区三区| 国模无码一区二区三区| 精品人妻AV一区二区三区| 一区二区三区国产| 中文字幕在线一区二区三区| 日韩一区二区三区射精| 激情内射亚洲一区二区三区| 成人精品视频一区二区三区不卡 | 亚洲一区二区三区久久| 国产在线精品一区二区三区直播 | 国产香蕉一区二区三区在线视频 | 日韩中文字幕一区| 国产成人精品一区二区三区免费| 国产情侣一区二区三区| 无码日韩精品一区二区人妻| 精品无码中出一区二区| 国产在线观看一区二区三区| 成人免费视频一区二区三区| 无码人妻精品一区二区三区99性| 亚洲成AV人片一区二区密柚| 夜夜添无码一区二区三区| 国产在线无码一区二区三区视频| 国产一区三区二区中文在线 | 亚洲福利视频一区| 日韩国产精品无码一区二区三区| 亚洲夜夜欢A∨一区二区三区| 无码一区二区三区免费| 78成人精品电影在线播放日韩精品电影一区亚洲 | 亚洲欧美日韩一区二区三区在线| 亚洲国产成人精品无码一区二区| 无码少妇A片一区二区三区| 日本高清天码一区在线播放| 国产乱码精品一区三上 | 另类国产精品一区二区|