二維碼
        企資網(wǎng)

        掃一掃關(guān)注

        當(dāng)前位置: 首頁 » 企資快訊 » 匯總 » 正文

        語音識別工具_(dá)Constme_Whisper軟

        放大字體  縮小字體 發(fā)布日期:2023-03-20 21:40:00    作者:百里海疋    瀏覽次數(shù):74
        導(dǎo)讀

        在隔壁小眾軟件看到了一款有意思的工具-“Const-me/Whisper”。原版Whisper是OpenAI做的一個神經(jīng)網(wǎng)絡(luò)模型,它可以在本地實時語音轉(zhuǎn)文字,用來翻譯和做字幕等等,而Const-me的版本將Whisper做成了Windows的版本,還添

        在隔壁小眾軟件看到了一款有意思的工具-“Const-me/Whisper”。

        原版Whisper是OpenAI做的一個神經(jīng)網(wǎng)絡(luò)模型,它可以在本地實時語音轉(zhuǎn)文字,用來翻譯和做字幕等等,而Const-me的版本將Whisper做成了Windows的版本,還添加了GPU加速。

        在官方的GitHub頁面上,可以看到這個工具還有不少特點,比如說項目采用純C++實現(xiàn),除了系統(tǒng)基本組件沒有運行依賴、內(nèi)存占用低、支持大多數(shù)音頻和視頻格式、支持大多數(shù)音頻捕獲設(shè)備、比OpenAI的實現(xiàn)還快。

        主要的使用限制是系統(tǒng)版本,Windows 8.1以下和32位的系統(tǒng)是用不了的。

        軟件的使用很簡單,一個用于啟動的界面環(huán)境,解壓出來1MB不到,一個用于識別的語言模型,模型有多個版本,想要正常使用得用1G以上的模型,下載文件之后,直接運行啟動器即可。

        打開之后就能看見這樸實無華的界面,軟件沒有幾個按鈕,雖然是英文的,但是模型路徑和高級設(shè)置一看就明白。

        在高級設(shè)置里面可以設(shè)置要調(diào)用的GPU,這個保持默認(rèn)就行。

        之后就能看到軟件的主界面了,點開選擇語言,可以看到支持的語言還是挺多的,這里就先來試試中文。

        在測試的時候發(fā)現(xiàn)用1.42GB的模型,默認(rèn)出來的是繁體,用2.88GB模型出來的是簡體,這個也可能是系統(tǒng)環(huán)境的原因,大家可以自己測試一下。

        測試用的顯卡是GTX1660,轉(zhuǎn)換速度在可接受范圍之內(nèi),上面這種簡短的句子,用大的識別模型,在某些簡單的語境條件下,以及加上最重要的因素——運氣好的話,竟然有100%的準(zhǔn)確度。

        除了音頻文件,直接放視頻也是可以的,但是只要涉及的內(nèi)容一廣,這個在本地運行的缺點就暴露出來了,生成的文本一言難盡,在有數(shù)字的時候會自己轉(zhuǎn)換成阿拉伯?dāng)?shù)字,有英文混雜的時候也會自己嘗試首字母大寫,但是在轉(zhuǎn)換效果上,一眼望過去有不少同音字錯誤,對于中文的前后文聯(lián)想能力比較差。

        支持實時錄制音頻。

        這個比Windows自帶的語言輸入效果要好一點,同樣的音頻速度,這個工具不會出現(xiàn)丟字的情況。

        官方給出的Whisper識別能力圖如下,主要還是用來識別英文。

        其他功能上,可以添加時間標(biāo)記和直接翻譯成英文。

        想要控制具體的參數(shù),也可以使用控制臺的版本,還會展示對應(yīng)數(shù)值的置信度。

        輸出中文的話會出現(xiàn)一堆問號,這個不是控制臺的編碼顯示問題,但是在輸入轉(zhuǎn)換指令后,在對應(yīng)路徑下面的文本生成是沒有問題的。

        有了這個,就可以配合像是Quicker一類的快捷工具,做到本地一鍵轉(zhuǎn)換成文本了。

        比較遺憾的是,這個小工具目前只支持將轉(zhuǎn)換的音頻轉(zhuǎn)換為英文,要是未來可以轉(zhuǎn)換成任意語言的話,那可玩性就很高了。

         
        (文/百里海疋)
        免責(zé)聲明
        本文僅代表作發(fā)布者:百里海疋個人觀點,本站未對其內(nèi)容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問題,請及時聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
         

        Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號

        粵ICP備16078936號

        微信

        關(guān)注
        微信

        微信二維碼

        WAP二維碼

        客服

        聯(lián)系
        客服

        聯(lián)系客服:

        在線QQ: 303377504

        客服電話: 020-82301567

        E_mail郵箱: weilaitui@qq.com

        微信公眾號: weishitui

        客服001 客服002 客服003

        工作時間:

        周一至周五: 09:00 - 18:00

        反饋

        用戶
        反饋

        主站蜘蛛池模板: 91一区二区三区| 性色AV一区二区三区无码| 美女福利视频一区二区| 亚洲色一区二区三区四区| 精品国产亚洲一区二区在线观看 | 国产精品一区二区四区| 在线观看一区二区三区视频 | 精品一区二区三区自拍图片区 | 精品久久国产一区二区三区香蕉| 一区二区三区免费视频播放器| 人妻无码一区二区三区| 欧美日韩一区二区成人午夜电影 | 一区二区三区在线免费观看视频| 人妻无码久久一区二区三区免费| 亚洲AV无码一区二区三区国产| 国产成人一区二区动漫精品| 日本一区二区三区免费高清| 蜜桃无码一区二区三区| 中文字幕一区在线观看| 亚洲一区视频在线播放| 一区二区三区高清在线| asmr国产一区在线| 亚洲日本一区二区一本一道| 北岛玲在线一区二区| 国产一区二区三区免费看| 国产精品成人一区二区三区| 国产精品视频免费一区二区三区| 波多野结衣在线观看一区二区三区| 爆乳无码AV一区二区三区 | 久久久久人妻精品一区| 国产精品免费一区二区三区四区| 精品一区二区久久| 日韩国产精品无码一区二区三区| 久久国产一区二区三区| 亚洲一区动漫卡通在线播放| 国产99久久精品一区二区| 成人在线观看一区| 偷拍精品视频一区二区三区| 精品成人av一区二区三区| 无码精品人妻一区二区三区免费看| 国精无码欧精品亚洲一区|