【導(dǎo)讀】平常為大家推薦的資源中,以英語(yǔ)語(yǔ)言占據(jù)大多數(shù)。今天 特別要為大家推薦兩個(gè)跟中文相關(guān)的資源工具。先簡(jiǎn)單介紹下這兩個(gè)資源工具都是什么。第一個(gè),漢字轉(zhuǎn)拼音的工具——即將中文字符轉(zhuǎn)換成它的拼音。除了支持 JavaScript,還可以支持 Python、Go、Rust 等多種語(yǔ)言。可以說(shuō)是非常 nice 的一個(gè)中文資源工具了。第二個(gè)是新華字典的 API,收錄包括 14032 條歇后語(yǔ),16142 個(gè)漢字,264434 個(gè)詞語(yǔ),31648 個(gè)成語(yǔ)。有需要的同學(xué)可以收藏留著用,覺(jué)得不錯(cuò)記得分享點(diǎn)贊。
漢字轉(zhuǎn)拼音工具
▌功能
將中文字符轉(zhuǎn)換為拼音??捎糜跐h字注音、排序、檢索任務(wù)。
▌特性
根據(jù)詞組智能匹配最正確的拼音。
支持多音字。
簡(jiǎn)單的繁體支持, 注音支持。
支持多種不同拼音/注音風(fēng)格。
▌支持版本
1.Node.js/JavaScript 版
注:這個(gè)版本同時(shí)支持在 Node 和 Web 瀏覽器環(huán)境運(yùn)行;
作者:hotoo;來(lái)源:GitHub
https://github.com/hotoo/pinyin
2.Python 版
作者:mozillazg;來(lái)源:GitHub
https://github.com/mozillazg/python-pinyin
3.Go 版
作者:mozillazg;來(lái)源:GitHub
https://github.com/mozillazg/go-pinyin
4.Rust 版
作者:mozillazg;來(lái)源:GitHub
https://github.com/mozillazg/rust-pinyin
▌一些注意事項(xiàng)
1.為什么沒(méi)有 y, w, yu 幾個(gè)聲母?
1>>>frompypinyinimportStyle,pinyin2>>>pinyin('下雨天',style=Style.INITIALS)3[['x'],[''],['t']]
因?yàn)楦鶕?jù)《漢語(yǔ)拼音方案》, y,w,ü (yu) 都不是聲母。
聲母風(fēng)格(INITIALS)下,“雨”、“我”、“圓”等漢字返回空字符串,因?yàn)楦鶕?jù)《漢語(yǔ)拼音方案》, y,w,ü (yu) 都不是聲母,在某些特定韻母無(wú)聲母時(shí),才加上 y 或 w,而 ü 也有其特定規(guī)則。 —— @hotoo
如果你覺(jué)得這個(gè)給你帶來(lái)了麻煩,那么也請(qǐng)小心一些無(wú)聲母的漢字(如“啊”、“餓”、“按”、“昂”等)。 這時(shí)候你也許需要的是首字母風(fēng)格(FIRST_LETTER)。 —— @hotoo
參考:
hotoo/pinyin#57,#22,#27,#44
如果覺(jué)得這個(gè)行為不是你想要的,就是想把 y 當(dāng)成聲母的話,可以指定strict=False, 這個(gè)可能會(huì)符合你的預(yù)期,詳見(jiàn)strict 參數(shù)的影響
1>>>frompypinyinimportStyle,pinyin2>>>pinyin('下雨天',style=Style.INITIALS)3[['x'],[''],['t']]4>>>pinyin('下雨天',style=Style.INITIALS,strict=False)5[['x'],['y'],['t']]
2.拼音數(shù)據(jù)
單個(gè)漢字的拼音使用pinyin-data的數(shù)據(jù)
詞組的拼音使用phrase-pinyin-data的數(shù)據(jù)
3.node 版和 web 版有什么異同?
pinyin目前可以同時(shí)運(yùn)行在 Node 服務(wù)器端和 Web 瀏覽器端。 API 和使用方式完成一致。但 Web 版較 Node 版稍簡(jiǎn)單,拼音庫(kù)只有常用字部分,沒(méi)有使用分詞算法, 并且考慮了網(wǎng)絡(luò)傳輸對(duì)詞庫(kù)進(jìn)行了壓縮處理。
由于分詞和繁體中文的特性,部分情況下的結(jié)果也不盡相同。由于這些區(qū)別,測(cè)試不同運(yùn)行環(huán)境的用例也不盡相同。
更多詳細(xì)安裝與使用教程可訪問(wèn) GitHub 鏈接進(jìn)行訪問(wèn)~
各版本 GitHub 地址:
https://github.com/hotoo/pinyin
https://github.com/mozillazg/python-pinyin
https://github.com/mozillazg/go-pinyin
https://github.com/mozillazg/rust-pinyin
新華字典 API
▌介紹
作者本來(lái)的目的是想可以實(shí)現(xiàn)成語(yǔ)接龍,苦于沒(méi)有現(xiàn)成可用的數(shù)據(jù)庫(kù),自己就從各個(gè)網(wǎng)站抓取整理了一份。所有的數(shù)據(jù)都作者從網(wǎng)上找的。放在 Github 是為了方便自己的使用,同時(shí)也能方便有類似需求的人不用去做這些 trival 的工作。所有抓取數(shù)據(jù)的腳本都在倉(cāng)庫(kù)里。
中華新華字典數(shù)據(jù)庫(kù)和 API 。收錄包括 14032 條歇后語(yǔ),16142 個(gè)漢字,264434 個(gè)詞語(yǔ),31648 個(gè)成語(yǔ)。所有的數(shù)據(jù)放在 data/ 目錄。
▌數(shù)據(jù)庫(kù)與 API 介紹
1.成語(yǔ)(idiom.json)
2.詞語(yǔ)(ci.json)
3.漢字(word.json)
4.歇后語(yǔ)(xiehouyu.json)
-
網(wǎng)絡(luò)傳輸
+關(guān)注
關(guān)注
0文章
143瀏覽量
18012 -
python
+關(guān)注
關(guān)注
56文章
4827瀏覽量
86830
原文標(biāo)題:漢語(yǔ)轉(zhuǎn)拼音工具、新華字典API——兩個(gè)支持Python的中文資源
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
兩個(gè)MOS管串聯(lián)接法的應(yīng)用

控件中出現(xiàn)的中文如何變?yōu)橛⑽??例如visa資源名稱下拉里的刷新兩個(gè)字,去掉也行。
ML之MLiR:輸入兩個(gè)向量,得出兩個(gè)向量之間的相關(guān)度
有什么方法能夠在lineout跟headphone兩個(gè)輸出通道實(shí)現(xiàn)不同信號(hào)的輸出?
最全面的PCB設(shè)計(jì)工具資源匯總
兩個(gè)阻抗的并聯(lián)和復(fù)數(shù)的化簡(jiǎn)
合并兩個(gè)排序的鏈表
兩個(gè)設(shè)計(jì)要點(diǎn)+三個(gè)技術(shù)資源:加速度傳感器應(yīng)用必讀!
一個(gè)電路有兩個(gè)電源如何分析

兩個(gè)網(wǎng)絡(luò)相關(guān)的開(kāi)源項(xiàng)目詳解

分享兩個(gè)一鍵啟停電路
兩個(gè)LED和兩個(gè)按鈕的使用

關(guān)于兩個(gè)Python開(kāi)源識(shí)別工具的效果

評(píng)論