99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

兩個(gè)跟中文相關(guān)的資源工具介紹

電子工程師 ? 來(lái)源:未知 ? 作者:李倩 ? 2018-09-17 09:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【導(dǎo)讀】平常為大家推薦的資源中,以英語(yǔ)語(yǔ)言占據(jù)大多數(shù)。今天 特別要為大家推薦兩個(gè)跟中文相關(guān)的資源工具。先簡(jiǎn)單介紹下這兩個(gè)資源工具都是什么。第一個(gè),漢字轉(zhuǎn)拼音的工具——即將中文字符轉(zhuǎn)換成它的拼音。除了支持 JavaScript,還可以支持 Python、Go、Rust 等多種語(yǔ)言。可以說(shuō)是非常 nice 的一個(gè)中文資源工具了。第二個(gè)是新華字典的 API,收錄包括 14032 條歇后語(yǔ),16142 個(gè)漢字,264434 個(gè)詞語(yǔ),31648 個(gè)成語(yǔ)。有需要的同學(xué)可以收藏留著用,覺(jué)得不錯(cuò)記得分享點(diǎn)贊。

漢字轉(zhuǎn)拼音工具

▌功能

將中文字符轉(zhuǎn)換為拼音??捎糜跐h字注音、排序、檢索任務(wù)。

▌特性

根據(jù)詞組智能匹配最正確的拼音。

支持多音字。

簡(jiǎn)單的繁體支持, 注音支持。

支持多種不同拼音/注音風(fēng)格。

▌支持版本

1.Node.js/JavaScript 版

注:這個(gè)版本同時(shí)支持在 Node 和 Web 瀏覽器環(huán)境運(yùn)行;

作者:hotoo;來(lái)源:GitHub

https://github.com/hotoo/pinyin

2.Python 版

作者:mozillazg;來(lái)源:GitHub

https://github.com/mozillazg/python-pinyin

3.Go 版

作者:mozillazg;來(lái)源:GitHub

https://github.com/mozillazg/go-pinyin

4.Rust 版

作者:mozillazg;來(lái)源:GitHub

https://github.com/mozillazg/rust-pinyin

▌一些注意事項(xiàng)

1.為什么沒(méi)有 y, w, yu 幾個(gè)聲母?

1>>>frompypinyinimportStyle,pinyin2>>>pinyin('下雨天',style=Style.INITIALS)3[['x'],[''],['t']]

因?yàn)楦鶕?jù)《漢語(yǔ)拼音方案》, y,w,ü (yu) 都不是聲母。

聲母風(fēng)格(INITIALS)下,“雨”、“我”、“圓”等漢字返回空字符串,因?yàn)楦鶕?jù)《漢語(yǔ)拼音方案》, y,w,ü (yu) 都不是聲母,在某些特定韻母無(wú)聲母時(shí),才加上 y 或 w,而 ü 也有其特定規(guī)則。 —— @hotoo

如果你覺(jué)得這個(gè)給你帶來(lái)了麻煩,那么也請(qǐng)小心一些無(wú)聲母的漢字(如“啊”、“餓”、“按”、“昂”等)。 這時(shí)候你也許需要的是首字母風(fēng)格(FIRST_LETTER)。 —— @hotoo

參考:

hotoo/pinyin#57,#22,#27,#44

如果覺(jué)得這個(gè)行為不是你想要的,就是想把 y 當(dāng)成聲母的話,可以指定strict=False, 這個(gè)可能會(huì)符合你的預(yù)期,詳見(jiàn)strict 參數(shù)的影響

1>>>frompypinyinimportStyle,pinyin2>>>pinyin('下雨天',style=Style.INITIALS)3[['x'],[''],['t']]4>>>pinyin('下雨天',style=Style.INITIALS,strict=False)5[['x'],['y'],['t']]

2.拼音數(shù)據(jù)

單個(gè)漢字的拼音使用pinyin-data的數(shù)據(jù)

詞組的拼音使用phrase-pinyin-data的數(shù)據(jù)

3.node 版和 web 版有什么異同?

pinyin目前可以同時(shí)運(yùn)行在 Node 服務(wù)器端和 Web 瀏覽器端。 API 和使用方式完成一致。但 Web 版較 Node 版稍簡(jiǎn)單,拼音庫(kù)只有常用字部分,沒(méi)有使用分詞算法, 并且考慮了網(wǎng)絡(luò)傳輸對(duì)詞庫(kù)進(jìn)行了壓縮處理。

由于分詞和繁體中文的特性,部分情況下的結(jié)果也不盡相同。由于這些區(qū)別,測(cè)試不同運(yùn)行環(huán)境的用例也不盡相同。

更多詳細(xì)安裝與使用教程可訪問(wèn) GitHub 鏈接進(jìn)行訪問(wèn)~

各版本 GitHub 地址:

https://github.com/hotoo/pinyin

https://github.com/mozillazg/python-pinyin

https://github.com/mozillazg/go-pinyin

https://github.com/mozillazg/rust-pinyin

新華字典 API

▌介紹

作者本來(lái)的目的是想可以實(shí)現(xiàn)成語(yǔ)接龍,苦于沒(méi)有現(xiàn)成可用的數(shù)據(jù)庫(kù),自己就從各個(gè)網(wǎng)站抓取整理了一份。所有的數(shù)據(jù)都作者從網(wǎng)上找的。放在 Github 是為了方便自己的使用,同時(shí)也能方便有類似需求的人不用去做這些 trival 的工作。所有抓取數(shù)據(jù)的腳本都在倉(cāng)庫(kù)里。

中華新華字典數(shù)據(jù)庫(kù)和 API 。收錄包括 14032 條歇后語(yǔ),16142 個(gè)漢字,264434 個(gè)詞語(yǔ),31648 個(gè)成語(yǔ)。所有的數(shù)據(jù)放在 data/ 目錄。

▌數(shù)據(jù)庫(kù)與 API 介紹

1.成語(yǔ)(idiom.json)

2.詞語(yǔ)(ci.json)

3.漢字(word.json)

4.歇后語(yǔ)(xiehouyu.json)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 網(wǎng)絡(luò)傳輸
    +關(guān)注

    關(guān)注

    0

    文章

    143

    瀏覽量

    18012
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86830

原文標(biāo)題:漢語(yǔ)轉(zhuǎn)拼音工具、新華字典API——兩個(gè)支持Python的中文資源

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    兩個(gè)MOS管串聯(lián)接法的應(yīng)用

    本文是關(guān)于兩個(gè)MOS 管串聯(lián)組成反向電流阻斷電路的介紹。
    發(fā)表于 07-19 15:46 ?3.8w次閱讀
    <b class='flag-5'>兩個(gè)</b>MOS管串聯(lián)接法的應(yīng)用

    控件中出現(xiàn)的中文如何變?yōu)橛⑽??例如visa資源名稱下拉里的刷新兩個(gè)字,去掉也行。

    本帖最后由 jiutianshenjian 于 2017-7-20 15:52 編輯 visa資源名稱下拉里的刷新兩個(gè)字,去掉也行。不能顯示中文,我labview2013中文版的
    發(fā)表于 07-20 15:24

    ML之MLiR:輸入兩個(gè)向量,得出兩個(gè)向量之間的相關(guān)

    ML之MLiR:輸入兩個(gè)向量,得出兩個(gè)向量之間的相關(guān)
    發(fā)表于 12-24 11:54

    有什么方法能夠在lineoutheadphone兩個(gè)輸出通道實(shí)現(xiàn)不同信號(hào)的輸出?

    我現(xiàn)在需要輸出兩個(gè)不同的信號(hào),我一直用aic23的命令:while (!DSK6713_AIC23_write(hCodec, x[sample])) 來(lái)實(shí)現(xiàn)輸出,不過(guò)lineout
    發(fā)表于 08-15 10:16

    最全面的PCB設(shè)計(jì)工具資源匯總

    主流的PCB設(shè)計(jì)工具Altium Designer:國(guó)內(nèi)外最普及的PCB設(shè)計(jì)工具,設(shè)計(jì)資源豐富,社區(qū)完善,目前已經(jīng)更新到了AD19,并提供一個(gè)月的免費(fèi)試用,目前僅提供Windows版本
    發(fā)表于 08-29 17:58

    兩個(gè)阻抗的并聯(lián)和復(fù)數(shù)的化簡(jiǎn)

    這是本人自己編寫的常用軟件工具,兩個(gè)阻抗并聯(lián)的阻抗值和阻抗角計(jì)算及復(fù)數(shù)的化簡(jiǎn),希望可以幫到大家。
    發(fā)表于 04-06 11:13 ?27次下載

    合并兩個(gè)排序的鏈表

    合并兩個(gè)排序的鏈表一、題目要求 輸入兩個(gè)單調(diào)遞增的鏈表,輸出兩個(gè)鏈表合成后的鏈表,當(dāng)然我們需要合成后的鏈表滿足單調(diào)不減規(guī)則。 二、我的思路 1、比較兩個(gè)鏈表的頭結(jié)點(diǎn)大小,哪個(gè)小就將其作
    發(fā)表于 01-16 22:02 ?647次閱讀

    兩個(gè)設(shè)計(jì)要點(diǎn)+三個(gè)技術(shù)資源:加速度傳感器應(yīng)用必讀!

    兩個(gè)設(shè)計(jì)要點(diǎn)+三個(gè)技術(shù)資源:加速度傳感器應(yīng)用必讀!
    的頭像 發(fā)表于 07-02 11:40 ?2890次閱讀

    個(gè)電路有兩個(gè)電源如何分析

    兩個(gè)電源共用同一個(gè)參考點(diǎn)(地),所以每個(gè)電源流出的電流一樣用這個(gè)參考點(diǎn)回路,又每個(gè)電源流出的電流每個(gè)電阻上的電流都有一定的關(guān)系。
    發(fā)表于 12-20 09:28 ?4.9w次閱讀
    一<b class='flag-5'>個(gè)</b>電路有<b class='flag-5'>兩個(gè)</b>電源如何分析

    兩個(gè)網(wǎng)絡(luò)相關(guān)的開(kāi)源項(xiàng)目詳解

    今天介紹兩個(gè)(only two)網(wǎng)絡(luò)相關(guān)的開(kāi)源項(xiàng)目。 Alex的verilog-ethernet之前在介紹PCIe項(xiàng)目時(shí)有介紹過(guò)Alex的項(xiàng)
    的頭像 發(fā)表于 10-27 09:20 ?3210次閱讀
    <b class='flag-5'>兩個(gè)</b>網(wǎng)絡(luò)<b class='flag-5'>相關(guān)</b>的開(kāi)源項(xiàng)目詳解

    分享兩個(gè)一鍵啟停電路

    在很多想讓操作簡(jiǎn)單化的項(xiàng)目中,都會(huì)用到一鍵啟停,即通過(guò)一個(gè)按鈕來(lái)實(shí)現(xiàn)設(shè)備的運(yùn)行和停止,今天新手朋友分享兩個(gè)電路。
    的頭像 發(fā)表于 10-10 11:12 ?4050次閱讀

    兩個(gè)LED和兩個(gè)按鈕的使用

    電子發(fā)燒友網(wǎng)站提供《兩個(gè)LED和兩個(gè)按鈕的使用.zip》資料免費(fèi)下載
    發(fā)表于 01-30 16:04 ?1次下載
    <b class='flag-5'>兩個(gè)</b>LED和<b class='flag-5'>兩個(gè)</b>按鈕的使用

    關(guān)于兩個(gè)Python開(kāi)源識(shí)別工具的效果

    回復(fù)希望出一篇 OCR 相關(guān)的文章,今天嘗試了一下 cnocr 和 tesseract 兩個(gè) Python 開(kāi)源識(shí)別工具的效果,給大家分別講講兩個(gè)
    的頭像 發(fā)表于 10-17 11:36 ?1171次閱讀
    關(guān)于<b class='flag-5'>兩個(gè)</b>Python開(kāi)源識(shí)別<b class='flag-5'>工具</b>的效果

    兩個(gè)硬盤2個(gè)系統(tǒng)開(kāi)機(jī)切換

    切換兩個(gè)硬盤上的系統(tǒng)是一種常見(jiàn)的行為,可以讓用戶在不同的操作系統(tǒng)之間進(jìn)行切換,以滿足不同的需求。在本文中,我們將詳細(xì)介紹如何配置和使用兩個(gè)硬盤上的系統(tǒng)進(jìn)行切換。本文將分為以下幾個(gè)部分進(jìn)行討論:硬件
    的頭像 發(fā)表于 11-28 15:08 ?9888次閱讀

    arcgis中如何關(guān)聯(lián)兩個(gè)屬性表

    在ArcGIS中,關(guān)聯(lián)兩個(gè)屬性表是一個(gè)重要的操作,可以通過(guò)此操作將兩個(gè)表中的數(shù)據(jù)關(guān)聯(lián)起來(lái),以便進(jìn)行分析和查詢。下面是詳細(xì)介紹如何在ArcGIS中實(shí)現(xiàn)屬性表的關(guān)聯(lián)。 首先,我們需要明確
    的頭像 發(fā)表于 02-25 11:01 ?5790次閱讀