99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

知存科技致力于開發(fā)的基于NOR Flash的存算一體化人工智能芯片

uGUA_ARMacceler ? 來源:未知 ? 作者:李倩 ? 2018-07-04 16:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

知存科技致力于開發(fā)的基于NOR Flash的存算一體化人工智能芯片,其芯片特點是能耗低、運算效率高、速度快和成本低,適用于終端設(shè)備的人工智能應(yīng)用。

知存科技演講實錄

知存科技是一家剛剛成立半年的公司,今年3月份正式運營,專注于開發(fā)低功耗低成本的存算一體AI芯片。

人工智能目前還處于發(fā)展階段,當前的落地的應(yīng)用場景較少,沒有達到社會的期望。隨著人工智能算法的進步以及芯片算力的提升,未來人工智能將會出現(xiàn)一個更大的爆發(fā)點,會涌現(xiàn)更多的應(yīng)用落地。

人工智能芯片作為人工智能的載體,被大家寄予厚望,在2020年,人工智能芯片市場預(yù)計達到千億量級。傳統(tǒng)芯片巨頭比如arm、Intel、NVIDIA都通過自研和收購?fù)瞥隽藬?shù)款芯片,互聯(lián)網(wǎng)巨頭比如Google、亞馬遜和微軟等也都正推出和開發(fā)的人工智能芯片。這個領(lǐng)域的創(chuàng)業(yè)公司就更多了,中國的幾家頭部公司就做得非常好。

人工智能依賴的算法有幾大特點:這是一個很龐大和復(fù)雜的網(wǎng)絡(luò),有很多參數(shù)要存儲,也需要完成大量的計算,這些計算當中又會產(chǎn)生大量數(shù)據(jù)。為了完成大量計算的過程當中,一般芯片的設(shè)計思路是將大量增加并行的運算單元,比如上千個卷積單元,需要調(diào)用的存儲資源也在增大,然而存儲資源一直是有限的。隨著運算單元的增加,每個運算單元能夠使用的存儲器的帶寬和大小在逐漸減小,存儲器是人工智能芯片的瓶頸。

在很多人工智能推理運算中,90%以上的運算資源都消耗在數(shù)據(jù)搬運的過程。芯片內(nèi)部到外部的帶寬以及片上緩存空間限制了運算的效率?,F(xiàn)在工業(yè)界和學(xué)術(shù)界很多人都認為存算一體化是未來的趨勢。

存算一體化分為幾種:DRAM和SSD中植入計算芯片或者邏輯計算單元,可以被叫做存內(nèi)處理或者近數(shù)據(jù)計算,這種方式非常適合云端的大數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)訓(xùn)練等應(yīng)用;另一種就是存儲和計算完全結(jié)合在一起,使用存儲的器件單元直接完成計算,比較適合神經(jīng)網(wǎng)絡(luò)推理類應(yīng)用。我們研發(fā)的是后者這樣的技術(shù),將存儲和計算結(jié)合到閃存單元中的存算一體。閃存技術(shù)已經(jīng)非常成熟,商用幾十年了,成本很低。

當前商用的神經(jīng)網(wǎng)絡(luò)非常龐大,擁有幾百萬到幾千萬的權(quán)重參數(shù),或者推理過程中需要完成幾百萬到上千萬個乘加法運算。傳統(tǒng)的計算系統(tǒng)需要將網(wǎng)絡(luò)權(quán)重參數(shù)存在片外的非易失性存儲器中,比如NAND Flash或者NOR Flash。運算的過程中,需要把部分需要的權(quán)重參數(shù)搬運到DRAM,再把小部分參數(shù)傳入到芯片中的SRAM和eDRAM中,之后導(dǎo)入寄存器和運算單元完成運算。神經(jīng)網(wǎng)絡(luò)運算需要大面積SRAM和eDRAM來減少片內(nèi)外數(shù)據(jù)搬運和提高運算效率,但是由于片上存儲成本的限制,也需要高成本高速度的DRAM來緩存片上無法容納的權(quán)重參數(shù)和臨時數(shù)據(jù)。

我們存算一體化的做法是這樣的:我們的Flash存儲單元本身就可以存儲神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù),同時又可以完成和此權(quán)重相關(guān)的乘加法運算,就是將乘加法運算和存儲全部融合到一個Flash單元里面。舉個例子,只需要100萬個Flash單元,就可以存儲100萬個權(quán)重參數(shù)同時并行完成100萬次乘加法運算。我們做的是這樣一款芯片,深度學(xué)習網(wǎng)絡(luò)被映射到多個Flash陣列,這些Flash陣列不僅存儲和深度學(xué)習網(wǎng)絡(luò)同時完成網(wǎng)絡(luò)的推理,這個過程不需要邏輯計算電路。這種方式的運算效率非常高,成本很低,單個Flash單元能夠完成7、8 bit的乘加法運算。

之前我們說我們芯片有兩個特點:一個是運算效率高,相比于現(xiàn)在基于馮諾依曼架構(gòu)的深度學(xué)習芯片,大概能夠提高運算效率10-50倍;另一個是產(chǎn)品成本低,節(jié)省了DRAM、SRAM、片上并行計算單元的面積消耗,簡化了系統(tǒng)的設(shè)計,同時無需采用先進的芯片加工工藝,可以數(shù)倍地降低生產(chǎn)成本,幾十倍地降低流片和研發(fā)成本。當前階段,我們尋找的是對成本和運算效率(功耗)敏感的應(yīng)用,比如終端的低功耗低成本的語音識別應(yīng)用。未來,隨著人工智能和物聯(lián)網(wǎng)的發(fā)展,我們會拓展更多的應(yīng)用場景,比如說低成本和低功耗的感知應(yīng)用和人機交互。

2014年,我們開始在加州大學(xué)圣芭芭拉分校的實驗室做這項技術(shù)的研發(fā),完成過6次流片和技術(shù)驗證。去年年末在北京注冊的公司,今年3月份正式開始運營,僅僅5個月的時間我們就把設(shè)計送出去流片,順利的話,過3-4個月就會完成芯片測試,爭取明年量產(chǎn)。我們的團隊畢業(yè)于北京大學(xué)、北京航空航天大學(xué)、美國加州大學(xué)洛杉磯分校,加州大學(xué)圣芭芭拉分校等學(xué)校。核心團隊成員大部分都有十年以上的行業(yè)經(jīng)驗,團隊目前有11個人,年末也會擴大團隊規(guī)模。

晶體管電容這些東西怎么在Cell做到Computing?

乘法計算的方式是通過類似模擬電路的電流鏡方式。輸入電流轉(zhuǎn)換成電壓耦合到Flash晶體管的控制柵上,F(xiàn)lash晶體管的輸出電流等于輸入電流和存儲的權(quán)重相乘。加法的計算方式類似于并聯(lián)電路電流求和。

怎么看待Intel新的X Point技術(shù)?

這是一項很新的技術(shù),目前主要問題是成本和系統(tǒng)支持度的問題,但隨著產(chǎn)業(yè)鏈的發(fā)展,成本會越來越低,速度也會更快,系統(tǒng)也會更好的支持X-Point兼有的高速和非易失性的特性。這項技術(shù)的selector做得很好。作為存儲器、內(nèi)存或者他們的統(tǒng)一體這類應(yīng)用來說,未來成本降低之后,會有非常大的優(yōu)勢。Intel在這個技術(shù)的市場推廣上也投入很多精力,其他后來者可能會坐享其成。

北京知存科技有限公司成立于2017年10月,專注于開發(fā)基于存算一體的人工智能芯片和系統(tǒng)。公司通過自主研發(fā)的核心技術(shù)將計算和存儲融合在NOR Flash存儲芯片中,大幅度提高運算的并行讀,提升人工智能核心運算效率多個數(shù)量級。該設(shè)計方法還簡化了芯片設(shè)計架構(gòu),節(jié)省了內(nèi)存、緩存和神將網(wǎng)絡(luò)加速器模塊的支出,顯著地降低了芯片成本。當前公司正在流片的是面向終端設(shè)備的低功耗語音識別芯片。公司將長期致力于深入研發(fā)和優(yōu)化存算一體化技術(shù),將之應(yīng)用于廣闊的人工智能應(yīng)用場景中。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    460

    文章

    52506

    瀏覽量

    440828
  • 存儲器
    +關(guān)注

    關(guān)注

    38

    文章

    7651

    瀏覽量

    167388
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49015

    瀏覽量

    249457
  • 存算一體
    +關(guān)注

    關(guān)注

    0

    文章

    109

    瀏覽量

    4662

原文標題:五期Demo Day路演回顧 | 知存科技:讓AI設(shè)備無所不在

文章出處:【微信號:ARMaccelerator,微信公眾號:安創(chuàng)空間ARMaccelerator】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    緩解高性能一體芯片IR-drop問題的軟硬件協(xié)同設(shè)計

    在高性能計算與AI芯片領(lǐng)域,基于SRAM的一體(Processing-In-Memory, PIM)架構(gòu)因兼具計算密度、能效和精度優(yōu)勢成為主流方案。隨著
    的頭像 發(fā)表于 07-11 15:11 ?136次閱讀
    緩解高性能<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b><b class='flag-5'>芯片</b>IR-drop問題的軟硬件協(xié)同設(shè)計

    國際首創(chuàng)新突破!中國團隊以一體排序架構(gòu)攻克智能硬件加速難題

    2025 年 6 月 25 日,北京大學(xué)團隊在智能計算硬件方面取得領(lǐng)先突破,國際上首次實現(xiàn)了基于一體技術(shù)的高效排序硬件架構(gòu) (A fast and reconfigurable
    的頭像 發(fā)表于 07-02 16:50 ?211次閱讀
    國際首創(chuàng)新突破!中國團隊以<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>排序架構(gòu)攻克<b class='flag-5'>智能</b>硬件加速難題

    第二屆科技杯華東高校內(nèi)計算創(chuàng)新應(yīng)用大賽正式啟動

    在數(shù)字浪潮席卷各行業(yè)的當下,數(shù)據(jù)量呈爆炸式增長,力需求也水漲船高。內(nèi)計算架構(gòu)作為創(chuàng)新解決方案,備受產(chǎn)學(xué)研各界關(guān)注。為推動內(nèi)計算技術(shù)產(chǎn)學(xué)研融合創(chuàng)新和發(fā)展,
    的頭像 發(fā)表于 05-06 17:51 ?444次閱讀

    蘋芯科技 N300 一體 NPU,開啟端側(cè) AI 新征程

    隨著端側(cè)人工智能技術(shù)的爆發(fā)式增長,智能設(shè)備對本地力與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構(gòu)在數(shù)據(jù)處理效率上存在瓶頸,“內(nèi)存墻”問題成為制約端側(cè)AI性能突破的關(guān)鍵掣肘。在這背景下,
    的頭像 發(fā)表于 05-06 17:01 ?466次閱讀
    蘋芯科技 N300 <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b> NPU,開啟端側(cè) AI 新征程

    【「芯片通識課:本書讀懂芯片技術(shù)」閱讀體驗】從deepseek看今天芯片發(fā)展

    和計算是分開的。一體化是近年來計算技術(shù)上的重大創(chuàng)新。 現(xiàn)如今的npu,如rk3588上的版本,力已經(jīng)達到6TOPS,足以運行眼下最流行的DeepSeek(1.5B版本)!筆者移植
    發(fā)表于 04-02 17:25

    濟南市中區(qū)一體化中心上線DeepSeek

    濟南市中未來產(chǎn)業(yè)發(fā)展有限公司(簡稱“市中產(chǎn)發(fā)”)聯(lián)合華為、北京昇騰和清昴智能基于市中區(qū)一體化中心(國家大學(xué)科技園節(jié)點)昇騰
    的頭像 發(fā)表于 02-19 10:38 ?715次閱讀

    一體行業(yè)2024年回顧與2025年展望

    2024年,大模型技術(shù)的迅猛發(fā)展成為人工智能領(lǐng)域的核心驅(qū)動力,其對硬件力和存儲效率的極致需求,促使一體技術(shù)在全球范圍內(nèi)迎來前所未有的關(guān)
    的頭像 發(fā)表于 01-23 11:24 ?1079次閱讀

    芯 · 智啟未來 — 2024蘋芯科技產(chǎn)品發(fā)布會盛大召開

    8月8日,國際領(lǐng)先的一體芯片開拓者——蘋芯科技在北京召開“
    的頭像 發(fā)表于 12-18 15:31 ?1618次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>于</b>芯 · 智啟未來 — 2024蘋芯科技產(chǎn)品發(fā)布會盛大召開

    開源芯片系列講座第24期:基于SRAM的高效計算架構(gòu)

    鷺島論壇開源芯片系列講座第24期「基于SRAM的高效計算架構(gòu)」明晚(27日)20:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報告題目基于SRAM
    的頭像 發(fā)表于 11-27 01:05 ?866次閱讀
    開源<b class='flag-5'>芯片</b>系列講座第24期:基于SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b>的高效計算架構(gòu)

    直播預(yù)約 |開源芯片系列講座第24期:SRAM一體:賦能高能效RISC-V計算

    鷺島論壇開源芯片系列講座第24期「SRAM一體:賦能高能效RISC-V計算」11月27日(周三)20:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報告題目SRAM
    的頭像 發(fā)表于 11-16 01:10 ?715次閱讀
    直播預(yù)約 |開源<b class='flag-5'>芯片</b>系列講座第24期:SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>:賦能高能效RISC-V計算

    一體化與邊緣計算:重新定義智能計算的未來

    、人工智能(AI)等技術(shù)的發(fā)展,數(shù)據(jù)量的分布性、實時性需求增加,邊緣計算也逐漸從概念走向落地。本文將介紹一體化與邊緣計算的核心思想及其發(fā)展趨勢,探討兩者在
    的頭像 發(fā)表于 11-12 01:05 ?833次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體化</b>與邊緣計算:重新定義<b class='flag-5'>智能</b>計算的未來

    一體架構(gòu)創(chuàng)新助力國產(chǎn)大力AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計算(HPC)應(yīng)用論壇》上,億鑄科技高級副總裁徐芳發(fā)表了題為《一體架構(gòu)創(chuàng)新助力國產(chǎn)大
    的頭像 發(fā)表于 10-23 14:48 ?872次閱讀

    科技新突破:首款支持多模態(tài)一體AI芯片成功問世

    一體介質(zhì),通過存儲單元和計算單元的深度融合,采用22nm成熟工藝制程,有效把控制造成本。與傳統(tǒng)架構(gòu)下的AI芯片相比,該款芯片
    發(fā)表于 09-26 13:51 ?669次閱讀
    科技新突破:首款支持多模態(tài)<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>AI<b class='flag-5'>芯片</b>成功問世

    后摩智能首款一體智駕芯片獲評突出創(chuàng)新產(chǎn)品獎

    近日,2024年6月29日,由深圳市汽車電子行業(yè)協(xié)會主辦的「第十三屆國際汽車電子產(chǎn)業(yè)峰會暨2023年度汽車電子科學(xué)技術(shù)獎頒獎典禮」在深圳寶安隆重舉行。后摩智能首款一體智駕
    的頭像 發(fā)表于 09-24 16:51 ?899次閱讀

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    呈現(xiàn)、產(chǎn)業(yè)展覽、技術(shù)交流、學(xué)術(shù)論壇一體的世界級人工智能合作交流平臺。本次大會暨博覽會由工業(yè)和信息部政府采購中心、廣東省工商聯(lián)、前海合作區(qū)管理局、深圳市工信局等單位指導(dǎo),深圳市
    發(fā)表于 08-22 15:00