99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

RISC-V 跑大模型(三):LLaMA中文擴展

澎峰科技PerfXLab ? 來源:澎峰科技PerfXLab ? 作者:澎峰科技PerfXLab ? 2023-07-17 17:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這是RISC-V跑大模型系列的第三篇文章,前面我們?yōu)榇蠹医榻B了如何在RISC-V下運行LLaMA,本篇我們將會介紹如何為LLaMA提供中文支持。

1.模型擴充

以下步驟在X86下進行:

1.1準備工作

安裝最新版本的python和以下依賴庫。

pip install protobuf==3.20.0 結構化數(shù)據(jù)存儲格式
pip install transformers 把原版模型轉換為HF格式
pip install sentencepiece 無監(jiān)督的文本標記器和去標記器
pip install peft 使用LoRA的工具

1.2模型下載

下載LLaMA原版模型和中文擴充

LLaMA原版模型:

https://ipfs.io/ipfs/Qmb9y5GCkTG7ZzbBWMu2BXwMkzyCKcUjtEKPpgdZ7GEFKm/

中文擴充:

https://huggingface.co/ziqingyang/chinese-alpaca-lora-7b

下載后的目錄如下:

wKgaomS1AoiAbJSYAACUfmvct_s083.pngwKgZomS1Ao6ACv0GAABF7DbXaIQ678.png

1.3合并模型

(1) 將LLaMA原版模型轉換為Huggingface格式。這一步需要借助transformers提供的腳本convert_llama_weights_to_hf.py。

下載鏈接:https://github.com/huggingface/transformers/blob/main/src/transformers/models/llama/convert_llama_weights_to_hf.py

請執(zhí)行以下命令:

python convert_llama_weights_to_hf.py --input_dir path_to_original_llama_root_dir --model_size 7B --output_dir path_to_original_llama_hf_dir

命令解釋:將原版LLaMA的tokenizer.model放在--input_dir指定的目錄,其余文件放在${input_dir}/${model_size}下。執(zhí)行以下命令后,--output_dir中將存放轉換好的Huggingface版權重。

(2) 合并LoRA權重,生成Huggingface全量模型,這一步需要借助:merge_llama_with_chinese_lora.py。

下載鏈接:

https://github.com/ymcui/Chinese-LLaMA-Alpaca/blob/main/scripts/merge_llama_with_chinese_lora.py

執(zhí)行命令:

python merge_llama_with_chinese_lora.py --base_model path_to_original_llama_hf_dir --lora_model chinese-alpaca-lora-7b --output_dir path_to_output_dir

命令解釋:這一步的參數(shù)可以參照上一步。

2.移植模型

在完成前面的步驟后會得到一個path_to_output_dir的目錄,目錄內(nèi)容如下:

wKgZomS1BGiAcPf6AAC6mGVvrpk862.png

將目錄下的consolidate.00.path和params.json上傳到RISC-V中的llama.cpp/models目錄下,這一步可以借助scp來實現(xiàn):scp “源文件路徑” 賬戶@地址:目的路徑。之后的步驟可以參考本系列的第二篇文章。鏈接如下:RISC-V 跑大模型(二):LLaMA零基礎移植教程

最后的運行效果:

wKgZomS1BNiAJHVQAAIxHb8elDk082.png

3.結語

我們也為大家準備好已經(jīng)擴展了中文的LLaMA供大家使用,只要掃描下面的二維碼,進群即可獲得下載地址。之后我們還會對LLaMA進行優(yōu)化加速,敬請期待。

另外,RISC -V跑大模型系列文章計劃分為四期:

1.RISC -V跑大模型(一)

2.RISC-V 跑大模型(二):LLaMA零基礎移植教程

3.RISC-V跑大模型(三):LLaMA中文擴充(本篇)

4.更多性能優(yōu)化策略。(計劃)

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19896

    瀏覽量

    235310
  • RISC-V
    +關注

    關注

    46

    文章

    2573

    瀏覽量

    48851
  • 大模型
    +關注

    關注

    2

    文章

    3146

    瀏覽量

    4076
  • LLM
    LLM
    +關注

    關注

    1

    文章

    325

    瀏覽量

    844
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    關于RISC-V芯片的應用學習總結

    的核心優(yōu)勢在于其開源性、模塊化、低功耗、高性能以及可擴展性。這些特性使得RISC-V芯片在物聯(lián)網(wǎng)(IoT)、嵌入式系統(tǒng)、邊緣計算以及高性能計算等領域具有獨特競爭力。 在物聯(lián)網(wǎng)領域,RISC-V芯片的低功耗
    發(fā)表于 01-29 08:38

    新的一年 RISC-V前景如何呢?

    1 月 7 日消息,RISC-V 領軍企業(yè) SiFive 成立中國分公司,中文名稱定為“芯伍科技”。 1 月 14 日消息,專注傳統(tǒng)與 AI 業(yè)務,Imagination 放棄 RISC-V CPU 開發(fā)。 新的一年,
    發(fā)表于 01-24 16:19

    RISC-V指令集概述

    RISC-V就是RISC的第五代指令集架構。而RISC-V目標就是“成為一種完全開放的指令集架構,可被任何學術機構或商業(yè)組織自由使用”。 RISC-V指令集由“基本指令集 +
    發(fā)表于 11-30 23:30

    關于RISC-V學習路線圖推薦

    )、密碼指令集(C)等。 RISC-V架構特性 : 掌握RISC-V的精簡、模塊化、可擴展性和可裁剪性等特性。 、RISC-V開發(fā)工具與環(huán)
    發(fā)表于 11-30 15:21

    什么是RISC-V?以及RISC-V和ARM、X86的區(qū)別

    是開放的,任何人都可以使用它來開發(fā)處理器芯片和其他硬件,而無需支付任何許可或使用費用。RISC-V的設計簡單,易于擴展和自定義,可以在各種應用場景和市場中使用。 什么是指令集架構? 指令集架構
    發(fā)表于 11-16 16:14

    RISC-V,即將進入應用的爆發(fā)期

    計算機由控制整體的CPU(中央處理器)和加速器兩部分構成。在AI計算中,功耗和效率是兩個關鍵因素。RISC-V架構通過其簡潔的設計和定制化的擴展,可以實現(xiàn)高效的能量使用。該架構能夠通過小型且高效的處理單元
    發(fā)表于 10-31 16:06

    RISC-V近期市場情況調研

    RISC-V芯片的發(fā)展情況 全球趨勢 :RISC-V架構因其開源、免費、模塊化和可擴展的特點,獲得了業(yè)界的廣泛支持。包括蘋果、Intel、高通等國際巨頭都在積極布局RISC-V生態(tài)
    的頭像 發(fā)表于 10-23 15:10 ?1688次閱讀

    ISA ARM 對比 RISC-V

    擴展方式以及目標應用場景等方面有顯著差異。 要深入對比ARM和RISC-V的指令集,需要從指令集架構(ISA)的設計原則、擴展模塊、指令的復雜性、特性以及它們的實際性能表現(xiàn)來進行討論。RIS
    的頭像 發(fā)表于 09-10 09:26 ?1619次閱讀

    加入全球 RISC-V Advocate 行列,共筑 RISC-V 的未來 !

    加入RISC-VAdvocate行列!我們正在尋找來自世界各地的RISC-V愛好者,通過全球推廣和參與,成為支持RISC-V進步的關鍵參與者。作為一名RISC-VAdvocate,您將
    的頭像 發(fā)表于 09-10 08:08 ?891次閱讀
    加入全球 <b class='flag-5'>RISC-V</b> Advocate 行列,共筑 <b class='flag-5'>RISC-V</b> 的未來 !

    RISC-V Summit China 2024 青稞RISC-V+接口PHY,賦能RISC-V高效落地

    第二屆RISC-V中國峰會的南京會場;青稞RISC-V的單雙線調試技術,在第屆峰會上入選RISC-V新技術與新成果。
    的頭像 發(fā)表于 08-30 18:18 ?2383次閱讀
    <b class='flag-5'>RISC-V</b> Summit China 2024  青稞<b class='flag-5'>RISC-V</b>+接口PHY,賦能<b class='flag-5'>RISC-V</b>高效落地

    RISC-V Summit China 2024 | 青稞RISC-V+接口PHY,賦能RISC-V高效落地

    量產(chǎn)芯片的關鍵技術;公司籌備了第二屆RISC-V中國峰會的南京會場;青稞RISC-V的單雙線調試技術,在第屆峰會上入選RISC-V新技術與新成果。 02 連接聯(lián)網(wǎng)連世界 有核有根有
    發(fā)表于 08-30 17:37

    2024 RISC-V 中國峰會:華秋電子助力RISC-V生態(tài)!

    160+,生態(tài)技術文章8000+,策劃了70多場RISC-V系列公開課,號召更多合作伙伴一起加入,參與RISC-V開發(fā)者生態(tài)共建。 不僅如此,電子發(fā)燒友聯(lián)合RISC-V生態(tài)平臺伙伴發(fā)起2024第
    發(fā)表于 08-26 16:46

    risc-v的發(fā)展歷史

    本的RISC-V指令集架構,即RISC-V v2.0。這個版本為32位和64位的RISC-V架構定義了基本的指令集,并概述了未來的擴展指令集
    發(fā)表于 07-29 17:20

    rIsc-v的缺的是什么?

    RISC-V作為一種開源的指令集架構(ISA),自其誕生以來就受到廣泛關注和應用,但它也存在一些不足之處。以下是RISC-V架構目前存在的主要缺點: 1. 性能問題 相對于專用ISA的性能差距:盡管
    發(fā)表于 07-29 17:18

    為什么要有RISC-V

    的,永遠不會改變。這為編譯器編寫者,操作系統(tǒng)開發(fā)人員和匯 編語言程序員提供了穩(wěn)定的目標。模塊化來源于可選的標準擴展,根據(jù)應用程序的需要,硬件可以包含或不包含這些擴展。這種模塊化特性使得RISC-V具有了
    發(fā)表于 07-27 15:05