久久久精品午夜福利一区二区,激情综合网丁香七月,日韩wwww我是我

世界最強(qiáng)開源大模型 Falcon 180B 忽然火爆全網(wǎng)，1800億參數(shù)，F(xiàn)alcon 在 3.5 萬億 token 完成訓(xùn)練，性能碾壓 Llama 2，登頂 Hugging Face 排行榜。

今年5月，TII（阿聯(lián)酋阿布扎比技術(shù)創(chuàng)新研究所）推出了號稱是 “史上最強(qiáng)的開源大語言模型”——Falcon（獵鷹）。雖然 Falcon 的參數(shù)比 LLaMA 小，但性能卻更加強(qiáng)大。

此前，F(xiàn)alcon 已經(jīng)推出了三種模型大小，分別是1.3B、7.5B、40B。據(jù)介紹，F(xiàn)alcon 180B 是 40B 的升級版本，F(xiàn)alcon 180B 的規(guī)模是 Llama 2 的 2.5 倍，且可免費商用。 Falcon 180B在 Hugging Face 開源大模型榜單上被認(rèn)為是當(dāng)前評分最高的開放式大模型，其評分68.74，Meta 的 LlaMA 2以 1.39 的分?jǐn)?shù)差距排名第二。

據(jù)官方介紹，F(xiàn)alcon 180B 是當(dāng)前最好的開源大模型。其在 MMLU 上的表現(xiàn)超過了 Llama 2 70B 和 OpenAI 的 GPT-3.5。在 HellaSwag、LAMBADA、WebQuestions、Winogrande、PIQA、ARC、BoolQ、CB、COPA、RTE、WiC、WSC 及 ReCoRD 上與谷歌的 PaLM 2-Large 不相上下。

目前大家可以通過以下地址進(jìn)行Demo 體驗：https://hf.co/spaces/HuggingFaceH4/falcon-chat

硬件要求

	類型	種類	最低要求	配置示例
Falcon 180B	Training	Full fine-tuning	5120GB	8x 8x A100 80GB
Falcon 180B	Training	LoRA with ZeRO-3	1280GB	2x 8x A100 80GB
Falcon 180B	Training	QLoRA	160GB	2x A100 80GB
Falcon 180B	Inference	BF16/FP16	640GB	8x A100 80GB
Falcon 180B	Inference	GPTQ/int4	320GB	8x A100 40GB

Prompt 格式

其基礎(chǔ)模型沒有 Prompt 格式，因為它并不是一個對話型大模型也不是通過指令進(jìn)行的訓(xùn)練，所以它并不會以對話形式回應(yīng)。預(yù)訓(xùn)練模型是微調(diào)的絕佳平臺，但或許你不該直接使用。其對話模型則設(shè)有一個簡單的對話模式。

System: Add an optional system prompt here
User: This is the user input
Falcon: This is what the model generates
User: This might be a second turn input
Falcon: and so on

Transformers

從 Transfomers 4.33 開始，可以在 Hugging Face 上使用 Falcon 180B 并且使用 HF 生態(tài)里的所有工具。但是前提是請確保你已經(jīng)登錄了自己的 Hugging Face 賬號，并安裝了最新版本的 transformers:

pip install --upgrade transformers
huggingface-cli login

bfloat16 以下是如何在bfloat16中使用基礎(chǔ)模型的方法。Falcon 180B 是一個大型模型，所以請注意它的硬件要求（硬件要求如上所示）。

from transformers import AutoTokenizer, AutoModelForCausalLM
import transformers
import torch

model_id = "tiiuae/falcon-180B"

tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)

prompt = "My name is Pedro, I live in"
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")

output = model.generate(
    input_ids=inputs["input_ids"],
    attention_mask=inputs["attention_mask"],
    do_sample=True,
    temperature=0.6,
    top_p=0.9,
    max_new_tokens=50,
)
output = output[0].to("cpu")
print(tokenizer.decode(output)

這可能會產(chǎn)生如下輸出結(jié)果:

My name is Pedro, I live in Portugal and I am 25 years old. I am a graphic designer, but I am also passionate about photography and video.
I love to travel and I am always looking for new adventures. I love to meet new people and explore new places.

使用 8 位和 4 位的 bitsandbytes Falcon 180B 的 8 位和 4 位量化版本在評估方面與bfloat16幾乎沒有差別！這對推理來說是個好消息，因為你可以放心地使用量化版本來降低硬件要求。請記住，在 8 位版本進(jìn)行推理要比 4 位版本快得多。要使用量化，你需要安裝 “bitsandbytes” 庫，并在加載模型時啟用相應(yīng)的標(biāo)志:

model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    **load_in_8bit=True,**
    device_map="auto",
)

對話模型如上所述，為跟蹤對話而微調(diào)的模型版本使用了非常直接的訓(xùn)練模板。我們必須遵循同樣的模式才能運行聊天式推理。作為參考，你可以看看聊天演示中的format_prompt函數(shù):

def format_prompt(message, history, system_prompt):
    prompt = ""
    if system_prompt:
        prompt += f"System: {system_prompt}
"
    for user_prompt, bot_response in history:
        prompt += f"User: {user_prompt}
"
        prompt += f"Falcon: {bot_response}
"
        prompt += f"User: {message}
Falcon:"
    return prompt

如你所見，用戶的交互和模型的回應(yīng)前面都有User:和Falcon:分隔符。我們將它們連接在一起，形成一個包含整個對話歷史的提示。這樣就可以提供一個系統(tǒng)提示來調(diào)整生成風(fēng)格。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

開源

開源

+關(guān)注

關(guān)注
3

文章
3680

瀏覽量
43818
大模型

大模型

+關(guān)注

關(guān)注
2

文章
3139

瀏覽量
4062

原文標(biāo)題：1800億參數(shù)，性能碾壓Llama 2，世界最強(qiáng)開源大模型Falcon 180B發(fā)布

文章出處：【微信號：OSC開源社區(qū)，微信公眾號：OSC開源社區(qū)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

搜索歷史

開源大模型Falcon（獵鷹） 180B發(fā)布 1800億參數(shù)

評論