婷婷综合基地狠狠干,天天在线视频免费公开

Text-Generation-Inference（又稱 TGI）是 Hugging Face 今年早些時(shí)候啟動(dòng)的一個(gè)項(xiàng)目，作為支持 Hugging Face Inference API 和后來(lái)的 Hugging Chat 上的 LLM 推理的內(nèi)部工具，旨在支持大型語(yǔ)言模型的優(yōu)化推理。自推出后，該項(xiàng)目迅速流行，并被 Open-Assistant 和 nat.dev 等其他開(kāi)源項(xiàng)目采用。

近日，Hugging Face 宣布，在最新推出的 TGI v1.0 版本中，其開(kāi)源許可證將從 Apache 2.0 改為 HFOIL 1.0。HFOIL 代表 Hugging Face Optimized Inference License，是 HuggingFace 專為優(yōu)化推理解決方案而設(shè)計(jì)的協(xié)議。Hugging Face 表示，HFOIL 并不是真正的開(kāi)源許可證，雖然源代碼仍然可以訪問(wèn)，但其增加了一項(xiàng)限制：要銷售基于 TGI 構(gòu)建的托管或托管服務(wù)，需要單獨(dú)的協(xié)議。

為什么要更換許可證？

據(jù)悉，TGI 已成為 Hugging Face 商業(yè)產(chǎn)品（如推理端點(diǎn)）及其商業(yè)合作伙伴（如 Amazon SageMaker、Azure 機(jī)器學(xué)習(xí)和 IBM watsonx ）的重要組成部分。而 Hugging Face 此次更換許可證也與其商業(yè)策略緊密相關(guān)。

根據(jù) Hugging Face 的說(shuō)法，TGI 最初是一個(gè)為其內(nèi)部產(chǎn)品提供動(dòng)力的項(xiàng)目，該公司將其視為商業(yè)解決方案的關(guān)鍵組成部分。“TGI 并不是一個(gè)社區(qū)驅(qū)動(dòng)的項(xiàng)目，而是一個(gè)可供社區(qū)廣泛訪問(wèn)的生產(chǎn)解決方案。我們希望繼續(xù)公開(kāi)建設(shè) TGI，并將繼續(xù)歡迎大家做出貢獻(xiàn)。但與 Transformers 和 Diffusers 等社區(qū)驅(qū)動(dòng)的項(xiàng)目不同，TGI 專注于生產(chǎn)環(huán)境中的性能和穩(wěn)健性，目標(biāo)是構(gòu)建商業(yè)產(chǎn)品?！?/p>

據(jù)悉，TGI 此前所有版本仍然在 Apache 2.0 下獲得許可，最后一個(gè) Apache 2.0 版本是版本 0.9.4。

Hugging Face 表示，源代碼許可的這一變化對(duì)免費(fèi)使用 TGI 的絕大多數(shù)社區(qū)用戶沒(méi)有影響，其推理端點(diǎn)客戶及商業(yè)合作伙伴的客戶也不會(huì)受到影響。但它將限制非合作云服務(wù)提供商在未請(qǐng)求許可的情況下提供 TGI v1.0+ 服務(wù)。

如果是 v1.0 之前的 TGI 現(xiàn)有用戶，當(dāng)前的版本仍然是 Apache 2.0，可以不受限制地進(jìn)行商業(yè)使用。

如果用戶將 TGI 用于個(gè)人用途或研究目的，則不受 HFOIL 1.0 的限制。

如果用戶將 TGI 作為內(nèi)部公司項(xiàng)目的一部分用于商業(yè)目的（不作為托管或托管服務(wù)出售給第三方），則也不受 HFOIL 1.0 限制。

如果將 TGI 集成到出售給客戶的托管或托管服務(wù)中，則考慮升級(jí)到 v1.0 及更高版本的許可證。

“開(kāi)源是一個(gè)誤稱，它應(yīng)該是來(lái)源自由?！庇芯W(wǎng)友評(píng)價(jià)道。也有網(wǎng)友表示，“開(kāi)源不應(yīng)過(guò)度限制我使用工具的方式。如果無(wú)法再將其嵌入到我銷售的產(chǎn)品中，則它是可用的源代碼，但不是開(kāi)源的。”

有人提出，資產(chǎn)階級(jí)認(rèn)為他們可以從公地獲取創(chuàng)新來(lái)建立帝國(guó)并壓迫群眾，至少應(yīng)該為這種特權(quán)付出代價(jià)。對(duì)此，有開(kāi)發(fā)者表示，“FSF （自由軟件基金會(huì)）對(duì)此的回答是使用 AGPLv3，它在網(wǎng)絡(luò)訪問(wèn)上限制了 Copyleft?！?/p>

AGPL v3 協(xié)議規(guī)定，除非獲得商業(yè)授權(quán)，否則無(wú)論以何種方式修改或者使用代碼，都需要開(kāi)源。開(kāi)發(fā)者“kmeisthax”表示，“如果你唯一的目標(biāo)就是阻止大型企業(yè)接觸您的代碼，那么當(dāng)然可以使用這個(gè)許可證。但你也可以使用奇怪時(shí)髦的后現(xiàn)代許可證來(lái)做到這一點(diǎn)，這些許可證從技術(shù)上講不授予任何權(quán)利，很容易被用來(lái)限制 Copyleft 巨魔。但如果你只是想要公平且易于遵守的規(guī)則，那么該許可證就有問(wèn)題?！薄癆GPLv3 僅對(duì)使用解釋性語(yǔ)言進(jìn)行 Web 開(kāi)發(fā)有意義，這樣可以輕松列出網(wǎng)站的代碼?！?/p>

“kmeisthax”進(jìn)一步表示，“如果你想更嚴(yán)格，還有 OpenWatcom 許可證，它會(huì)在您使用軟件時(shí)觸發(fā) Copylef，所以沒(méi)有私人分叉。實(shí)際上，這不像 AGPLv3 那樣令人頭疼，你不需要允許通過(guò)網(wǎng)絡(luò)下載源代碼，您只需在某處發(fā)布您的修改即可。FSF 拒絕碰它，因?yàn)樗麄冋J(rèn)為私人分叉是一項(xiàng)人權(quán)。”

“kmeisthax”認(rèn)為，阻止“資產(chǎn)階級(jí)”從公地掠奪所有創(chuàng)新的問(wèn)題在于，這樣做會(huì)使軟件脫離公地，這比 AGPLv3、SSPL 或 OpenWatcom 更糟。任何試圖這樣做的人都不是想保護(hù)公地，而是想加入資產(chǎn)階級(jí)。因?yàn)椴辉试S你為他人托管軟件，這是專有世界的語(yǔ)言。專有軟件許可之所以如此有利可圖，主要是因?yàn)槭褂孟拗啤试S你查看每個(gè)用戶的錢包，并從中提取最大金額的資金。

延綿近半世紀(jì)的開(kāi)源許可證要為 AI 改變？

自由軟件與開(kāi)源許可證自上世紀(jì)七、八十年代起曾經(jīng)歷演變以適應(yīng)代碼編程的需求。如今，它需要再次轉(zhuǎn)型來(lái)應(yīng)對(duì) AI 模型帶來(lái)的新一波沖擊。

比如，ChatGPT 現(xiàn)在仍然使用的是開(kāi)源代碼。特別是，分別由 Google 和 Facebook 開(kāi)發(fā)的 TensorFlow 和 PyTorch 推動(dòng)了 ChatGPT。這些框架為構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型提供了必要的工具和庫(kù)。沒(méi)有它們，就沒(méi)有 ChatGPT。ChatGPT 另一個(gè)重要的開(kāi)源部分就是 Hugging Face 的 Transformer，這是用于構(gòu)建最先進(jìn)的機(jī)器學(xué)習(xí)模型的領(lǐng)先開(kāi)源庫(kù)。

得益于開(kāi)源，但 OpenAI 卻沒(méi)有將 ChatGPT 開(kāi)源?！?OpenAI 本來(lái)是作為一家開(kāi)源（這就是為什么我將其命名為‘Open’AI）、非盈利公司而創(chuàng)建的，目的是作為谷歌的制衡，但現(xiàn)在它實(shí)際上已經(jīng)成為一家閉源、利潤(rùn)最大化的公司。由微軟控制。根本不是我想要的。”馬斯克曾批評(píng)道。

開(kāi)源模型的流行也印證了大家對(duì)于 AI 模型開(kāi)放的期盼。但實(shí)際上，基于版權(quán)法處理軟件代碼的自由軟件和開(kāi)源許可證，并不適合支撐 AI 開(kāi)源軟件之下的大語(yǔ)言模型（LLM）神經(jīng)網(wǎng)絡(luò)與數(shù)據(jù)集。而另一方面，相當(dāng)規(guī)模的編程數(shù)據(jù)集長(zhǎng)期基于自由軟件與開(kāi)源代碼，因此必須采取措施、順應(yīng)轉(zhuǎn)變。有鑒于此，開(kāi)放源碼倡議（OSI）執(zhí)行董事 Stefano Maffulli 等開(kāi)源和 AI 領(lǐng)導(dǎo)者，努力尋求一種對(duì)雙方均有積極意義的新方式，希望將 AI 與開(kāi)源許可證結(jié)合起來(lái)。

去年 J. Doe 等人（匿名）起訴了 GitHub。原告在美國(guó)加州北區(qū)法院控訴微軟、OpenAI 和 GitHub 通過(guò)其基于 AI 的商業(yè)系統(tǒng) OpenAI Codex 與 GitHub Copilot 竊取了開(kāi)發(fā)者的開(kāi)源代碼。原告方認(rèn)為，“涉案”代碼幾乎就是直接從公共 GitHub 代碼倉(cāng)庫(kù)中抓取的原始代碼副本，且未獲得開(kāi)源許可承認(rèn)。

目前案件仍在審理中，原告方修改了訴訟方向，包括指控被告違反《數(shù)字千年版權(quán)法》、違反合同（違反開(kāi)源許可證）、存在不公平得利和不正當(dāng)競(jìng)爭(zhēng)行為，以及違反合同（違反 GitHub 政策中約定的銷售許可條款）。

這類麻煩困擾的不只有微軟。耶魯大學(xué)法學(xué)院網(wǎng)絡(luò)安全講師、耶魯大學(xué)隱私實(shí)驗(yàn)室創(chuàng)始人 Sean O’Brien 認(rèn)為，“很快就會(huì)出現(xiàn)與專利流氓類似的完整子產(chǎn)業(yè)，但這一次將主要圍繞 AI 生成的成果。隨著越來(lái)越多作者使用 AI 驅(qū)動(dòng)工具在專有許可之下發(fā)布代碼，這將建立起新的反饋循環(huán)。軟件生態(tài)系統(tǒng)將被專有代碼所污染，而這些代碼將成為‘有心之人’的索賠載體。”

德國(guó)研究員兼政治家 Felix Reda 等人則聲稱，一切 AI 生成的代碼都屬于公共產(chǎn)出。SmartEdgeLaw Group 創(chuàng)始成員之一、美國(guó)律師 Richard Santalesa 認(rèn)為，這里其實(shí)存在合同法與版權(quán)法的雙重糾紛。Santalesa 認(rèn)為，出售 AI 生成代碼的企業(yè)將“與所有其他知識(shí)產(chǎn)權(quán)一樣，將其交付的材料（包括 AI 生成代碼）視為自有財(cái)產(chǎn)?！倍差I(lǐng)域代碼和開(kāi)源代碼的處理方式并不相同。

更重要的是，這還涉及數(shù)據(jù)集如何獲取許可這個(gè)宏觀問(wèn)題。雖然很多開(kāi)源許可證之下都涵蓋大量“開(kāi)放”數(shù)據(jù)集，但并不足以徹底解決目前的尖銳沖突。

如今的我們正站在類似的十字路口上。TensorFlow、PyTorch 和 Hugging Face Hub 等 AI 程序在其開(kāi)源許可證下運(yùn)行良好，但其他新 AI 成果卻不知該如何走出自己的道路。數(shù)據(jù)集、模型、權(quán)重等并不完全適合傳統(tǒng)的版權(quán)模型。Maffulli 認(rèn)為，技術(shù)社區(qū)應(yīng)當(dāng)設(shè)計(jì)出一些更符合自身目標(biāo)的新事物，而不能總是依賴于對(duì)已有規(guī)則的“魔改”。

Maffulli 解釋道，為軟件設(shè)計(jì)的開(kāi)源許可證可能并不適合 AI 工件。例如，雖然 MIT 許可證強(qiáng)調(diào)的廣泛自由度在模型層面比較適用，但 Apache 或 GPl 等更復(fù)雜的許可證卻很可能引發(fā)問(wèn)題。Maffulli 還強(qiáng)調(diào)，將開(kāi)源原則應(yīng)用于醫(yī)療保健等敏感領(lǐng)域同樣面臨著挑戰(zhàn)。在這些領(lǐng)域，關(guān)于數(shù)據(jù)訪問(wèn)的法規(guī)已經(jīng)成為行業(yè)發(fā)展道路上的障礙。簡(jiǎn)而言之，法律規(guī)定醫(yī)療數(shù)據(jù)不得開(kāi)源。

與此同時(shí)，大多數(shù)大語(yǔ)言模型的數(shù)據(jù)集都屬于黑盒子，我們根本不知道其中到底有些什么。因此，正如電子前沿基金會(huì)（EFF）所言，我們最終陷入了“垃圾進(jìn)、寶貝出”的茫然境地。為此，EFF 建議必須開(kāi)放訓(xùn)練數(shù)據(jù)。

通過(guò)立法保護(hù)開(kāi)源？

中國(guó)、歐盟、美國(guó)和英國(guó)等多國(guó)政府一直在努力開(kāi)展 AI 監(jiān)管。而 Hugging Face、GitHub、EleutherAI、Creative Commons、LAION 和 Open Future 等六家開(kāi)源 AI 利益相關(guān)方組成的聯(lián)盟正向歐盟立法者請(qǐng)?jiān)?，呼吁在設(shè)定歐盟 AI 法案（將成為歐盟 AI 法案的最終版本，也將是全球第一部全面的人工智能法）時(shí)保護(hù)開(kāi)源創(chuàng)新。

在日前發(fā)布的政策文件《在歐盟 AI 法案中支持開(kāi)源與開(kāi)放科學(xué)》（Supporting Open Source and Open Science in the EU AI Act）當(dāng)中，開(kāi)源 AI 領(lǐng)導(dǎo)者們提出了“如何確保 AI 法案適用于開(kāi)源”的相關(guān)建議，原則要求“確保開(kāi)放式 AI 開(kāi)發(fā)實(shí)踐不會(huì)面臨在結(jié)構(gòu)上不切實(shí)際的義務(wù)，或者其他有礙技術(shù)發(fā)展的義務(wù)。”

根據(jù)這份文件，有利于閉源及專有 AI 開(kāi)發(fā)（例如 OpenAI、Anthropic 和谷歌等頂尖 AI 廠商開(kāi)發(fā)的模型）的“過(guò)于廣泛的義務(wù)”，“可能會(huì)對(duì)開(kāi)放 AI 生態(tài)系統(tǒng)造成不利影響?！?/p>

Hugging Face 機(jī)器學(xué)習(xí)與社會(huì)事務(wù)負(fù)責(zé)人 Hacine Jernite 在采訪中表示，雖然政策文件的內(nèi)容相當(dāng)豐富，但該聯(lián)盟想要強(qiáng)調(diào)的核心永遠(yuǎn)是鼓勵(lì)創(chuàng)新?！拔覀冋J(rèn)為，人們應(yīng)該能從各類基礎(chǔ)模型、組件間自由選擇，并根據(jù)需求隨意組合和匹配，這一點(diǎn)非常重要?！?/p>

此外，該聯(lián)盟還希望強(qiáng)調(diào)開(kāi)源 AI 的重要性、甚至是必要性，認(rèn)為監(jiān)管不應(yīng)阻礙開(kāi)源 AI 的創(chuàng)新道路。Jernite 解釋道，“開(kāi)放本身并不能保證負(fù)責(zé)任的開(kāi)發(fā)態(tài)度。但是，開(kāi)放性和透明度卻是負(fù)責(zé)任治理的必要前提。因此，開(kāi)放性不是要躲避責(zé)任，而責(zé)任也不應(yīng)該妨礙開(kāi)放發(fā)展?！?/p>

GitHub 高級(jí)政策經(jīng)理 Peter Cihon 指出，隨著歐盟理事會(huì)及之后的歐盟議會(huì)制定出 AI 法案草案，立法者們開(kāi)始審視整個(gè)價(jià)值鏈、思考如何減輕其中由 AI 發(fā)展早期引發(fā)的風(fēng)險(xiǎn)。

Cihon 在采訪中指出，“通過(guò)這一步驟，我們正加倍努力，確保法案不會(huì)在潛移默化中偏向于大企業(yè)、或者其他資源充足的 AI 參與者，而是將這份權(quán)利同樣交付給出于業(yè)余愛(ài)好的開(kāi)源開(kāi)發(fā)者、非營(yíng)利性組織和學(xué)生。總而言之，立法者一直過(guò)于關(guān)注特定的價(jià)值鏈和特定的模型，大多是 API 模型——而這種關(guān)注在開(kāi)源背景下并不真正適用?！?/p>

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
88

文章
35103

瀏覽量
279556
源代碼

源代碼

+關(guān)注

關(guān)注
96

文章
2953

瀏覽量
68353
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8502

瀏覽量
134584

原文標(biāo)題：一場(chǎng) AI 引發(fā)的開(kāi)源革命迫在眉睫？Hugging Face 更改文本推理軟件許可證，不再“開(kāi)源”

文章出處：【微信號(hào)：AI前線，微信公眾號(hào)：AI前線】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

搜索歷史

Hugging Face更改文本推理軟件許可證，不再“開(kāi)源”

評(píng)論

搜索歷史

Hugging Face更改文本推理軟件許可證，不再“開(kāi)源”

評(píng)論

Hugging Face更改文本推理軟件許可證，不再“開(kāi)源”