99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

周四研討會(huì)預(yù)告 | 注冊(cè)報(bào)名 NVIDIA AI Inference Day - 大模型推理線上研討會(huì)

NVIDIA英偉達(dá) ? 來(lái)源:未知 ? 2023-10-26 09:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

由 CSDN 舉辦的 NVIDIA AI Inference Day - 大模型推理線上研討會(huì),將幫助您了解 NVIDIA 開(kāi)源大型語(yǔ)言模型(LLM)推理加速庫(kù) TensorRT-LLM及其功能,使用 NVIDIA TritonTM推理服務(wù)器進(jìn)行端到端部署 LLM Serving,以及金融行業(yè)的 AI、NLP/LLM 應(yīng)用場(chǎng)景、客戶案例。


通過(guò)本次活動(dòng),您將了解基于上述產(chǎn)品的 LLM 推理加速和部署的服務(wù)化實(shí)現(xiàn)管道、性能收益,以及金融行業(yè)加速計(jì)算解決方案,為您 LLM 和生成式 AI 開(kāi)發(fā)的增效降本提供領(lǐng)先的技術(shù)路線參考和知識(shí)儲(chǔ)備。建議 AI 領(lǐng)域的數(shù)據(jù)科學(xué)家、AI 開(kāi)發(fā)者程序員、MLOps,DevOps,IT 運(yùn)維及 leader,參與本次線上研討會(huì)。


NVIDIA TensorRT-LLM 和 Triton 是 NVIDIA AI Enterprise 的一部分(https://www.nvidia.cn/data-center/products/ai-enterprise/), 這是一款端到端的 AI 軟件平臺(tái),為企業(yè)級(jí)的安全、穩(wěn)定、管理和支持任務(wù)提供至關(guān)重要的 AI 推理解決方案。


注冊(cè)報(bào)名 NVIDIA AI Inference

Day - 大模型推理線上研討會(huì)


活動(dòng)日程



2023/10/26 19:30 – 21:00


研討會(huì)將涵蓋以下主題:


1. 利用 NVIDIA TensorRT-LLM 加速大模型推理


  • NVIDIA TensorRT-LLM 簡(jiǎn)介:產(chǎn)品定位,與原有產(chǎn)品的關(guān)系

  • 現(xiàn)支持的模型

  • 現(xiàn)支持的主要功能,如 KV-cache,各種量化方法等

  • 性能

  • 未來(lái)路線圖


2. 基于 NVIDIA Triton 推理服務(wù)器端到端部署 LLM serving


  • NVIDIA TensorRT-LLM 的任務(wù)調(diào)度方案,in-flight batching 的基礎(chǔ)原理

  • NVIDIA Triton 推理服務(wù)器的 TensorRT-LLM backend 介紹

  • 基于 Triton 端到端部署 LLM 的完整解決方案(以 Llama 2 70B 為例)

  • 相關(guān) benchmark 參考結(jié)果


3. 金融行業(yè) AI 應(yīng)用場(chǎng)景分享與 NVIDIA 加速計(jì)算解決方案介紹


  • 金融行業(yè) AI 應(yīng)用場(chǎng)景及客戶案例

  • NLP/LLM 在金融行業(yè)的潛在應(yīng)用場(chǎng)景

  • NVIDIA 針對(duì)金融場(chǎng)景的加速計(jì)算解決方案


演講嘉賓


季光

NVIDIA GPU 加速計(jì)算專家團(tuán)隊(duì)經(jīng)理


盧翔龍

NVIDIA 資深解決方案架構(gòu)師


史永明

NVIDIA 工程與解決方案架構(gòu)經(jīng)理


參與方式


微信識(shí)別上方二維碼,注冊(cè)參加本次活動(dòng)


相關(guān)資料


快速上手 TensorRT-LLM 的資源如下:


  • 訪問(wèn) GitHub 倉(cāng)庫(kù),獲取開(kāi)源代碼:https://github.com/NVIDIA/TensorRT-LLM

  • 探索 TensorRT-LLM 的示例代碼:https://github.com/NVIDIA/TensorRT-LLM/tree/release/0.5.0/examples

    benchmark:https://nvidia.github.io/TensorRT-LLM/performance.html

    以及用戶手冊(cè):https://nvidia.github.io/TensorRT-LLM/index.html




GTC 2024 將于 2024 年 3 月 18 至 21 日在美國(guó)加州圣何塞會(huì)議中心舉行,線上大會(huì)也將同期開(kāi)放。點(diǎn)擊“閱讀原文”掃描下方海報(bào)二維碼,關(guān)注更多會(huì)議及活動(dòng)信息。



原文標(biāo)題:周四研討會(huì)預(yù)告 | 注冊(cè)報(bào)名 NVIDIA AI Inference Day - 大模型推理線上研討會(huì)

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3948

    瀏覽量

    93684

原文標(biāo)題:周四研討會(huì)預(yù)告 | 注冊(cè)報(bào)名 NVIDIA AI Inference Day - 大模型推理線上研討會(huì)

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Rambus邀您相約Keysight設(shè)備安全研討會(huì)

    ,特別是在加密技術(shù)、AI安全、后量子密碼學(xué)等前沿領(lǐng)域。研討會(huì)涵蓋了從嵌入式系統(tǒng)到大規(guī)模數(shù)據(jù)中心的安全挑戰(zhàn)與解決方案以及汽車領(lǐng)域的相關(guān)安全認(rèn)證。與會(huì)者將有機(jī)會(huì)了解最新的市場(chǎng)動(dòng)態(tài)、技術(shù)突破以及如何應(yīng)對(duì)現(xiàn)代安全威脅。
    的頭像 發(fā)表于 06-03 15:25 ?466次閱讀

    ATS-M1000C寬頻大電流互感器驅(qū)動(dòng)電源線上研討會(huì)!

    ATS-M1000C寬頻大電流互感器驅(qū)動(dòng)電源線上研討會(huì)!
    的頭像 發(fā)表于 04-22 18:27 ?218次閱讀
    ATS-M1000C寬頻大電流互感器驅(qū)動(dòng)電源<b class='flag-5'>線上</b><b class='flag-5'>研討會(huì)</b>!

    面向未來(lái)量子通信與大物理研究線上研討會(huì)QA筆記請(qǐng)查收!

    4月8日及10日,《面向未來(lái)量子通信與大物理研究》線上研討會(huì)圓滿結(jié)束。感謝大家的觀看與支持!請(qǐng)查收研討會(huì)筆記!
    的頭像 發(fā)表于 04-21 11:42 ?221次閱讀
    面向未來(lái)量子通信與大物理研究<b class='flag-5'>線上</b><b class='flag-5'>研討會(huì)</b>QA筆記請(qǐng)查收!

    2025年簡(jiǎn)儀科技全國(guó)巡回研討會(huì)預(yù)告

    2025年簡(jiǎn)儀科技全國(guó)巡回研討會(huì)以“AI賦能銳視測(cè)控——銳不可擋”為主題,深入探討AI技術(shù)與銳視測(cè)控平臺(tái)的深度融合,推動(dòng)測(cè)試測(cè)量領(lǐng)域的智能化升級(jí),擴(kuò)大應(yīng)用領(lǐng)域,提升信號(hào)處理與分析能力,為行業(yè)帶來(lái)前所未有的變革。
    的頭像 發(fā)表于 04-17 13:36 ?412次閱讀
    2025年簡(jiǎn)儀科技全國(guó)巡回<b class='flag-5'>研討會(huì)</b><b class='flag-5'>預(yù)告</b>

    2025年星閃技術(shù)應(yīng)用巡回研討會(huì)-深圳站火熱報(bào)名

    2025年星閃技術(shù)應(yīng)用巡回研討會(huì)-深圳站火熱報(bào)名中,感興趣的可以關(guān)注【國(guó)際星閃聯(lián)盟】微信公眾號(hào)了解活動(dòng)信息。
    發(fā)表于 03-25 10:17

    邁來(lái)芯機(jī)器人解決方案專題研討會(huì)預(yù)告

    2月19日 “詳解邁來(lái)芯機(jī)器人解決方案”專題研討會(huì)邀請(qǐng)您參加。
    的頭像 發(fā)表于 02-14 13:36 ?425次閱讀

    PI在線研討會(huì)活動(dòng)預(yù)告

    PI公司誠(chéng)邀您參加由21ic舉辦的在線研討會(huì)。我們的技術(shù)專家將介紹多款高集成電源開(kāi)關(guān)IC產(chǎn)品,在不犧牲空載或峰值負(fù)載性能的情況下,在整個(gè)負(fù)載范圍內(nèi)(包括待機(jī)和睡眠模式)實(shí)現(xiàn)最大功率變換效率。
    的頭像 發(fā)表于 01-08 16:41 ?771次閱讀

    2025電子設(shè)計(jì)與制造技術(shù)研討會(huì)

    本帖最后由 jf_32813774 于 2024-12-26 16:14 編輯 電子工程師不可錯(cuò)過(guò)的技術(shù)研討會(huì),終于火熱啟動(dòng)了! 為了讓廣大電子行業(yè)從業(yè)者共聚一堂,探索前沿科技,共話創(chuàng)新未來(lái)
    發(fā)表于 12-18 10:23

    Imagination 系列研討會(huì) |中國(guó)生成式 AI 的發(fā)展

    近期,Imagination將陸續(xù)推出全新系列研討會(huì),涵蓋邊緣AI如何推動(dòng)工業(yè)物聯(lián)網(wǎng)的發(fā)展,生成式AI,智能汽車未來(lái)發(fā)展趨勢(shì)等等多個(gè)熱門話題。本期研討會(huì)中,Imagination中國(guó)區(qū)
    的頭像 發(fā)表于 12-09 16:57 ?668次閱讀
    Imagination 系列<b class='flag-5'>研討會(huì)</b> |中國(guó)生成式 <b class='flag-5'>AI</b> 的發(fā)展

    飛騰成功舉辦散熱技術(shù)應(yīng)用發(fā)展研討會(huì)

    近日,飛騰公司在深圳成功舉辦了 “散熱技術(shù)應(yīng)用發(fā)展研討會(huì)”,并與合作伙伴共同成立業(yè)內(nèi)首個(gè)“散熱技術(shù)應(yīng)用發(fā)展聯(lián)合中心”。此次研討會(huì)匯聚了眾多業(yè)界專家,共同探討散熱技術(shù)的最新應(yīng)用、發(fā)展趨勢(shì)及產(chǎn)業(yè)合作等關(guān)鍵議題,旨在推動(dòng)散熱技術(shù)的快速發(fā)展與廣泛應(yīng)用,加強(qiáng)行業(yè)內(nèi)的合作與交流。
    的頭像 發(fā)表于 11-21 16:04 ?656次閱讀

    精彩回顧 : 向新而行 云啟未來(lái)——2024高云FPGA線上技術(shù)研討會(huì)

    向新而行 云啟未來(lái) 2024高云FPGA線上技術(shù)研討會(huì) 近日,由高云半導(dǎo)體主辦的“ 向新而行 云啟未來(lái)——2024高云FPGA線上技術(shù)研討會(huì)”成功舉辦。 本次
    發(fā)表于 11-18 18:24 ?526次閱讀
    精彩回顧 : 向新而行 云啟未來(lái)——2024高云FPGA<b class='flag-5'>線上</b>技術(shù)<b class='flag-5'>研討會(huì)</b>

    芯華章硬件專場(chǎng)研討會(huì)順利舉辦

    近日,2024芯華章驗(yàn)證技術(shù)研討會(huì)——Hardware Verification Workshop圓滿舉辦。
    的頭像 發(fā)表于 11-14 13:57 ?695次閱讀

    Atlassian研討會(huì)預(yù)告 | 探討AI在服務(wù)管理中的應(yīng)用現(xiàn)狀、實(shí)戰(zhàn)案例、面臨的挑戰(zhàn)與趨勢(shì)等

    AI在服務(wù)管理中的應(yīng)用揭秘!11月14日早7點(diǎn),Atlassian研討會(huì)誠(chéng)邀您探討AI如何賦能服務(wù)團(tuán)隊(duì)提升效率、增強(qiáng)客戶體驗(yàn),更有美國(guó)O2O行業(yè)領(lǐng)導(dǎo)者Thumbtack的實(shí)戰(zhàn)分享!歡迎報(bào)名
    的頭像 發(fā)表于 11-06 14:59 ?412次閱讀
    Atlassian<b class='flag-5'>研討會(huì)</b><b class='flag-5'>預(yù)告</b> | 探討<b class='flag-5'>AI</b>在服務(wù)管理中的應(yīng)用現(xiàn)狀、實(shí)戰(zhàn)案例、面臨的挑戰(zhàn)與趨勢(shì)等

    MathWorks公司將舉辦線上專題研討會(huì)

    MathWorks 公司將于 11 月 14 日 (周四)下午 14:00 通過(guò)騰訊會(huì)議舉行主題為 《基于模型的設(shè)計(jì)開(kāi)發(fā)符合 ISO 26262 和 DO-178C 的應(yīng)用軟件》 的專題研討會(huì),誠(chéng)邀您參會(huì)。
    的頭像 發(fā)表于 10-31 16:29 ?646次閱讀

    開(kāi)始報(bào)名!PCB/封裝設(shè)計(jì)及系統(tǒng) SI/PI/Thermal 仿真專場(chǎng)研討會(huì)——2024 Cadence 中國(guó)技術(shù)巡回研討會(huì)

    2024Cadence中國(guó)技術(shù)巡回研討會(huì)—PCB,封裝設(shè)計(jì)及系統(tǒng)SI/PI/Thermal仿真專場(chǎng)研討會(huì)將于10月下旬在北京與深圳召開(kāi)。本次線下研討會(huì)將聚焦于電子設(shè)計(jì)自動(dòng)化領(lǐng)域的最新技術(shù)發(fā)展和成果
    的頭像 發(fā)表于 09-28 08:02 ?621次閱讀
    開(kāi)始<b class='flag-5'>報(bào)名</b>!PCB/封裝設(shè)計(jì)及系統(tǒng) SI/PI/Thermal 仿真專場(chǎng)<b class='flag-5'>研討會(huì)</b>——2024 Cadence 中國(guó)技術(shù)巡回<b class='flag-5'>研討會(huì)</b>