「AI新青年講座」由智東西公開課出品,致力于邀請青年學(xué)者,主講他們在生成式AI、LLM、計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)等人工智能領(lǐng)域的最新重要研究成果。

AI新青年是加速人工智能前沿研究的新生力量。AI新青年的視頻講解和直播答疑,將可以幫助大家增進(jìn)對人工智能前沿研究的理解,相應(yīng)領(lǐng)域的專業(yè)知識也能夠得以積累加深。同時,通過與AI新青年的直接交流,大家在AI學(xué)習(xí)和應(yīng)用AI的過程中遇到的問題,也能夠盡快解決。

7月起,AI 新青年講座開辟推出「大型語言模型專場」。阿卜杜拉國王科技大學(xué)在讀博士朱德堯、新加坡國立大學(xué)在讀博士薛復(fù)昭、美國威斯康星大學(xué)麥迪遜分校在讀博士柳昊天和加州大學(xué)伯克利分校人工智能實(shí)驗(yàn)室(BAIR)在讀博士張?zhí)炀鶎⑴c此次專場。

四位 AI 新青年將分別針對 MiniGPT-4、LLaVA、Gorilla,以及大型語言模型所面臨的 Token 危機(jī)進(jìn)行直播講解。

近來,大型語言模型備受關(guān)注,ChatGPT 和 GPT-4 都展現(xiàn)了非常令人吃驚的能力,在聊天對話、數(shù)學(xué)推理和代碼生成等方面尤為顯著。但 LLM 依然受限于一個固定的權(quán)重集內(nèi)可存儲的信息以及它們可使用一個靜態(tài)的計(jì)算圖(computation graph)和有限上下文所能計(jì)算的東西。在通過 API 調(diào)用使用工具時,它們無法生成準(zhǔn)確的輸入?yún)?shù),并且容易產(chǎn)生錯誤的API調(diào)用用法幻覺。

ToolFormer等文章為大家展現(xiàn)了一個語言模型和工具互動的范例,但其實(shí)用的工具非常局限。來自加州大學(xué)伯克利分校人工智能實(shí)驗(yàn)室(BAIR)和微軟研究院的研究者們提出了一個和 1600+ API互動的語言模型:Gorilla。該模型基于 LLaMA 進(jìn)行微調(diào),能根據(jù)用戶輸入的自然語言為用戶選擇合適的 API 來執(zhí)行對應(yīng)任務(wù)。理論上講,這個模型可以根據(jù)用戶需求調(diào)用其它各種 AI 模型,因此 Gorilla 有望成為一個統(tǒng)御其它 AI 的 AI 模型。

為了評估模型的能力,研究者們還推出了 APIBench。這是一個包含 HuggingFace、TorchHub 和 TensorHub API 的全面數(shù)據(jù)集。而 Gorilla 在 HuggingFace,Tensor Hub 和 Torch Hub 上的表現(xiàn)都超過了 GPT-4,在很大程度上也減少了語言模型的幻想,能更準(zhǔn)確的使用 API。

Gorilla:https://github.com/ShishirPatil/gorilla/

7月26日上午10點(diǎn),Gorilla 一作、加州大學(xué)伯克利分校人工智能實(shí)驗(yàn)室(BAIR)在讀博士張?zhí)炀?,將圍繞主題《Gorilla:鏈接海量API的大型語言模型》對 Gorilla 進(jìn)行深度講解。

第四講

主 題
《Gorilla:鏈接海量API的大型語言模型》

提 綱
1、LLM 與 API 交互的研究
2、LLM 調(diào)用 API 和 Service 的局限性
3、針對 API 調(diào)用任務(wù)微調(diào)的 LLaMA-7B 模型: Gorilla
4、在TorchHub、TensorHub 和 HuggingFace 上的應(yīng)用表現(xiàn)

主 講 人
張?zhí)炀?,加州大學(xué)伯克利分校人工智能實(shí)驗(yàn)室(BAIR)在讀博士;導(dǎo)師是joseph gonzalez教授;研究方向主要涉及強(qiáng)化學(xué)習(xí)以及強(qiáng)化學(xué)習(xí)在語言模型/多模態(tài)模型中的應(yīng)用;和sergey levine教授、pieter abbeel教授、denny zhou博士以及yuandong tian博士都有深度合作;曾在Meta AI Research和Google Brain實(shí)習(xí),近期的研究主要集中于基于語言模型的自動化。

直 播 時 間
7月26日10:00