LLM共0篇 第2页
LLM

大语言模型食用指南? | 人工智能27期

? 人工智能周刊 Hello,新一期的人工智能周刊又和大家如约见面了。人工智能周刊专注于发掘站内优质人工智能的创作者和优质内容。 掘金会对近期(7-14 天)社区人工智能技术好文进行挖掘和筛选,...
admin的头像-五八三admin2年前
0130
大模型参数高效微调技术实战(四)-Prefix Tuning / P-Tuning v2-五八三

大模型参数高效微调技术实战(四)-Prefix Tuning / P-Tuning v2

随着,ChatGPT 迅速爆火,引发了大模型的时代变革。然而对于普通大众来说,进行大模型的预训练或者全量微调遥不可及。由此,催生了各种参数高效微调技术,让科研人员或者普通开发者有机会尝试微...
admin的头像-五八三admin2年前
090
LangChain:打造自己的LLM应用 | 京东云技术团队-五八三

LangChain:打造自己的LLM应用 | 京东云技术团队

1、LangChain是什么 LangChain是一个框架,用于开发由LLM驱动的应用程序。可以简单认为是LLM领域的Spring,以及开源版的ChatGPT插件系统。核心的2个功能为: 1)可以将 LLM 模型与外部数据源进...
admin的头像-五八三admin2年前
0160
大模型分布式训练并行技术(三)-流水线并行-五八三

大模型分布式训练并行技术(三)-流水线并行

本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! 近年来,随着Transformer、MOE 架构的提出,使得深度学习模型轻松突破上万亿规模参数,传统的单机单...
admin的头像-五八三admin2年前
0120
美团2024校招6000人;伯克利博士讲Llama 2技术细节;互联网转行AIGC最全指北;技术进步周期与创客崛起 | ShowMeAI日报-五八三

美团2024校招6000人;伯克利博士讲Llama 2技术细节;互联网转行AIGC最全指北;技术进步周期与创客崛起 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 美团 2024 届校园招聘将录用 6000 人,技术类岗位扩招超 50% 美团招聘公众号宣布启动 2024 届校园招聘!此次招聘...
admin的头像-五八三admin2年前
0110
通俗解构语言大模型的工作原理-五八三

通俗解构语言大模型的工作原理

语言大模型内部究竟是如何工作的?本文用最少的数学知识和术语进行解释。 本文作者Tim Lee曾任职科技媒体Ars Technica,他近期推出了一份Newsletter《Understanding AI》,主要探讨人工智能的工...
admin的头像-五八三admin2年前
0110
从0到1!得物如何打造通用大模型训练和推理平台-五八三

从0到1!得物如何打造通用大模型训练和推理平台

1.背景 近期,GPT 大模型的发布给自然语言处理(NLP)领域带来了令人震撼的体验。随着这一事件的发生,一系列开源大模型也迅速崛起。依据一些评估机构的评估,这些开源模型大模型的表现也相当不...
admin的头像-五八三admin2年前
0160
四两拨千斤,训练大模型的PEFT方法-五八三

四两拨千斤,训练大模型的PEFT方法

自然语言处理进入大语言模型(Large Language Model, LLM)时代之后,模型的参数量级越来越庞大,以稍早之前的GPT-3为例,它有175B即1亿7千5百万参数,而ChatGPT及后续模型则更大。一方面大语言...
admin的头像-五八三admin2年前
0210
绝美!轮到AI写真爆火了!18种AI视频制作教程;Llama 2微调的极速指南;Nijijourney官方AI绘画课 | ShowMeAI日报-五八三

绝美!轮到AI写真爆火了!18种AI视频制作教程;Llama 2微调的极速指南;Nijijourney官方AI绘画课 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 摄影写真面临AI技术洗牌,一键生成杂志大片的时代来了 软件:midjourney & Stable Diffusion 模型:moonmix_u...
admin的头像-五八三admin2年前
0100
Self Attention 自注意力机制-五八三

Self Attention 自注意力机制

self attention是提出Transformer的论文《Attention is all you need》中提出的一种新的注意力机制,这篇博文仅聚焦于self attention,不谈transformer的其他机制。Self attention直观上与传统S...
admin的头像-五八三admin2年前
030
nlp中的预训练语言模型总结(单向模型、BERT系列模型、XLNet)-五八三

nlp中的预训练语言模型总结(单向模型、BERT系列模型、XLNet)

本文转载自JayLou娄杰,知乎专栏《高能NLP》作者,已与原作者取得联系,已获授权。原文地址:zhuanlan.zhihu.com/p/76912493 zhuanlan.zhihu.com/p/115014536 本文以QA形式总结对比了nlp中的预...
admin的头像-五八三admin2年前
040
GPT和婴儿的学习路径竟然如此相似?丨论文解读-五八三

GPT和婴儿的学习路径竟然如此相似?丨论文解读

零、前言 ?本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ?欢迎访问: 个人博客:conqueror712.github.io/ 知乎:www.zhihu.com/people/soeu… Bil...
admin的头像-五八三admin2年前
050
LangChain:大语言模型的新篇章-五八三

LangChain:大语言模型的新篇章

一、引言 近期,大型语言模型(LLM)如GPT系列模型引领了人工智能领域的一场技术革命。开发者们都在利用这些LLM进行各种尝试,虽然已经产生了许多有趣的应用,但是单独使用这些LLM往往难以构建功能强...
admin的头像-五八三admin2年前
0100
奇特!AI换脸让康熙本人出演电视剧;LLM超全综述资料;业内深聊游戏行业中AI应用实践;吴恩达联合Hugging Face再出新课 | ShowMeAI日报-五八三

奇特!AI换脸让康熙本人出演电视剧;LLM超全综述资料;业内深聊游戏行业中AI应用实践;吴恩达联合Hugging Face再出新课 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? B站UP主再出「邪招」,让康熙本人出演电视剧名场面 B站UP主 @PAC_松柏 结合康熙画像和电视剧画面,对视频人物角色...
admin的头像-五八三admin2年前
080
Llama2 论文中译版——开放式基础和微调聊天模型-五八三

Llama2 论文中译版——开放式基础和微调聊天模型

Llama 2:开放式基础和微调聊天模型 写在前头 因为最近一直在使用 LLM 工具,所以在学习 Llama 2:开放式基础和微调聊天模型 这篇论文的期间,顺手将内容翻译了过来。 整片译文是由 ChatGPT3.5...
admin的头像-五八三admin2年前
0310
图技术在 LLM 下的应用:知识图谱驱动的大语言模型 Llama Index-五八三

图技术在 LLM 下的应用:知识图谱驱动的大语言模型 Llama Index

LLM 如火如荼地发展了大半年,各类大模型和相关框架也逐步成型,可被大家应用到业务实际中。在这个过程中,我们可能会遇到一类问题是:现有的哪些数据,如何更好地与 LLM 对接上。像是大家都在...
admin的头像-五八三admin2年前
040
宝藏工具!逐行解释AI代码;2023上半年AI发展全盘回顾;LLM应用开发经验分享;如何评估一个大语言模型 | ShowMeAI日报-五八三

宝藏工具!逐行解释AI代码;2023上半年AI发展全盘回顾;LLM应用开发经验分享;如何评估一个大语言模型 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 如何拼出 Twitter 新 LOGO 的字母 ? Twitter 新 LOGO 是一个双线体大写字母 ? (U+1D54F),是一个 Unicode 字符。...
admin的头像-五八三admin2年前
0110
基于Megatron-LM从0到1完成GPT2模型预训练、模型评估及推理-五八三

基于Megatron-LM从0到1完成GPT2模型预训练、模型评估及推理

本文为稀土掘金技术社区首发签约...
admin的头像-五八三admin2年前
070
提示工程101|与 AI 交谈的技巧和艺术-五八三

提示工程101|与 AI 交谈的技巧和艺术

随着 ChatGPT 的问世,人工智能(AI)新时代也正式开启。ChatGPT 是一种语言模型。它与用户进行对话交互,以便用户输入问题或提示,模型响应,然后对话可以继续来回进行,类似于在消息传递应用...
admin的头像-五八三admin2年前
0130
Llama 2 来袭 - 在 Hugging Face 上玩转它-五八三

Llama 2 来袭 – 在 Hugging Face 上玩转它

引言 今天,Meta 发布了 Llama 2,其包含了一系列最先进的开放大语言模型,我们很高兴能够将其全面集成入 Hugging Face,并全力支持其发布。 Llama 2 的社区许可证相当宽松,且可商用。其代码、...
admin的头像-五八三admin2年前
0140