LLM共0篇
LLM
通俗解构语言大模型的工作原理-五八三

通俗解构语言大模型的工作原理

语言大模型内部究竟是如何工作的?本文用最少的数学知识和术语进行解释。 本文作者Tim Lee曾任职科技媒体Ars Technica,他近期推出了一份Newsletter《Understanding AI》,主要探讨人工智能的工...
admin的头像-五八三admin2年前
0110
如何使用 Colab 训练 Alpaca-LoRa-五八三

如何使用 Colab 训练 Alpaca-LoRa

本文主要参考视频《AI大模型训练-第四课 | 模型微调与数据安全:部署属于你自己的“大”语言模型》,介绍如何使用 Alpaca-LoRa 训练和部署模型。在训练过程中使用租借的 A100,总耗时2小时43分4...
admin的头像-五八三admin2年前
090
LLM也能用小黄鸭调试法?丨论文解读-五八三

LLM也能用小黄鸭调试法?丨论文解读

零、前言 ?本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ?欢迎访问: 个人博客:conqueror712.github.io/ 知乎:www.zhihu.com/people/soeu… Bil...
admin的头像-五八三admin2年前
0290
宝藏工具!逐行解释AI代码;2023上半年AI发展全盘回顾;LLM应用开发经验分享;如何评估一个大语言模型 | ShowMeAI日报-五八三

宝藏工具!逐行解释AI代码;2023上半年AI发展全盘回顾;LLM应用开发经验分享;如何评估一个大语言模型 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 如何拼出 Twitter 新 LOGO 的字母 ? Twitter 新 LOGO 是一个双线体大写字母 ? (U+1D54F),是一个 Unicode 字符。...
admin的头像-五八三admin2年前
0110
大模型参数高效微调技术实战(六)-IA3-五八三

大模型参数高效微调技术实战(六)-IA3

随着,ChatGPT 迅速爆火,引发了大模型的时代变革。然而对于普通大众来说,进行大模型的预训练或者全量微调遥不可及。由此,催生了各种参数高效微调技术,让科研人员或者普通开发者有机会尝试微...
admin的头像-五八三admin2年前
0280
美团2024校招6000人;伯克利博士讲Llama 2技术细节;互联网转行AIGC最全指北;技术进步周期与创客崛起 | ShowMeAI日报-五八三

美团2024校招6000人;伯克利博士讲Llama 2技术细节;互联网转行AIGC最全指北;技术进步周期与创客崛起 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 美团 2024 届校园招聘将录用 6000 人,技术类岗位扩招超 50% 美团招聘公众号宣布启动 2024 届校园招聘!此次招聘...
admin的头像-五八三admin2年前
0110
智能运维进入6.0时代,CloudwiseGPT运维大语言模型强势来袭!-五八三

智能运维进入6.0时代,CloudwiseGPT运维大语言模型强势来袭!

大语言模型(Large Laungage Models,LLMs),是一种基于机器学习技术训练的复杂模型,能够理解和生成人类语言。大语言模型已经被广泛应用在各种场景中,包括生成文章、回答问题、写作辅助、聊...
admin的头像-五八三admin2年前
0160
CV大模型系列之:多模态经典之作CLIP,探索图文结合的奥秘-五八三

CV大模型系列之:多模态经典之作CLIP,探索图文结合的奥秘

⚠️⚠️⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! 在本系列之前的文章中,我们曾经讲过VIT(Vision Transformer),一个借助Transformer ...
admin的头像-五八三admin2年前
0610
Llama2 论文中译版——开放式基础和微调聊天模型-五八三

Llama2 论文中译版——开放式基础和微调聊天模型

Llama 2:开放式基础和微调聊天模型 写在前头 因为最近一直在使用 LLM 工具,所以在学习 Llama 2:开放式基础和微调聊天模型 这篇论文的期间,顺手将内容翻译了过来。 整片译文是由 ChatGPT3.5...
admin的头像-五八三admin2年前
0310
0814 早早聊 AGI 资讯|GPT-5 商标已注册、欧洲气象机构使用中国大模型盘古、DEF CON 黑客大会人工智能数学表现仍堪忧...-五八三

0814 早早聊 AGI 资讯|GPT-5 商标已注册、欧洲气象机构使用中国大模型盘古、DEF CON 黑客大会人工智能数学表现仍堪忧…

 ?? AGI 早早聊知识库 「 行业动态 」 ◇ GPT-5 商标已注册 ? News OpenAI 提交 GPT-5 商标申请,引发关于下一代语言模型的猜测,秘密发布了 ChatGPT 的代码解释器,可能连接了 GPT-4.5 和 GP...
admin的头像-五八三admin2年前
0240
大模型分布式训练并行技术(三)-流水线并行-五八三

大模型分布式训练并行技术(三)-流水线并行

本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! 近年来,随着Transformer、MOE 架构的提出,使得深度学习模型轻松突破上万亿规模参数,传统的单机单...
admin的头像-五八三admin2年前
0120

大模型参数高效微调技术实战(一)-PEFT概述及环境搭建

本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! 随着,ChatGPT 迅速爆火,引发了大模型的时代变革。然而对于普通大众来说,进行大模型的预训练或者...
admin的头像-五八三admin2年前
06060

在langchain中使用自定义example selector

简介 在之前的文章中,我们提到了可以在跟大模型交互的时候,给大模型提供一些具体的例子内容,方便大模型从这些内容中获取想要的答案。这种方便的机制在langchain中叫做FewShotPromptTemplate...
admin的头像-五八三admin2年前
0190
奇特!AI换脸让康熙本人出演电视剧;LLM超全综述资料;业内深聊游戏行业中AI应用实践;吴恩达联合Hugging Face再出新课 | ShowMeAI日报-五八三

奇特!AI换脸让康熙本人出演电视剧;LLM超全综述资料;业内深聊游戏行业中AI应用实践;吴恩达联合Hugging Face再出新课 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? B站UP主再出「邪招」,让康熙本人出演电视剧名场面 B站UP主 @PAC_松柏 结合康熙画像和电视剧画面,对视频人物角色...
admin的头像-五八三admin2年前
080
【奶奶看了都会】2分钟学会制作最近特火的ikun幻术图-五八三

【奶奶看了都会】2分钟学会制作最近特火的ikun幻术图

黄昏见证虔诚的信徒,巅峰诞生虚伪的拥护 1.效果展示 最近ikun幻术图特别火啊,在网上能找到各种各样的ikun姿势图片,这些图片都是AI绘制的,能和风景完美融合在一起,今天小卷就来教大家怎么做...
admin的头像-五八三admin2年前
0710
LangChain:打造自己的LLM应用 | 京东云技术团队-五八三

LangChain:打造自己的LLM应用 | 京东云技术团队

1、LangChain是什么 LangChain是一个框架,用于开发由LLM驱动的应用程序。可以简单认为是LLM领域的Spring,以及开源版的ChatGPT插件系统。核心的2个功能为: 1)可以将 LLM 模型与外部数据源进...
admin的头像-五八三admin2年前
0160
NCCL源码解析⑤:路径计算-五八三

NCCL源码解析⑤:路径计算

作者|KIDGINBROOK 更新|潘丽晨 上节NCCL完成了对机器PCI系统拓扑的建图,其中建好的图如下所示,其中GPU之间是通过NVLink连接起来的。 为了方便之后的搜索channel,接下来NCCL会先计算GPU和NI...
admin的头像-五八三admin2年前
0160
0808 早早聊 AGI 资讯|Meta 解散 ESMFold 团队、生成式 AI 被质疑有热度没收入、云从科技 LLM 刷新 4 项世界纪录...-五八三

0808 早早聊 AGI 资讯|Meta 解散 ESMFold 团队、生成式 AI 被质疑有热度没收入、云从科技 LLM 刷新 4 项世界纪录…

 ?? AGI 早早聊知识库 「 行业动态 」 ◇ Meta 解散 ESMFold 团队,转向商业 AI ? News Meta 解雇 ESMFold 项目团队,放弃纯科学项目,近期进行管理重组,影响约 20,000 名员工,专注盈利和生...
admin的头像-五八三admin2年前
0120
LangChain:大语言模型的新篇章-五八三

LangChain:大语言模型的新篇章

一、引言 近期,大型语言模型(LLM)如GPT系列模型引领了人工智能领域的一场技术革命。开发者们都在利用这些LLM进行各种尝试,虽然已经产生了许多有趣的应用,但是单独使用这些LLM往往难以构建功能强...
admin的头像-五八三admin2年前
0100
0815 早早聊 AGI 资讯|讯飞星火认知大模型 V2.0 升级发布、美国政府官员参加斯坦福大学 AI 训练营、OpenAI 濒临破产?-五八三

0815 早早聊 AGI 资讯|讯飞星火认知大模型 V2.0 升级发布、美国政府官员参加斯坦福大学 AI 训练营、OpenAI 濒临破产?

 ?? AGI 早早聊知识库 「 行业动态 」 ◇ 美国政府官员,正在参加斯坦福大学的 AI 训练营 ? News 美国国防部宣布成立生成式人工智能特别工作组。政治家和政策制定者参加了斯坦福大学的训练营...
admin的头像-五八三admin2年前
0140