LLM共0篇
LLM

大模型参数高效微调技术实战(一)-PEFT概述及环境搭建

本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! 随着,ChatGPT 迅速爆火,引发了大模型的时代变革。然而对于普通大众来说,进行大模型的预训练或者...
admin的头像-五八三admin2年前
06060
【奶奶看了都会】2分钟学会制作最近特火的ikun幻术图-五八三

【奶奶看了都会】2分钟学会制作最近特火的ikun幻术图

黄昏见证虔诚的信徒,巅峰诞生虚伪的拥护 1.效果展示 最近ikun幻术图特别火啊,在网上能找到各种各样的ikun姿势图片,这些图片都是AI绘制的,能和风景完美融合在一起,今天小卷就来教大家怎么做...
admin的头像-五八三admin2年前
0710
CV大模型系列之:多模态经典之作CLIP,探索图文结合的奥秘-五八三

CV大模型系列之:多模态经典之作CLIP,探索图文结合的奥秘

⚠️⚠️⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! 在本系列之前的文章中,我们曾经讲过VIT(Vision Transformer),一个借助Transformer ...
admin的头像-五八三admin2年前
0610
大模型国产化适配4-基于昇腾910使用LLaMA-13B进行多机多卡训练-五八三

大模型国产化适配4-基于昇腾910使用LLaMA-13B进行多机多卡训练

本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! 随着 ChatGPT 的现象级走红,引领了 AI 大模型时代的变革,从而导致 AI 算力日益紧缺。与此同时,中...
admin的头像-五八三admin2年前
0530
16K个大语言模型的进化树;81个在线可玩的AI游戏;AI提示工程的终极指南;音频Transformers课程 | ShowMeAI日报-五八三

16K个大语言模型的进化树;81个在线可玩的AI游戏;AI提示工程的终极指南;音频Transformers课程 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? LLM 进化树升级版!清晰展示 15821 个大语言模型的关系 这张进化图来自于论文 「On the Origin of LLMs: An Evolu...
admin的头像-五八三admin2年前
0380
Llama2 论文中译版——开放式基础和微调聊天模型-五八三

Llama2 论文中译版——开放式基础和微调聊天模型

Llama 2:开放式基础和微调聊天模型 写在前头 因为最近一直在使用 LLM 工具,所以在学习 Llama 2:开放式基础和微调聊天模型 这篇论文的期间,顺手将内容翻译了过来。 整片译文是由 ChatGPT3.5...
admin的头像-五八三admin2年前
0310
使用 OpenAI、LangChain 和 LlamaIndex 构建 Knowledge-五八三

使用 OpenAI、LangChain 和 LlamaIndex 构建 Knowledge

AI 时代的到来,可以做和想象的事情很多,不管是什么类型的场景,宗旨主要是提高效率。构建自己的 DevSecOps 知识库,可以在保障数据安全性和效率。而使用 OpenAI、LangChain 和 LlamaIndex 等...
admin的头像-五八三admin2年前
0300
LLM也能用小黄鸭调试法?丨论文解读-五八三

LLM也能用小黄鸭调试法?丨论文解读

零、前言 ?本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ?欢迎访问: 个人博客:conqueror712.github.io/ 知乎:www.zhihu.com/people/soeu… Bil...
admin的头像-五八三admin2年前
0290
大模型参数高效微调技术实战(六)-IA3-五八三

大模型参数高效微调技术实战(六)-IA3

随着,ChatGPT 迅速爆火,引发了大模型的时代变革。然而对于普通大众来说,进行大模型的预训练或者全量微调遥不可及。由此,催生了各种参数高效微调技术,让科研人员或者普通开发者有机会尝试微...
admin的头像-五八三admin2年前
0280
在大模型的浪潮下,我对“小模型”的探索与实践之路-五八三

在大模型的浪潮下,我对“小模型”的探索与实践之路

本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! 如今“大模型”一词很火,但我却找不到它的定义。目前业内只存在大语言模型 (large language model,...
admin的头像-五八三admin2年前
0260
0814 早早聊 AGI 资讯|GPT-5 商标已注册、欧洲气象机构使用中国大模型盘古、DEF CON 黑客大会人工智能数学表现仍堪忧...-五八三

0814 早早聊 AGI 资讯|GPT-5 商标已注册、欧洲气象机构使用中国大模型盘古、DEF CON 黑客大会人工智能数学表现仍堪忧…

 ?? AGI 早早聊知识库 「 行业动态 」 ◇ GPT-5 商标已注册 ? News OpenAI 提交 GPT-5 商标申请,引发关于下一代语言模型的猜测,秘密发布了 ChatGPT 的代码解释器,可能连接了 GPT-4.5 和 GP...
admin的头像-五八三admin2年前
0240
60个AIGC专业术语手册;5种大模型微调方法总结;大模型创业潮成败点评;AIGC通用大模型产品测评报告 | ShowMeAI日报-五八三

60个AIGC专业术语手册;5种大模型微调方法总结;大模型创业潮成败点评;AIGC通用大模型产品测评报告 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? ChatGLM 金融大模型挑战赛,冠军送12B模型授权+30W算力 GLM大模型联合安硕信息、阿里云、魔搭社区、北京交通大学...
admin的头像-五八三admin2年前
0230
大模型参数高效微调技术实战(五)-LoRA-五八三

大模型参数高效微调技术实战(五)-LoRA

随着,ChatGPT 迅速爆火,引发了大模型的时代变革。然而对于普通大众来说,进行大模型的预训练或者全量微调遥不可及。由此,催生了各种参数高效微调技术,让科研人员或者普通开发者有机会尝试微...
admin的头像-五八三admin2年前
0230
四两拨千斤,训练大模型的PEFT方法-五八三

四两拨千斤,训练大模型的PEFT方法

自然语言处理进入大语言模型(Large Language Model, LLM)时代之后,模型的参数量级越来越庞大,以稍早之前的GPT-3为例,它有175B即1亿7千5百万参数,而ChatGPT及后续模型则更大。一方面大语言...
admin的头像-五八三admin2年前
0210

在langchain中使用自定义example selector

简介 在之前的文章中,我们提到了可以在跟大模型交互的时候,给大模型提供一些具体的例子内容,方便大模型从这些内容中获取想要的答案。这种方便的机制在langchain中叫做FewShotPromptTemplate...
admin的头像-五八三admin2年前
0190
实用!SD人物表情提示词合辑;秒变大神的Python速查表;开源LLM微调训练指南;LLM开发必修课 | ShowMeAI日报-五八三

实用!SD人物表情提示词合辑;秒变大神的Python速查表;开源LLM微调训练指南;LLM开发必修课 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 太实用了!Stable Diffusion 的24个表情提示词 Pensive 沉思 Smiling 微笑 Disgusted 厌恶 Laughing 大笑 Shocked...
admin的头像-五八三admin2年前
0190
仅用61行代码,你也能从零训练大模型-五八三

仅用61行代码,你也能从零训练大模型

腾小云导读 本文并非基于微调训练模型,而是从头开始训练出一个全新的大语言模型的硬核教程。看完本篇,你将了解训练出一个大模型的环境准备、数据准备,生成分词,模型训练、测试模型等环节分...
admin的头像-五八三admin2年前
0170
从0到1!得物如何打造通用大模型训练和推理平台-五八三

从0到1!得物如何打造通用大模型训练和推理平台

1.背景 近期,GPT 大模型的发布给自然语言处理(NLP)领域带来了令人震撼的体验。随着这一事件的发生,一系列开源大模型也迅速崛起。依据一些评估机构的评估,这些开源模型大模型的表现也相当不...
admin的头像-五八三admin2年前
0160

在 “Baby 容器” WasmEdge 里运行 Baby 羊驼 llama 2

昨天,特斯拉前 AI 总监、OpenAI 联合创始人 Andrej Karpathy 开源了 llama2.c 。 只用 500 行纯 C 语言就能训练和推理 llama 2 模型的框架,没有任何繁杂的 python 依赖。这个项目一推出就受到...
admin的头像-五八三admin2年前
0160
智能运维进入6.0时代,CloudwiseGPT运维大语言模型强势来袭!-五八三

智能运维进入6.0时代,CloudwiseGPT运维大语言模型强势来袭!

大语言模型(Large Laungage Models,LLMs),是一种基于机器学习技术训练的复杂模型,能够理解和生成人类语言。大语言模型已经被广泛应用在各种场景中,包括生成文章、回答问题、写作辅助、聊...
admin的头像-五八三admin2年前
0160