LLM-五八三

本文为稀土掘金技术社区首发签约文章，30天内禁止转载，30天后未获授权禁止转载，侵权必究！随着，ChatGPT 迅速爆火，引发了大模型的时代变革。然而对于普通大众来说，进行大模型的预训练或者...

admin2年前

06060

【奶奶看了都会】2分钟学会制作最近特火的ikun幻术图

黄昏见证虔诚的信徒，巅峰诞生虚伪的拥护 1.效果展示最近ikun幻术图特别火啊，在网上能找到各种各样的ikun姿势图片，这些图片都是AI绘制的，能和风景完美融合在一起，今天小卷就来教大家怎么做...

admin2年前

0710

CV大模型系列之：多模态经典之作CLIP，探索图文结合的奥秘

⚠️⚠️⚠️本文为稀土掘金技术社区首发签约文章，30天内禁止转载，30天后未获授权禁止转载，侵权必究！在本系列之前的文章中，我们曾经讲过VIT（Vision Transformer），一个借助Transformer ...

admin2年前

0610

大模型国产化适配4-基于昇腾910使用LLaMA-13B进行多机多卡训练

本文为稀土掘金技术社区首发签约文章，30天内禁止转载，30天后未获授权禁止转载，侵权必究！随着 ChatGPT 的现象级走红，引领了 AI 大模型时代的变革，从而导致 AI 算力日益紧缺。与此同时，中...

admin2年前

0530

16K个大语言模型的进化树；81个在线可玩的AI游戏；AI提示工程的终极指南；音频Transformers课程 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? LLM 进化树升级版！清晰展示 15821 个大语言模型的关系这张进化图来自于论文「On the Origin of LLMs: An Evolu...

admin2年前

0380

Llama2 论文中译版——开放式基础和微调聊天模型

Llama 2：开放式基础和微调聊天模型写在前头因为最近一直在使用 LLM 工具，所以在学习 Llama 2：开放式基础和微调聊天模型这篇论文的期间，顺手将内容翻译了过来。整片译文是由 ChatGPT3.5...

博客文章

admin2年前

0310

使用 OpenAI、LangChain 和 LlamaIndex 构建 Knowledge

AI 时代的到来，可以做和想象的事情很多，不管是什么类型的场景，宗旨主要是提高效率。构建自己的 DevSecOps 知识库，可以在保障数据安全性和效率。而使用 OpenAI、LangChain 和 LlamaIndex 等...

admin2年前

0300

LLM也能用小黄鸭调试法？丨论文解读

零、前言 ?本文为稀土掘金技术社区首发签约文章，30天内禁止转载，30天后未获授权禁止转载，侵权必究！ ?欢迎访问：个人博客：conqueror712.github.io/ 知乎：www.zhihu.com/people/soeu… Bil...

admin2年前

0290

大模型参数高效微调技术实战（六）-IA3

随着，ChatGPT 迅速爆火，引发了大模型的时代变革。然而对于普通大众来说，进行大模型的预训练或者全量微调遥不可及。由此，催生了各种参数高效微调技术，让科研人员或者普通开发者有机会尝试微...

admin2年前

0280

在大模型的浪潮下，我对“小模型”的探索与实践之路

本文为稀土掘金技术社区首发签约文章，30天内禁止转载，30天后未获授权禁止转载，侵权必究！如今“大模型”一词很火，但我却找不到它的定义。目前业内只存在大语言模型 (large language model,...

admin2年前

0260

0814 早早聊 AGI 资讯｜GPT-5 商标已注册、欧洲气象机构使用中国大模型盘古、DEF CON 黑客大会人工智能数学表现仍堪忧…

?? AGI 早早聊知识库「行业动态」 ◇ GPT-5 商标已注册 ? News OpenAI 提交 GPT-5 商标申请，引发关于下一代语言模型的猜测，秘密发布了 ChatGPT 的代码解释器，可能连接了 GPT-4.5 和 GP...

admin2年前

0240

60个AIGC专业术语手册；5种大模型微调方法总结；大模型创业潮成败点评；AIGC通用大模型产品测评报告 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? ChatGLM 金融大模型挑战赛，冠军送12B模型授权+30W算力 GLM大模型联合安硕信息、阿里云、魔搭社区、北京交通大学...

admin2年前

0230

大模型参数高效微调技术实战（五）-LoRA

admin2年前

0230

四两拨千斤，训练大模型的PEFT方法

自然语言处理进入大语言模型（Large Language Model, LLM）时代之后，模型的参数量级越来越庞大，以稍早之前的GPT-3为例，它有175B即1亿7千5百万参数，而ChatGPT及后续模型则更大。一方面大语言...

admin2年前

0210

在langchain中使用自定义example selector

简介在之前的文章中，我们提到了可以在跟大模型交互的时候，给大模型提供一些具体的例子内容，方便大模型从这些内容中获取想要的答案。这种方便的机制在langchain中叫做FewShotPromptTemplate...

博客文章

admin2年前

0190

实用！SD人物表情提示词合辑；秒变大神的Python速查表；开源LLM微调训练指南；LLM开发必修课 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 太实用了！Stable Diffusion 的24个表情提示词 Pensive 沉思 Smiling 微笑 Disgusted 厌恶 Laughing 大笑 Shocked...

admin2年前

0190

仅用61行代码，你也能从零训练大模型

腾小云导读本文并非基于微调训练模型，而是从头开始训练出一个全新的大语言模型的硬核教程。看完本篇，你将了解训练出一个大模型的环境准备、数据准备，生成分词，模型训练、测试模型等环节分...

admin2年前

0170

从0到1！得物如何打造通用大模型训练和推理平台

1.背景近期，GPT 大模型的发布给自然语言处理（NLP）领域带来了令人震撼的体验。随着这一事件的发生，一系列开源大模型也迅速崛起。依据一些评估机构的评估，这些开源模型大模型的表现也相当不...

admin2年前

0160

在 “Baby 容器” WasmEdge 里运行 Baby 羊驼 llama 2

昨天，特斯拉前 AI 总监、OpenAI 联合创始人 Andrej Karpathy 开源了 llama2.c 。只用 500 行纯 C 语言就能训练和推理 llama 2 模型的框架，没有任何繁杂的 python 依赖。这个项目一推出就受到...

admin2年前

0160

智能运维进入6.0时代，CloudwiseGPT运维大语言模型强势来袭！

大语言模型（Large Laungage Models，LLMs），是一种基于机器学习技术训练的复杂模型，能够理解和生成人类语言。大语言模型已经被广泛应用在各种场景中，包括生成文章、回答问题、写作辅助、聊...

admin2年前

0160

12 3 下一页