LLM共0篇 第3页
LLM
60个AIGC专业术语手册;5种大模型微调方法总结;大模型创业潮成败点评;AIGC通用大模型产品测评报告 | ShowMeAI日报-五八三

60个AIGC专业术语手册;5种大模型微调方法总结;大模型创业潮成败点评;AIGC通用大模型产品测评报告 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? ChatGLM 金融大模型挑战赛,冠军送12B模型授权+30W算力 GLM大模型联合安硕信息、阿里云、魔搭社区、北京交通大学...
admin的头像-五八三admin2年前
0230
实用!SD人物表情提示词合辑;秒变大神的Python速查表;开源LLM微调训练指南;LLM开发必修课 | ShowMeAI日报-五八三

实用!SD人物表情提示词合辑;秒变大神的Python速查表;开源LLM微调训练指南;LLM开发必修课 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 太实用了!Stable Diffusion 的24个表情提示词 Pensive 沉思 Smiling 微笑 Disgusted 厌恶 Laughing 大笑 Shocked...
admin的头像-五八三admin2年前
0190
16K个大语言模型的进化树;81个在线可玩的AI游戏;AI提示工程的终极指南;音频Transformers课程 | ShowMeAI日报-五八三

16K个大语言模型的进化树;81个在线可玩的AI游戏;AI提示工程的终极指南;音频Transformers课程 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? LLM 进化树升级版!清晰展示 15821 个大语言模型的关系 这张进化图来自于论文 「On the Origin of LLMs: An Evolu...
admin的头像-五八三admin2年前
0380
NCCL源码解析⑤:路径计算-五八三

NCCL源码解析⑤:路径计算

作者|KIDGINBROOK 更新|潘丽晨 上节NCCL完成了对机器PCI系统拓扑的建图,其中建好的图如下所示,其中GPU之间是通过NVLink连接起来的。 为了方便之后的搜索channel,接下来NCCL会先计算GPU和NI...
admin的头像-五八三admin2年前
0160

大模型参数高效微调技术实战(一)-PEFT概述及环境搭建

本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! 随着,ChatGPT 迅速爆火,引发了大模型的时代变革。然而对于普通大众来说,进行大模型的预训练或者...
admin的头像-五八三admin2年前
06060
智能运维进入6.0时代,CloudwiseGPT运维大语言模型强势来袭!-五八三

智能运维进入6.0时代,CloudwiseGPT运维大语言模型强势来袭!

大语言模型(Large Laungage Models,LLMs),是一种基于机器学习技术训练的复杂模型,能够理解和生成人类语言。大语言模型已经被广泛应用在各种场景中,包括生成文章、回答问题、写作辅助、聊...
admin的头像-五八三admin2年前
0160
如何使用 Colab 训练 Alpaca-LoRa-五八三

如何使用 Colab 训练 Alpaca-LoRa

本文主要参考视频《AI大模型训练-第四课 | 模型微调与数据安全:部署属于你自己的“大”语言模型》,介绍如何使用 Alpaca-LoRa 训练和部署模型。在训练过程中使用租借的 A100,总耗时2小时43分4...
admin的头像-五八三admin2年前
090
用 Hugging Face 推理端点部署 LLM-五八三

用 Hugging Face 推理端点部署 LLM

开源的 LLM,如 Falcon、(Open-)LLaMA、X-Gen、StarCoder 或 RedPajama,近几个月来取得了长足的进展,能够在某些用例中与闭源模型如 ChatGPT 或 GPT4 竞争。然而,有效且优化地部署这些模型仍...
admin的头像-五八三admin2年前
0130
CV大模型系列之:扩散模型基石DDPM(源码解读与实操篇)-五八三

CV大模型系列之:扩散模型基石DDPM(源码解读与实操篇)

⚠️⚠️⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! 终于来到扩散模型DDPM系列的最后一篇:源码解读了。本文将配合详细的图例,来为大家解...
admin的头像-五八三admin2年前
0120
仅用61行代码,你也能从零训练大模型-五八三

仅用61行代码,你也能从零训练大模型

腾小云导读 本文并非基于微调训练模型,而是从头开始训练出一个全新的大语言模型的硬核教程。看完本篇,你将了解训练出一个大模型的环境准备、数据准备,生成分词,模型训练、测试模型等环节分...
admin的头像-五八三admin2年前
0170
Open LLM 排行榜近况-五八三

Open LLM 排行榜近况

Open LLM 排行榜是 Hugging Face 设立的一个用于评测开放大语言模型的公开榜单。最近,随着 Falcon ? 的发布并在 Open LLM 排行榜 上疯狂屠榜,围绕这个榜单在推特上掀起了一轮热烈的讨论。 讨...
admin的头像-五八三admin2年前
0120
如何使用 Megatron-LM 训练语言模型-五八三

如何使用 Megatron-LM 训练语言模型

在 PyTorch 中训练大语言模型不仅仅是写一个训练循环这么简单。我们通常需要将模型分布在多个设备上,并使用许多优化技术以实现稳定高效的训练。Hugging Face ? Accelerate 的创建是为了支持跨...
admin的头像-五八三admin2年前
070