NLP共0篇
NLP
解密Prompt系列13. LLM Agent指令微调方案: Toolformer & Gorilla-五八三

解密Prompt系列13. LLM Agent指令微调方案: Toolformer & Gorilla

上一章我们介绍了基于Prompt范式的工具调用方案,这一章介绍基于模型微调,支持任意多工具组合调用,复杂调用的方案。多工具调用核心需要解决3个问题,在哪个位置进行工具调用(where), 从众多工...
admin的头像-五八三admin2年前
0140
循环神经网络介绍-五八三

循环神经网络介绍

循环神经网络(Recurrent Neural Network, RNN)是一种能够处理序列数据的神经网络,在自然语言处理、语音识别、手写识别等领域发挥着重要作用。相比普通的前馈神经网络,RNN可以捕捉时间序列数据中...
admin的头像-五八三admin2年前
0190
Diffusion Model Noise Schedule-五八三

Diffusion Model Noise Schedule

本文仅适用于已经了解什么是Diffusion Model的人。 我们知道,在Diffusion Model中存在正向扩散过程——破坏数据 和 逆向扩散过程——生成过程。在正向过程中,我们给定一个数据,随着时间步 tt...
admin的头像-五八三admin2年前
0160
一文详解TextBrewer-五八三

一文详解TextBrewer

本文分享自华为云社区《TextBrewer:融合并改进了NLP和CV中的多种知识蒸馏技术、提供便捷快速的知识蒸馏框架、提升模型的推理速度,减少内存占用》,作者:汀丶。 TextBrewer是一个基于PyTorch...
admin的头像-五八三admin2年前
090
面向大模型的存储加速方案设计和实践-五八三

面向大模型的存储加速方案设计和实践

这是 AI 大底座系列云智公开课的第三期内容。前两期我的两位同事已经向大家介绍了高性能网络和 GPU 容器虚拟化的相关内容。今天我们把目光聚焦在存储方向,一起来看看面向大模型的存储加速方案...
admin的头像-五八三admin2年前
0130
【NLP】入门(一):简介-五八三

【NLP】入门(一):简介

本文正在参加「金石计划 . 瓜分6万现金大奖」 前言 计算机读懂语言,在如今已经不是什么新鲜的事情了,不过你有没有想过计算机是如何读懂人类语言的呢? 自然语言处理 NLP 技术在当今变成了最具...
admin的头像-五八三admin2年前
0130

聊聊自然语言处理NLP

概述 自然语言处理(NLP)的正式定义:是一个使用计算机科学、人工智能(AI)和形式语言学概念来分析自然语言的研究领域。不太正式的定义表明:它是一组工具,用于从自然语言源(如web页面和文本文档...
admin的头像-五八三admin2年前
0150
在大模型的浪潮下,我对“小模型”的探索与实践之路-五八三

在大模型的浪潮下,我对“小模型”的探索与实践之路

本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! 如今“大模型”一词很火,但我却找不到它的定义。目前业内只存在大语言模型 (large language model,...
admin的头像-五八三admin2年前
0240
语义检索系统之排序模块:基于ERNIE-Gram的Pair-wise和基于RocketQA的CrossEncoder训练的单塔模型-五八三

语义检索系统之排序模块:基于ERNIE-Gram的Pair-wise和基于RocketQA的CrossEncoder训练的单塔模型

语义检索系统之排序模块:基于ERNIE-Gram的Pair-wise和基于RocketQA的CrossEncoder训练的单塔模型 文本匹配任务数据每一个样本通常由两个文本组成(query,title)。类别形式为 0 或 1,0 表示 ...
admin的头像-五八三admin2年前
070
基于Milvus+ERNIE+SimCSE+In-batch Negatives样本策略的学术文献语义检索系统-五八三

基于Milvus+ERNIE+SimCSE+In-batch Negatives样本策略的学术文献语义检索系统

基于Milvus+ERNIE+SimCSE+In-batch Negatives样本策略的学术文献语义检索系统 0.前言 语义索引(可通俗理解为向量索引)技术是搜索引擎、推荐系统、广告系统在召回阶段的核心技术之一。语义索引...
admin的头像-五八三admin2年前
060
基于无监督训练SimCSE+In-batch Negatives策略有监督训练的语义索引召回-五八三

基于无监督训练SimCSE+In-batch Negatives策略有监督训练的语义索引召回

基于无监督训练SimCSE+In-batch Negatives策略有监督训练的语义索引召回 语义索引(可通俗理解为向量索引)技术是搜索引擎、推荐系统、广告系统在召回阶段的核心技术之一。语义索引模型的目标是...
admin的头像-五八三admin2年前
0110
交叉验证&模型集成 | datawhale夏令营NLP赛道第三阶段打卡笔记(二)-五八三

交叉验证&模型集成 | datawhale夏令营NLP赛道第三阶段打卡笔记(二)

前言 根据净好大佬的两份笔记, 这里记录一下交叉验证和模型集成. 交叉验证是在kaggle教程里学的, 模型集成是抱佛脚学的. A榜笔记:tvq27xqm30o.feishu.cn/docx/V2gfdv… B榜笔记:tvq27xqm30o.f...
admin的头像-五八三admin2年前
0220
基于中文金融知识的 LLaMA 系微调模型的智能问答系统:LLaMA大模型训练微调推理等详细教学-五八三

基于中文金融知识的 LLaMA 系微调模型的智能问答系统:LLaMA大模型训练微调推理等详细教学

基于中文金融知识的 LLaMA 系微调模型的智能问答系统:LLaMA大模型训练微调推理等详细教学 基于 LLaMA 系基模型经过中文金融知识指令精调/指令微调(Instruct-tuning) 的微调模型。通过中文金融...
admin的头像-五八三admin2年前
0340
大模型基础知识 - 语言模型及其演进 公开版-五八三

大模型基础知识 – 语言模型及其演进 公开版

本文为作者内部分享文档,由于不涉敏可以公开,分享本身是课程形式,有什么疑问欢迎在评论区留言。 开场白 人工智能发展到现在,在2个重要领域取得了重大突破,有望达到人类水平: 计算机视觉 ...
admin的头像-五八三admin2年前
0230
解密Prompt系列12. LLM Agent零微调范式 ReAct & Self Ask-五八三

解密Prompt系列12. LLM Agent零微调范式 ReAct & Self Ask

合集 - DecryptPrompt(12)1.解密Prompt系列8. 无需训练让LLM支持超长输入:知识库 & unlimiformer & PCW & NBCE06-132.解密Prompt系列6. lora指令微调扣细节-请冷静,1个小时真不够~0...
admin的头像-五八三admin2年前
0140
基于因果关系知识库的因果事件图谱构建-五八三

基于因果关系知识库的因果事件图谱构建

基于因果关系知识库的因果事件图谱构建 1.项目介绍 现实社会是个逻辑社会,大量的逻辑即逻辑经验存在于我们的脑海中,而这些逻辑经验是无法穷举出来的,靠大量人工的总结,显然不切实际。然而,...
admin的头像-五八三admin2年前
080
知识蒸馏-五八三

知识蒸馏

化学蒸馏实验 Knowledge Distill 蒸馏思想 知识蒸馏是一种模型压缩方法,通过引导轻量化的学生模型“模仿”性能更好、结构更复杂的的教学模型(教师模型),在不改变学生模型结构的情况下提高其...
admin的头像-五八三admin2年前
0110
谈谈RNN生成文本的小原理,动手实现AI写藏头诗-五八三

谈谈RNN生成文本的小原理,动手实现AI写藏头诗

AIGC叫“生成式人工智能”。想必“人工智能”大家都很熟悉了,因此我想跟大伙儿聊聊这个“生成式”。 AIGC中的GC不是指“国粹”,是Generated Content的缩写,表示生成内容。看下面这段文本: ...
admin的头像-五八三admin2年前
0250
基于50W携程出行攻略构建事件图谱(含码源):交通工具子图谱、订酒店吃饭事件图谱等-五八三

基于50W携程出行攻略构建事件图谱(含码源):交通工具子图谱、订酒店吃饭事件图谱等

基于50W携程出行攻略构建事件图谱(含码源):交通工具子图谱、订酒店吃饭事件图谱等 项目构成 本项目由两个部分的组成,具体包括语料的获取以及基于语料的事件挖掘两个部分,具体项目目录包括: n...
admin的头像-五八三admin2年前
090
大语言模型的预训练[6]:思维链(Chain-of-thought,CoT)定义原理详解以及在LLM上应用-五八三

大语言模型的预训练[6]:思维链(Chain-of-thought,CoT)定义原理详解以及在LLM上应用

大语言模型的预训练[6]:思维链(Chain-of-thought,CoT)定义原理详解、Zero-shot CoT、Few-shot CoT 以及在LLM上应用 1.思维链定义 背景 在 2017-2019 年之间,随着 Transformer 模型的提出,计...
admin的头像-五八三admin2年前
0120