NLP共0篇 第2页
NLP
transformers库快速入门-五八三

transformers库快速入门

一,Transformers 术语 1.1,token、tokenization 和 tokenizer 1.2,input IDs 1.3,attention mask 1.4,eop_token、pad_token、bos_token、eos_token 1.5,decoder models 1.6,架构与参数 ...
admin的头像-五八三admin2年前
0140
【NLP】入门(一):简介-五八三

【NLP】入门(一):简介

本文正在参加「金石计划 . 瓜分6万现金大奖」 前言 计算机读懂语言,在如今已经不是什么新鲜的事情了,不过你有没有想过计算机是如何读懂人类语言的呢? 自然语言处理 NLP 技术在当今变成了最具...
admin的头像-五八三admin2年前
0140
面向大模型的存储加速方案设计和实践-五八三

面向大模型的存储加速方案设计和实践

这是 AI 大底座系列云智公开课的第三期内容。前两期我的两位同事已经向大家介绍了高性能网络和 GPU 容器虚拟化的相关内容。今天我们把目光聚焦在存储方向,一起来看看面向大模型的存储加速方案...
admin的头像-五八三admin2年前
0130
基于无监督训练SimCSE+In-batch Negatives策略有监督训练的语义索引召回-五八三

基于无监督训练SimCSE+In-batch Negatives策略有监督训练的语义索引召回

基于无监督训练SimCSE+In-batch Negatives策略有监督训练的语义索引召回 语义索引(可通俗理解为向量索引)技术是搜索引擎、推荐系统、广告系统在召回阶段的核心技术之一。语义索引模型的目标是...
admin的头像-五八三admin2年前
0130
大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型应用以及各个版本之间的区别详解-五八三

大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型应用以及各个版本之间的区别详解

大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型应用以及各个版本之间的区别详解 1.GPT 模型 1.1 GPT 模型简介 在自然语言处理问题中,可从互联网上下载大量...
admin的头像-五八三admin2年前
0120
阅读笔记——《文本情感分析方法研究综述》-五八三

阅读笔记——《文本情感分析方法研究综述》

文本情感分析综述 文本情感法分析的一般流程 原始数据获取(取得数据集或者网络爬虫)—>数据预处理(清洗去噪、分词、过滤等)—> 特征提取(依靠不同工具获得文本的数值向量表征“词频...
admin的头像-五八三admin2年前
0120
大语言模型的预训练[6]:思维链(Chain-of-thought,CoT)定义原理详解以及在LLM上应用-五八三

大语言模型的预训练[6]:思维链(Chain-of-thought,CoT)定义原理详解以及在LLM上应用

大语言模型的预训练[6]:思维链(Chain-of-thought,CoT)定义原理详解、Zero-shot CoT、Few-shot CoT 以及在LLM上应用 1.思维链定义 背景 在 2017-2019 年之间,随着 Transformer 模型的提出,计...
admin的头像-五八三admin2年前
0120
手把手教学构建农业知识图谱:农业领域的信息检索+智能问答,命名实体识别,关系抽取,实体关系查询-五八三

手把手教学构建农业知识图谱:农业领域的信息检索+智能问答,命名实体识别,关系抽取,实体关系查询

手把手教学构建农业知识图谱:农业领域的信息检索+智能问答,命名实体识别,关系抽取,实体关系查询 1.项目介绍: 效果展示: 目录结构: . ├── MyCrawler // scrapy爬虫项目路径(已爬好) │...
admin的头像-五八三admin2年前
0120
大语言模型的预训练[4]:指示学习Instruction Learning详解以及和Prompt工程、ICL区别-五八三

大语言模型的预训练[4]:指示学习Instruction Learning详解以及和Prompt工程、ICL区别

大语言模型的预训练[4]:指示学习Instruction Learning:Entailment-oriented、PLM oriented、human-oriented以及和Prompt Learning,In-content Learning区别 1.指示学习的定义 Instruction Lea...
admin的头像-五八三admin2年前
0110
文本提取、文本分类、语言筛选,有什么好用的工具?丨学习记录-五八三

文本提取、文本分类、语言筛选,有什么好用的工具?丨学习记录

?环境:macOS or Linux ?本文代码已开源: github.com/Conqueror71… Trafilature文本提取 目的:更有效地提取网页中的有用的内容,重点关注有意义的、结构化的文本,有助于模型更好地理解和生...
admin的头像-五八三admin2年前
0110
探索Text-to-SQL前沿:ChatGPT在BIRD基准测试中未达到人类表现的一半性能-五八三

探索Text-to-SQL前沿:ChatGPT在BIRD基准测试中未达到人类表现的一半性能

我正在参加「掘金·启航计划」 导语 随着像ChatGPT之类的大语言模型的迅速发展,NLP中许多的研究领域受到冲击,之前的一篇博客看看ChatGPT对Text-to-SQL任务的冲击介绍了清华大学团队使用ChatGP...
admin的头像-五八三admin2年前
0110
知识蒸馏-五八三

知识蒸馏

化学蒸馏实验 Knowledge Distill 蒸馏思想 知识蒸馏是一种模型压缩方法,通过引导轻量化的学生模型“模仿”性能更好、结构更复杂的的教学模型(教师模型),在不改变学生模型结构的情况下提高其...
admin的头像-五八三admin2年前
0110
NLP领域再创佳绩!阿里云机器学习平台 PAI 多篇论文入选 ACL 2023-五八三

NLP领域再创佳绩!阿里云机器学习平台 PAI 多篇论文入选 ACL 2023

近期,阿里云机器学习平台PAI主导的多篇论文在ACL 2023 Industry Track上入选。ACL是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究。该会议曾推动...
admin的头像-五八三admin2年前
0100
一文详解TextBrewer-五八三

一文详解TextBrewer

本文分享自华为云社区《TextBrewer:融合并改进了NLP和CV中的多种知识蒸馏技术、提供便捷快速的知识蒸馏框架、提升模型的推理速度,减少内存占用》,作者:汀丶。 TextBrewer是一个基于PyTorch...
admin的头像-五八三admin2年前
0100
大语言模型的预训练[3]之Prompt Learning:Prompt Engineering、Answer engineering、Multi-prompt-五八三

大语言模型的预训练[3]之Prompt Learning:Prompt Engineering、Answer engineering、Multi-prompt

大语言模型的预训练[3]之Prompt Learning:Prompt Engineering、Answer engineering、Multi-prompt learning、Training strategy详解 1.Prompt Learning 1.1 Prompt Learning 的出现背景 目前学...
admin的头像-五八三admin2年前
0100
解密Prompt系列11. 小模型也能COT-先天不足后天来补-五八三

解密Prompt系列11. 小模型也能COT-先天不足后天来补

合集 - DecryptPrompt(11)1.解密Prompt系列8. 无需训练让LLM支持超长输入:知识库 & unlimiformer & PCW & NBCE06-132.解密Prompt系列6. lora指令微调扣细节-请冷静,1个小时真不够~0...
admin的头像-五八三admin2年前
0100
RepoCoder:通过迭代检索提升仓库级代码补全(Repository-Level Code Completion)-五八三

RepoCoder:通过迭代检索提升仓库级代码补全(Repository-Level Code Completion)

我正在参加「掘金·启航计划」 导语 本文介绍了一种名为 RepoCoder 的仓库级代码完成框架,它通过利用仓库级信息,结合相似度检索器和预训练的代码语言模型,提高了代码完成的准确性和效率。同...
admin的头像-五八三admin2年前
090
深度学习应用篇-自然语言处理[10]:N-Gram、SimCSE介绍,更多技术:数据增强、智能标注、多分类算法、文本信息抽取、多模态信息抽取、模型压缩算法等-五八三

深度学习应用篇-自然语言处理[10]:N-Gram、SimCSE介绍,更多技术:数据增强、智能标注、多分类算法、文本信息抽取、多模态信息抽取、模型压缩算法等

深度学习应用篇-自然语言处理[10]:N-Gram、SimCSE介绍,更多技术:数据增强、智能标注、多分类算法、文本信息抽取、多模态信息抽取、模型压缩算法等 1.N-Gram N-Gram是一种基于统计语言模型的...
admin的头像-五八三admin2年前
090
如何使用ChatGPT执行"自然语言SQL"-五八三

如何使用ChatGPT执行"自然语言SQL"

使用自然语言查询 SQLite DB 的一个demo 关于 此存储库包含将 SQLite 查询与 OpenAI 的 GPT-3.5-turbo 语言模型相结合的代码。该代码允许用户通过类似聊天的界面使用自然语言查询与 SQLite 数据...
admin的头像-五八三admin2年前
090
基于50W携程出行攻略构建事件图谱(含码源):交通工具子图谱、订酒店吃饭事件图谱等-五八三

基于50W携程出行攻略构建事件图谱(含码源):交通工具子图谱、订酒店吃饭事件图谱等

基于50W携程出行攻略构建事件图谱(含码源):交通工具子图谱、订酒店吃饭事件图谱等 项目构成 本项目由两个部分的组成,具体包括语料的获取以及基于语料的事件挖掘两个部分,具体项目目录包括: n...
admin的头像-五八三admin2年前
090