NLP共0篇
NLP
transformers库快速入门-五八三

transformers库快速入门

一,Transformers 术语 1.1,token、tokenization 和 tokenizer 1.2,input IDs 1.3,attention mask 1.4,eop_token、pad_token、bos_token、eos_token 1.5,decoder models 1.6,架构与参数 ...
admin的头像-五八三admin2年前
0130
文本提取、文本分类、语言筛选,有什么好用的工具?丨学习记录-五八三

文本提取、文本分类、语言筛选,有什么好用的工具?丨学习记录

?环境:macOS or Linux ?本文代码已开源: github.com/Conqueror71… Trafilature文本提取 目的:更有效地提取网页中的有用的内容,重点关注有意义的、结构化的文本,有助于模型更好地理解和生...
admin的头像-五八三admin2年前
0100
探索Text-to-SQL前沿:ChatGPT在BIRD基准测试中未达到人类表现的一半性能-五八三

探索Text-to-SQL前沿:ChatGPT在BIRD基准测试中未达到人类表现的一半性能

我正在参加「掘金·启航计划」 导语 随着像ChatGPT之类的大语言模型的迅速发展,NLP中许多的研究领域受到冲击,之前的一篇博客看看ChatGPT对Text-to-SQL任务的冲击介绍了清华大学团队使用ChatGP...
admin的头像-五八三admin2年前
0110
基于50W携程出行攻略构建事件图谱(含码源):交通工具子图谱、订酒店吃饭事件图谱等-五八三

基于50W携程出行攻略构建事件图谱(含码源):交通工具子图谱、订酒店吃饭事件图谱等

基于50W携程出行攻略构建事件图谱(含码源):交通工具子图谱、订酒店吃饭事件图谱等 项目构成 本项目由两个部分的组成,具体包括语料的获取以及基于语料的事件挖掘两个部分,具体项目目录包括: n...
admin的头像-五八三admin2年前
090
Transformer 中 Mask 的那些事-五八三

Transformer 中 Mask 的那些事

我是 Andy.Qin,一个想创造哆啦 A 梦的 Maker,更多好文章可以到我的博客:qin.news Mask 的灵感是来自于完形填空。Transformer 结构包括编码器和解码器,在编码过程中目的就是为了让模型看到当...
admin的头像-五八三admin2年前
060
手把手教学构建农业知识图谱:农业领域的信息检索+智能问答,命名实体识别,关系抽取,实体关系查询-五八三

手把手教学构建农业知识图谱:农业领域的信息检索+智能问答,命名实体识别,关系抽取,实体关系查询

手把手教学构建农业知识图谱:农业领域的信息检索+智能问答,命名实体识别,关系抽取,实体关系查询 1.项目介绍: 效果展示: 目录结构: . ├── MyCrawler // scrapy爬虫项目路径(已爬好) │...
admin的头像-五八三admin2年前
0120
在大模型的浪潮下,我对“小模型”的探索与实践之路-五八三

在大模型的浪潮下,我对“小模型”的探索与实践之路

本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! 如今“大模型”一词很火,但我却找不到它的定义。目前业内只存在大语言模型 (large language model,...
admin的头像-五八三admin2年前
0250
Transformers自然语言处理第一章 你好Transformer-五八三

Transformers自然语言处理第一章 你好Transformer

2017年,Google的研究人员发表了一篇论文,提出了一种新的用于序列建模(sequence modeling)的神经网络架构[1]。称之为Transformer,这种架构在机器翻译任务中的表现无论在翻译质量还是训练成...
admin的头像-五八三admin2年前
0150
解密Prompt系列11. 小模型也能COT-先天不足后天来补-五八三

解密Prompt系列11. 小模型也能COT-先天不足后天来补

合集 - DecryptPrompt(11)1.解密Prompt系列8. 无需训练让LLM支持超长输入:知识库 & unlimiformer & PCW & NBCE06-132.解密Prompt系列6. lora指令微调扣细节-请冷静,1个小时真不够~0...
admin的头像-五八三admin2年前
0100
无所不能的Embedding2 - 词向量三巨头之FastText详解-五八三

无所不能的Embedding2 – 词向量三巨头之FastText详解

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第9天,点击查看活动详情 Fasttext是FaceBook开源的文本分类和词向量训练库。最初看其他教程看的我十分迷惑,咋的一会ngram...
admin的头像-五八三admin2年前
0170
谈谈RNN生成文本的小原理,动手实现AI写藏头诗-五八三

谈谈RNN生成文本的小原理,动手实现AI写藏头诗

AIGC叫“生成式人工智能”。想必“人工智能”大家都很熟悉了,因此我想跟大伙儿聊聊这个“生成式”。 AIGC中的GC不是指“国粹”,是Generated Content的缩写,表示生成内容。看下面这段文本: ...
admin的头像-五八三admin2年前
0250
全文高能!提高工作效率的9个VS Code扩展插件-五八三

全文高能!提高工作效率的9个VS Code扩展插件

1/ Path Intellisense 这个扩展会自动补全文件名。就像在 HTML 中使用标签一样,它会自动补全标签。 2/ Live Server 这个扩展允许你在浏览器上启动本地项目并进行实时重载,这样你就不必在每次...
admin的头像-五八三admin2年前
040
手把手教学构建证券知识图谱/知识库(含码源):网页获取信息、设计图谱、Cypher查询、Neo4j关系可视化展示-五八三

手把手教学构建证券知识图谱/知识库(含码源):网页获取信息、设计图谱、Cypher查询、Neo4j关系可视化展示

手把手教学构建证券知识图谱/知识库(含码源):网页获取信息、设计图谱、Cypher查询、Neo4j关系可视化展示 demo展示: 代码结构 stock-knowledge-graph/ ├── __init__.py ├── extract.py...
admin的头像-五八三admin2年前
080

聊聊自然语言处理NLP

概述 自然语言处理(NLP)的正式定义:是一个使用计算机科学、人工智能(AI)和形式语言学概念来分析自然语言的研究领域。不太正式的定义表明:它是一组工具,用于从自然语言源(如web页面和文本文档...
admin的头像-五八三admin2年前
0150
chatglm在windows上部署 | 零基础小白爬坑-五八三

chatglm在windows上部署 | 零基础小白爬坑

本文41319字,阅读时间约5分钟,总结精简部分1分钟即可. 你将获得: 小白也能看懂操作的消费级显卡实现的在windows上本地部署chatglm的精简方法 一些部署时报错的原因和解决方法 本地有一个自己的c...
admin的头像-五八三admin2年前
020
领域知识图谱的医生推荐系统:利用BERT+CRF+BiLSTM的医疗实体识别,建立医学知识图谱,建立知识问答系统-五八三

领域知识图谱的医生推荐系统:利用BERT+CRF+BiLSTM的医疗实体识别,建立医学知识图谱,建立知识问答系统

领域知识图谱的医生推荐系统:利用BERT+CRF+BiLSTM的医疗实体识别,建立医学知识图谱,建立知识问答系统 本项目主要实现了疾病自诊和医生推荐两个功能并构建了医生服务指标评价体系。疾病自诊主...
admin的头像-五八三admin2年前
070
搜索语义模型的大规模量化实践-五八三

搜索语义模型的大规模量化实践

源创会,线下重启!2023年7月1日深圳站—基础软件技术面面谈!免费票限时抢购! 作者 | 把酒问青天 导读  经过近几年的技术演进,语义模型在百度搜索场景中被广泛地应用,消耗了大量的GPU资源...
admin的头像-五八三admin2年前
060
知识蒸馏-五八三

知识蒸馏

化学蒸馏实验 Knowledge Distill 蒸馏思想 知识蒸馏是一种模型压缩方法,通过引导轻量化的学生模型“模仿”性能更好、结构更复杂的的教学模型(教师模型),在不改变学生模型结构的情况下提高其...
admin的头像-五八三admin2年前
0110
全民AI计划:通过langchain给LLM接上落地的大腿-五八三

全民AI计划:通过langchain给LLM接上落地的大腿

有兄弟让我讲讲langchain。 哈哈,我又没出镜,他怎么看出我说话好听的?不过,我倒是喜欢写大家关心的。下面就聊聊这个langchain。 langchain是一个开源项目 github.com/hwchase17/l… 。这个...
admin的头像-五八三admin2年前
030
2023年LLM如何入门?请看这篇综述!丨论文解读-五八三

2023年LLM如何入门?请看这篇综述!丨论文解读

零、前言: ?欢迎访问: 个人博客:conqueror712.github.io/ 知乎:www.zhihu.com/people/soeu… Bilibili:space.bilibili.com/57089326 掘金:juejin.cn/user/129787… 注意,本文不涉及太多...
admin的头像-五八三admin2年前
0170