NLP共0篇 第3页
NLP
手把手教学构建农业知识图谱:农业领域的信息检索+智能问答,命名实体识别,关系抽取,实体关系查询-五八三

手把手教学构建农业知识图谱:农业领域的信息检索+智能问答,命名实体识别,关系抽取,实体关系查询

手把手教学构建农业知识图谱:农业领域的信息检索+智能问答,命名实体识别,关系抽取,实体关系查询 1.项目介绍: 效果展示: 目录结构: . ├── MyCrawler // scrapy爬虫项目路径(已爬好) │...
admin的头像-五八三admin2年前
0120
孙子漏洞!ChatGPT又百依百顺了;程序员的LLM世界生存技巧;UI+MJ入门必读手册;吴恩达LangChain实践课 | ShowMeAI日报-五八三

孙子漏洞!ChatGPT又百依百顺了;程序员的LLM世界生存技巧;UI+MJ入门必读手册;吴恩达LangChain实践课 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 继「奶奶漏洞」之后再现「孙子漏洞」,装成孩子让 ChatGPT 千依百顺 前几天,网友发现了 ChatGPT 的新鲜玩法,只...
admin的头像-五八三admin2年前
060
超越开源与闭源Code LLMs!——WizardCoder,一款Code Evol-Instruct tuning的代码生成模型-五八三

超越开源与闭源Code LLMs!——WizardCoder,一款Code Evol-Instruct tuning的代码生成模型

我正在参加「掘金·启航计划」 导语 这个工作的整体思路比较简洁,可以认为就是将之前一篇论文(WizardLM)中提出的Evol-instruct的思想应用到了Code LLM领域(之前是通用领域),整体论文方法...
admin的头像-五八三admin2年前
020
解密Prompt系列10. 思维链COT原理探究-五八三

解密Prompt系列10. 思维链COT原理探究

合集 - DecryptPrompt(10)1.解密Prompt系列8. 无需训练让LLM支持超长输入:知识库 & unlimiformer & PCW & NBCE06-132.解密Prompt系列6. lora指令微调扣细节-请冷静,1个小时真不够~0...
admin的头像-五八三admin2年前
070
搜索语义模型的大规模量化实践-五八三

搜索语义模型的大规模量化实践

源创会,线下重启!2023年7月1日深圳站—基础软件技术面面谈!免费票限时抢购! 作者 | 把酒问青天 导读  经过近几年的技术演进,语义模型在百度搜索场景中被广泛地应用,消耗了大量的GPU资源...
admin的头像-五八三admin2年前
060

mini GPT 实现文本生成

前文 本文主要展示了如何实现微型的 GPT 模型完成文本生成任务,该模型只由 1 个 Transformer 块组成。 Data 这部分代码主要用于准备文本数据集进行语言模型训练,这里需要事先下载好 aclImdb ...
admin的头像-五八三admin2年前
070
RepoFusion:结合存储库上下文的代码补全模型-五八三

RepoFusion:结合存储库上下文的代码补全模型

我正在参加「掘金·启航计划」 导语 本文是RLPG(ICML 2023)论文的后续工作,本文通过结合不同的存储库上下文来提升基本的代码模型的补全能力,实验显示,作者通过基于CodeT5-base(220M)的Re...
admin的头像-五八三admin2年前
030
RepoCoder:通过迭代检索提升仓库级代码补全(Repository-Level Code Completion)-五八三

RepoCoder:通过迭代检索提升仓库级代码补全(Repository-Level Code Completion)

我正在参加「掘金·启航计划」 导语 本文介绍了一种名为 RepoCoder 的仓库级代码完成框架,它通过利用仓库级信息,结合相似度检索器和预训练的代码语言模型,提高了代码完成的准确性和效率。同...
admin的头像-五八三admin2年前
090
大型代码语言模型的项目级提示生成(Repository-Level Prompt Generation for Code LLM)-五八三

大型代码语言模型的项目级提示生成(Repository-Level Prompt Generation for Code LLM)

我正在参加「掘金·启航计划」 导语 本文介绍了如何从存储库中获取对大型代码语言模型进行代码生成有帮助的Prompt的一些探索,整体过程比较朴素,就是使用一些规则或者设计网络选取存储库中的内...
admin的头像-五八三admin2年前
040
无所不能的Embedding2 - 词向量三巨头之FastText详解-五八三

无所不能的Embedding2 – 词向量三巨头之FastText详解

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第9天,点击查看活动详情 Fasttext是FaceBook开源的文本分类和词向量训练库。最初看其他教程看的我十分迷惑,咋的一会ngram...
admin的头像-五八三admin2年前
0170
探索Text-to-SQL前沿:ChatGPT在BIRD基准测试中未达到人类表现的一半性能-五八三

探索Text-to-SQL前沿:ChatGPT在BIRD基准测试中未达到人类表现的一半性能

我正在参加「掘金·启航计划」 导语 随着像ChatGPT之类的大语言模型的迅速发展,NLP中许多的研究领域受到冲击,之前的一篇博客看看ChatGPT对Text-to-SQL任务的冲击介绍了清华大学团队使用ChatGP...
admin的头像-五八三admin2年前
0110
LLM - finetuning - 踩坑经验之谈-五八三

LLM – finetuning – 踩坑经验之谈

一、前言 由于 chatgpt 和 gp4 兴起。如何让人人都用上这种大模型,是目前 AI 领域最活跃的事情。当下开源的 LLM(Large language model) 非常多,可谓是百模大战。面对诸多开源本地模型,根据自...
admin的头像-五八三admin2年前
0180
阅读笔记——《文本情感分析方法研究综述》-五八三

阅读笔记——《文本情感分析方法研究综述》

文本情感分析综述 文本情感法分析的一般流程 原始数据获取(取得数据集或者网络爬虫)—>数据预处理(清洗去噪、分词、过滤等)—> 特征提取(依靠不同工具获得文本的数值向量表征“词频...
admin的头像-五八三admin2年前
0120
哈啰智能客服:如何应用语言模型提升机器人服务能力-五八三

哈啰智能客服:如何应用语言模型提升机器人服务能力

哈啰智能客服的总体介绍和算法流程 用户、算法眼中的智能客服痛点 右图是哈啰APP的客服中心,用户进入该页面,系统会根据用户的使用情况智能推荐高频问题,并猜测用户想解决的问题,这部分标准...
admin的头像-五八三admin2年前
060

AI模型的暴论

背景 本人自由职业,运营者AI开源项目github.com/CloudOrc/So… 技术实现 on-premise 内部的私有数据价值越来越低,已经为了做大模型价值,存储很多私有数据,再加上例如LAION 爆火,LLM爆火,...
admin的头像-五八三admin2年前
080
卷积码编码器的结构与表示-五八三

卷积码编码器的结构与表示

本专栏包含信息论与编码的核心知识,按知识点组织,可作为教学或学习的参考。markdown版本已归档至【Github仓库:github.com/timerring/i… 】或者公众号【AIShareLab】回复 信息论 获取。 卷积...
admin的头像-五八三admin2年前
070
DeepSpeed 推理: 具有定制推理内核和量化支持的多 GPU 推理-五八三

DeepSpeed 推理: 具有定制推理内核和量化支持的多 GPU 推理

直译中文标题:《DeepSpeed 推理:具有定制推理内核和量化支持的多 GPU 推理》 原文地址:DeepSpeed Inference: Multi-GPU inference with customized inference kernels and quantization supp...
admin的头像-五八三admin2年前
050
2023中国高校计算机大数据挑战赛:论文学科分类baseline|清华主办-五八三

2023中国高校计算机大数据挑战赛:论文学科分类baseline|清华主办

2023中国高校计算机大赛 — 大数据挑战赛:论文学科分类(清华大学主办) 官方地址:www.heywhale.com/home/compet… 项目码源见文末 1.比赛介绍 赛事背景 自 2022 年底以来,大规模语言模型在...
admin的头像-五八三admin2年前
070
全国大数据与计算智能挑战赛:面向低资源的命名实体识别基线方案,排名13/64-五八三

全国大数据与计算智能挑战赛:面向低资源的命名实体识别基线方案,排名13/64

全国大数据与计算智能挑战赛:面向低资源的命名实体识别基线方案,排名13/64 全国大数据与计算智能挑战赛:面向低资源的命名实体识别baseline,排名13/64。第一名:0.68962791,基线:0.6790259...
admin的头像-五八三admin2年前
080
chatglm在windows上部署 | 零基础小白爬坑-五八三

chatglm在windows上部署 | 零基础小白爬坑

本文41319字,阅读时间约5分钟,总结精简部分1分钟即可. 你将获得: 小白也能看懂操作的消费级显卡实现的在windows上本地部署chatglm的精简方法 一些部署时报错的原因和解决方法 本地有一个自己的c...
admin的头像-五八三admin2年前
020