NLP-五八三-第3页

手把手教学构建农业知识图谱：农业领域的信息检索+智能问答，命名实体识别，关系抽取，实体关系查询

手把手教学构建农业知识图谱：农业领域的信息检索+智能问答，命名实体识别，关系抽取，实体关系查询 1.项目介绍：效果展示：目录结构： . ├── MyCrawler // scrapy爬虫项目路径(已爬好) │...

admin2年前

0120

孙子漏洞！ChatGPT又百依百顺了；程序员的LLM世界生存技巧；UI+MJ入门必读手册；吴恩达LangChain实践课 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 继「奶奶漏洞」之后再现「孙子漏洞」，装成孩子让 ChatGPT 千依百顺前几天，网友发现了 ChatGPT 的新鲜玩法，只...

admin2年前

060

超越开源与闭源Code LLMs！——WizardCoder，一款Code Evol-Instruct tuning的代码生成模型

我正在参加「掘金·启航计划」导语这个工作的整体思路比较简洁，可以认为就是将之前一篇论文（WizardLM）中提出的Evol-instruct的思想应用到了Code LLM领域（之前是通用领域），整体论文方法...

admin2年前

020

解密Prompt系列10. 思维链COT原理探究

合集 - DecryptPrompt(10)1.解密Prompt系列8. 无需训练让LLM支持超长输入:知识库 & unlimiformer & PCW & NBCE06-132.解密Prompt系列6. lora指令微调扣细节-请冷静,1个小时真不够~0...

博客文章

admin2年前

070

搜索语义模型的大规模量化实践

源创会，线下重启！2023年7月1日深圳站—基础软件技术面面谈！免费票限时抢购！作者 | 把酒问青天导读经过近几年的技术演进，语义模型在百度搜索场景中被广泛地应用，消耗了大量的GPU资源...

开源博客

admin2年前

060

mini GPT 实现文本生成

前文本文主要展示了如何实现微型的 GPT 模型完成文本生成任务，该模型只由 1 个 Transformer 块组成。 Data 这部分代码主要用于准备文本数据集进行语言模型训练，这里需要事先下载好 aclImdb ...

admin2年前

070

RepoFusion：结合存储库上下文的代码补全模型

我正在参加「掘金·启航计划」导语本文是RLPG（ICML 2023）论文的后续工作，本文通过结合不同的存储库上下文来提升基本的代码模型的补全能力，实验显示，作者通过基于CodeT5-base（220M）的Re...

admin2年前

030

RepoCoder：通过迭代检索提升仓库级代码补全（Repository-Level Code Completion）

我正在参加「掘金·启航计划」导语本文介绍了一种名为 RepoCoder 的仓库级代码完成框架，它通过利用仓库级信息，结合相似度检索器和预训练的代码语言模型，提高了代码完成的准确性和效率。同...

admin2年前

090

大型代码语言模型的项目级提示生成（Repository-Level Prompt Generation for Code LLM）

我正在参加「掘金·启航计划」导语本文介绍了如何从存储库中获取对大型代码语言模型进行代码生成有帮助的Prompt的一些探索，整体过程比较朴素，就是使用一些规则或者设计网络选取存储库中的内...

admin2年前

040

无所不能的Embedding2 – 词向量三巨头之FastText详解

携手创作，共同成长！这是我参与「掘金日新计划 · 8 月更文挑战」的第9天，点击查看活动详情 Fasttext是FaceBook开源的文本分类和词向量训练库。最初看其他教程看的我十分迷惑，咋的一会ngram...

admin2年前

0170

探索Text-to-SQL前沿：ChatGPT在BIRD基准测试中未达到人类表现的一半性能

我正在参加「掘金·启航计划」导语随着像ChatGPT之类的大语言模型的迅速发展，NLP中许多的研究领域受到冲击，之前的一篇博客看看ChatGPT对Text-to-SQL任务的冲击介绍了清华大学团队使用ChatGP...

人工智能

admin2年前

0110

LLM – finetuning – 踩坑经验之谈

一、前言由于 chatgpt 和 gp4 兴起。如何让人人都用上这种大模型，是目前 AI 领域最活跃的事情。当下开源的 LLM(Large language model) 非常多，可谓是百模大战。面对诸多开源本地模型，根据自...

人工智能

admin2年前

0180

阅读笔记——《文本情感分析方法研究综述》

文本情感分析综述文本情感法分析的一般流程原始数据获取（取得数据集或者网络爬虫）—>数据预处理（清洗去噪、分词、过滤等）—> 特征提取（依靠不同工具获得文本的数值向量表征“词频...

阅读

admin2年前

0120

哈啰智能客服：如何应用语言模型提升机器人服务能力

哈啰智能客服的总体介绍和算法流程用户、算法眼中的智能客服痛点右图是哈啰APP的客服中心，用户进入该页面，系统会根据用户的使用情况智能推荐高频问题，并猜测用户想解决的问题，这部分标准...

人工智能

admin2年前

060

AI模型的暴论

背景本人自由职业，运营者AI开源项目github.com/CloudOrc/So… 技术实现 on-premise 内部的私有数据价值越来越低，已经为了做大模型价值，存储很多私有数据，再加上例如LAION 爆火，LLM爆火，...

人工智能

admin2年前

080

卷积码编码器的结构与表示

本专栏包含信息论与编码的核心知识，按知识点组织，可作为教学或学习的参考。markdown版本已归档至【Github仓库：github.com/timerring/i… 】或者公众号【AIShareLab】回复信息论获取。卷积...

人工智能

admin2年前

070

DeepSpeed 推理: 具有定制推理内核和量化支持的多 GPU 推理

直译中文标题：《DeepSpeed 推理：具有定制推理内核和量化支持的多 GPU 推理》原文地址：DeepSpeed Inference: Multi-GPU inference with customized inference kernels and quantization supp...

人工智能

admin2年前

050

2023中国高校计算机大数据挑战赛：论文学科分类baseline|清华主办

2023中国高校计算机大赛 — 大数据挑战赛：论文学科分类（清华大学主办）官方地址：www.heywhale.com/home/compet… 项目码源见文末 1.比赛介绍赛事背景自 2022 年底以来，大规模语言模型在...

人工智能

admin2年前

070

全国大数据与计算智能挑战赛：面向低资源的命名实体识别基线方案，排名13/64

全国大数据与计算智能挑战赛：面向低资源的命名实体识别基线方案，排名13/64 全国大数据与计算智能挑战赛：面向低资源的命名实体识别baseline，排名13/64。第一名：0.68962791，基线：0.6790259...

人工智能

admin2年前

080

chatglm在windows上部署 | 零基础小白爬坑

本文41319字,阅读时间约5分钟,总结精简部分1分钟即可. 你将获得: 小白也能看懂操作的消费级显卡实现的在windows上本地部署chatglm的精简方法一些部署时报错的原因和解决方法本地有一个自己的c...

人工智能

admin2年前

020