NLP共0篇
NLP
从零开始构建一个电影知识图谱,实现KBQA智能问答[上篇]:本体建模、RDF、D2RQ、SPARQL endpoint与两种交互方式详细教学-五八三

从零开始构建一个电影知识图谱,实现KBQA智能问答[上篇]:本体建模、RDF、D2RQ、SPARQL endpoint与两种交互方式详细教学

从零开始构建一个电影知识图谱,实现KBQA智能问答[上篇]:本体建模、RDF、D2RQ、SPARQL endpoint与两种交互方式详细教学 效果展示: 首先介绍我们使用的数据、数据来源和数据获取方法;其次,基...
admin的头像-五八三admin2年前
0380
学科知识图谱学习平台项目 :技术栈Java、Neo4j、MySQL等超详细教学-五八三

学科知识图谱学习平台项目 :技术栈Java、Neo4j、MySQL等超详细教学

学科知识图谱学习平台项目 :技术栈Java、Neo4j、MySQL等超详细教学 0.效果展示 1.安装教程 安装Java SDK 11,下载前需要登录Oracle账号,下载链接,安装教程,测试是否能在命令行工具调用java ...
admin的头像-五八三admin2年前
0360
基于中文金融知识的 LLaMA 系微调模型的智能问答系统:LLaMA大模型训练微调推理等详细教学-五八三

基于中文金融知识的 LLaMA 系微调模型的智能问答系统:LLaMA大模型训练微调推理等详细教学

基于中文金融知识的 LLaMA 系微调模型的智能问答系统:LLaMA大模型训练微调推理等详细教学 基于 LLaMA 系基模型经过中文金融知识指令精调/指令微调(Instruct-tuning) 的微调模型。通过中文金融...
admin的头像-五八三admin2年前
0340
大语言模型的预训练[1]:基本概念原理、神经网络的语言模型、Transformer模型原理详解、Bert模型原理介绍-五八三

大语言模型的预训练[1]:基本概念原理、神经网络的语言模型、Transformer模型原理详解、Bert模型原理介绍

大语言模型的预训练[1]:基本概念原理、神经网络的语言模型、Transformer模型原理详解、Bert模型原理介绍 1.大语言模型的预训练 1.LLM预训练的基本概念 预训练属于迁移学习的范畴。现有的神经网...
admin的头像-五八三admin2年前
0270
在大模型的浪潮下,我对“小模型”的探索与实践之路-五八三

在大模型的浪潮下,我对“小模型”的探索与实践之路

本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! 如今“大模型”一词很火,但我却找不到它的定义。目前业内只存在大语言模型 (large language model,...
admin的头像-五八三admin2年前
0260
谈谈RNN生成文本的小原理,动手实现AI写藏头诗-五八三

谈谈RNN生成文本的小原理,动手实现AI写藏头诗

AIGC叫“生成式人工智能”。想必“人工智能”大家都很熟悉了,因此我想跟大伙儿聊聊这个“生成式”。 AIGC中的GC不是指“国粹”,是Generated Content的缩写,表示生成内容。看下面这段文本: ...
admin的头像-五八三admin2年前
0250
大模型基础知识 - 语言模型及其演进 公开版-五八三

大模型基础知识 – 语言模型及其演进 公开版

本文为作者内部分享文档,由于不涉敏可以公开,分享本身是课程形式,有什么疑问欢迎在评论区留言。 开场白 人工智能发展到现在,在2个重要领域取得了重大突破,有望达到人类水平: 计算机视觉 ...
admin的头像-五八三admin2年前
0230
交叉验证&模型集成 | datawhale夏令营NLP赛道第三阶段打卡笔记(二)-五八三

交叉验证&模型集成 | datawhale夏令营NLP赛道第三阶段打卡笔记(二)

前言 根据净好大佬的两份笔记, 这里记录一下交叉验证和模型集成. 交叉验证是在kaggle教程里学的, 模型集成是抱佛脚学的. A榜笔记:tvq27xqm30o.feishu.cn/docx/V2gfdv… B榜笔记:tvq27xqm30o.f...
admin的头像-五八三admin2年前
0220
循环神经网络介绍-五八三

循环神经网络介绍

循环神经网络(Recurrent Neural Network, RNN)是一种能够处理序列数据的神经网络,在自然语言处理、语音识别、手写识别等领域发挥着重要作用。相比普通的前馈神经网络,RNN可以捕捉时间序列数据中...
admin的头像-五八三admin2年前
0190
知识图谱之《海贼王-ONEPICE》领域图谱项目实战(含码源):数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等-五八三

知识图谱之《海贼王-ONEPICE》领域图谱项目实战(含码源):数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等

知识图谱之《海贼王-ONEPICE》领域图谱项目实战(含码源):数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等 实体关系可视化页面可视化页面尝鲜 1. 项目背景&...
admin的头像-五八三admin2年前
0180
LLM - finetuning - 踩坑经验之谈-五八三

LLM – finetuning – 踩坑经验之谈

一、前言 由于 chatgpt 和 gp4 兴起。如何让人人都用上这种大模型,是目前 AI 领域最活跃的事情。当下开源的 LLM(Large language model) 非常多,可谓是百模大战。面对诸多开源本地模型,根据自...
admin的头像-五八三admin2年前
0180
无所不能的Embedding2 - 词向量三巨头之FastText详解-五八三

无所不能的Embedding2 – 词向量三巨头之FastText详解

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第9天,点击查看活动详情 Fasttext是FaceBook开源的文本分类和词向量训练库。最初看其他教程看的我十分迷惑,咋的一会ngram...
admin的头像-五八三admin2年前
0170
2023年LLM如何入门?请看这篇综述!丨论文解读-五八三

2023年LLM如何入门?请看这篇综述!丨论文解读

零、前言: ?欢迎访问: 个人博客:conqueror712.github.io/ 知乎:www.zhihu.com/people/soeu… Bilibili:space.bilibili.com/57089326 掘金:juejin.cn/user/129787… 注意,本文不涉及太多...
admin的头像-五八三admin2年前
0170
Diffusion Model Noise Schedule-五八三

Diffusion Model Noise Schedule

本文仅适用于已经了解什么是Diffusion Model的人。 我们知道,在Diffusion Model中存在正向扩散过程——破坏数据 和 逆向扩散过程——生成过程。在正向过程中,我们给定一个数据,随着时间步 tt...
admin的头像-五八三admin2年前
0160
【ACL 2023】面向轻量化文图检索的Dual-Encoder模型蒸馏算法ConaCLIP-五八三

【ACL 2023】面向轻量化文图检索的Dual-Encoder模型蒸馏算法ConaCLIP

近日,阿里云机器学习平台PAI与华南理工大学金连文教授团队合作在自然语言处理顶级会议ACL 2023上发表面向轻量化文图检索的dual-encoder模型蒸馏算法ConaCLIP( fully-Connected knowledge inte...
admin的头像-五八三admin2年前
0160
Transformers自然语言处理第一章 你好Transformer-五八三

Transformers自然语言处理第一章 你好Transformer

2017年,Google的研究人员发表了一篇论文,提出了一种新的用于序列建模(sequence modeling)的神经网络架构[1]。称之为Transformer,这种架构在机器翻译任务中的表现无论在翻译质量还是训练成...
admin的头像-五八三admin2年前
0150

聊聊自然语言处理NLP

概述 自然语言处理(NLP)的正式定义:是一个使用计算机科学、人工智能(AI)和形式语言学概念来分析自然语言的研究领域。不太正式的定义表明:它是一组工具,用于从自然语言源(如web页面和文本文档...
admin的头像-五八三admin2年前
0150
解密Prompt系列12. LLM Agent零微调范式 ReAct & Self Ask-五八三

解密Prompt系列12. LLM Agent零微调范式 ReAct & Self Ask

合集 - DecryptPrompt(12)1.解密Prompt系列8. 无需训练让LLM支持超长输入:知识库 & unlimiformer & PCW & NBCE06-132.解密Prompt系列6. lora指令微调扣细节-请冷静,1个小时真不够~0...
admin的头像-五八三admin2年前
0140
解密Prompt系列8. 无需训练让LLM支持超长输入:知识库 & unlimiformer & PCW & NBCE-五八三

解密Prompt系列8. 无需训练让LLM支持超长输入:知识库 & unlimiformer & PCW & NBCE

合集 - DecryptPrompt(8)1.解密Prompt系列8. 无需训练让LLM支持超长输入:知识库 & unlimiformer & PCW & NBCE06-132.解密Prompt系列6. lora指令微调扣细节-请冷静,1个小时真不够~04...
解密Prompt系列13. LLM Agent指令微调方案: Toolformer & Gorilla-五八三

解密Prompt系列13. LLM Agent指令微调方案: Toolformer & Gorilla

上一章我们介绍了基于Prompt范式的工具调用方案,这一章介绍基于模型微调,支持任意多工具组合调用,复杂调用的方案。多工具调用核心需要解决3个问题,在哪个位置进行工具调用(where), 从众多工...
admin的头像-五八三admin2年前
0140