NLP-五八三

从零开始构建一个电影知识图谱，实现KBQA智能问答[上篇]：本体建模、RDF、D2RQ、SPARQL endpoint与两种交互方式详细教学

从零开始构建一个电影知识图谱，实现KBQA智能问答[上篇]：本体建模、RDF、D2RQ、SPARQL endpoint与两种交互方式详细教学效果展示：首先介绍我们使用的数据、数据来源和数据获取方法；其次，基...

admin2年前

0380

学科知识图谱学习平台项目：技术栈Java、Neo4j、MySQL等超详细教学

学科知识图谱学习平台项目：技术栈Java、Neo4j、MySQL等超详细教学 0.效果展示 1.安装教程安装Java SDK 11，下载前需要登录Oracle账号，下载链接，安装教程，测试是否能在命令行工具调用java ...

admin2年前

0360

基于中文金融知识的 LLaMA 系微调模型的智能问答系统：LLaMA大模型训练微调推理等详细教学

基于中文金融知识的 LLaMA 系微调模型的智能问答系统：LLaMA大模型训练微调推理等详细教学基于 LLaMA 系基模型经过中文金融知识指令精调/指令微调(Instruct-tuning) 的微调模型。通过中文金融...

admin2年前

0340

大语言模型的预训练[1]:基本概念原理、神经网络的语言模型、Transformer模型原理详解、Bert模型原理介绍

大语言模型的预训练[1]:基本概念原理、神经网络的语言模型、Transformer模型原理详解、Bert模型原理介绍 1.大语言模型的预训练 1.LLM预训练的基本概念预训练属于迁移学习的范畴。现有的神经网...

admin2年前

0270

在大模型的浪潮下，我对“小模型”的探索与实践之路

本文为稀土掘金技术社区首发签约文章，30天内禁止转载，30天后未获授权禁止转载，侵权必究！如今“大模型”一词很火，但我却找不到它的定义。目前业内只存在大语言模型 (large language model,...

admin2年前

0260

谈谈RNN生成文本的小原理，动手实现AI写藏头诗

AIGC叫“生成式人工智能”。想必“人工智能”大家都很熟悉了，因此我想跟大伙儿聊聊这个“生成式”。 AIGC中的GC不是指“国粹”，是Generated Content的缩写，表示生成内容。看下面这段文本： ...

admin2年前

0250

大模型基础知识 – 语言模型及其演进公开版

本文为作者内部分享文档，由于不涉敏可以公开，分享本身是课程形式，有什么疑问欢迎在评论区留言。开场白人工智能发展到现在，在2个重要领域取得了重大突破，有望达到人类水平：计算机视觉 ...

admin2年前

0230

交叉验证&模型集成 | datawhale夏令营NLP赛道第三阶段打卡笔记(二)

前言根据净好大佬的两份笔记, 这里记录一下交叉验证和模型集成. 交叉验证是在kaggle教程里学的, 模型集成是抱佛脚学的. A榜笔记：tvq27xqm30o.feishu.cn/docx/V2gfdv… B榜笔记：tvq27xqm30o.f...

admin2年前

0220

循环神经网络介绍

循环神经网络(Recurrent Neural Network, RNN)是一种能够处理序列数据的神经网络,在自然语言处理、语音识别、手写识别等领域发挥着重要作用。相比普通的前馈神经网络,RNN可以捕捉时间序列数据中...

admin2年前

0190

知识图谱之《海贼王-ONEPICE》领域图谱项目实战（含码源）：数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等

知识图谱之《海贼王-ONEPICE》领域图谱项目实战（含码源）：数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等实体关系可视化页面可视化页面尝鲜 1. 项目背景&...

博客文章

admin2年前

0180

LLM – finetuning – 踩坑经验之谈

一、前言由于 chatgpt 和 gp4 兴起。如何让人人都用上这种大模型，是目前 AI 领域最活跃的事情。当下开源的 LLM(Large language model) 非常多，可谓是百模大战。面对诸多开源本地模型，根据自...

人工智能

admin2年前

0180

无所不能的Embedding2 – 词向量三巨头之FastText详解

携手创作，共同成长！这是我参与「掘金日新计划 · 8 月更文挑战」的第9天，点击查看活动详情 Fasttext是FaceBook开源的文本分类和词向量训练库。最初看其他教程看的我十分迷惑，咋的一会ngram...

admin2年前

0170

2023年LLM如何入门？请看这篇综述！丨论文解读

零、前言： ?欢迎访问：个人博客：conqueror712.github.io/ 知乎：www.zhihu.com/people/soeu… Bilibili：space.bilibili.com/57089326 掘金：juejin.cn/user/129787… 注意，本文不涉及太多...

admin2年前

0170

Diffusion Model Noise Schedule

本文仅适用于已经了解什么是Diffusion Model的人。我们知道，在Diffusion Model中存在正向扩散过程——破坏数据和逆向扩散过程——生成过程。在正向过程中，我们给定一个数据，随着时间步 tt...

admin2年前

0160

【ACL 2023】面向轻量化文图检索的Dual-Encoder模型蒸馏算法ConaCLIP

近日，阿里云机器学习平台PAI与华南理工大学金连文教授团队合作在自然语言处理顶级会议ACL 2023上发表面向轻量化文图检索的dual-encoder模型蒸馏算法ConaCLIP（ fully-Connected knowledge inte...

admin2年前

0160

Transformers自然语言处理第一章你好Transformer

2017年，Google的研究人员发表了一篇论文，提出了一种新的用于序列建模（sequence modeling）的神经网络架构[1]。称之为Transformer，这种架构在机器翻译任务中的表现无论在翻译质量还是训练成...

人工智能

admin2年前

0150

聊聊自然语言处理NLP

概述自然语言处理(NLP)的正式定义：是一个使用计算机科学、人工智能(AI)和形式语言学概念来分析自然语言的研究领域。不太正式的定义表明：它是一组工具，用于从自然语言源(如web页面和文本文档...

博客文章

admin2年前

0150

解密Prompt系列12. LLM Agent零微调范式 ReAct & Self Ask

合集 - DecryptPrompt(12)1.解密Prompt系列8. 无需训练让LLM支持超长输入:知识库 & unlimiformer & PCW & NBCE06-132.解密Prompt系列6. lora指令微调扣细节-请冷静,1个小时真不够~0...

博客文章

admin2年前

0140

解密Prompt系列8. 无需训练让LLM支持超长输入:知识库 & unlimiformer & PCW & NBCE

合集 - DecryptPrompt(8)1.解密Prompt系列8. 无需训练让LLM支持超长输入:知识库 & unlimiformer & PCW & NBCE06-132.解密Prompt系列6. lora指令微调扣细节-请冷静,1个小时真不够~04...

人工智能博客文章

admin2年前

0140

解密Prompt系列13. LLM Agent指令微调方案: Toolformer & Gorilla

上一章我们介绍了基于Prompt范式的工具调用方案，这一章介绍基于模型微调，支持任意多工具组合调用，复杂调用的方案。多工具调用核心需要解决3个问题，在哪个位置进行工具调用(where), 从众多工...

admin2年前

0140

12 3 4 下一页