自然语言处理共0篇
自然语言处理
❤️ GitHub Copilot 读心术揭秘,Copilot 逆向工程笔记-五八三

❤️ GitHub Copilot 读心术揭秘,Copilot 逆向工程笔记

总览 你是否好奇 GitHub Copilot 如何知道你想写的内容?有时候它聪明得甚至好像读过你项目里其他文件一样,不要怀疑,它确实读过。这篇文章记录了我阅读一个对 Copilot 的逆向工程的笔记,一言...
admin的头像-五八三admin2年前
060

聊聊自然语言处理NLP

概述 自然语言处理(NLP)的正式定义:是一个使用计算机科学、人工智能(AI)和形式语言学概念来分析自然语言的研究领域。不太正式的定义表明:它是一组工具,用于从自然语言源(如web页面和文本文档...
admin的头像-五八三admin2年前
0150
知识图谱之《海贼王-ONEPICE》领域图谱项目实战(含码源):数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等-五八三

知识图谱之《海贼王-ONEPICE》领域图谱项目实战(含码源):数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等

知识图谱之《海贼王-ONEPICE》领域图谱项目实战(含码源):数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等 实体关系可视化页面可视化页面尝鲜 1. 项目背景&...
admin的头像-五八三admin2年前
0180

怎么让英文大语言模型支持中文?(三)进行指令微调

前面已经讲过: 怎么让英文大语言模型支持中文?(一)构建中文tokenization 怎么让英文大语言模型支持中文?(二)继续预训练 这里是最后一部分了:怎么让英文大语言模型支持中文?(三)对预...
admin的头像-五八三admin2年前
080

怎么让英文大预言模型支持中文?(一)继续预训练

代码已上传到github: https://github.com/taishan1994/chinese_llm_pretrained Part1前言 前面我们已经讲过怎么构建中文领域的tokenization: https://zhuanlan.zhihu.com/p/639144223 接下来...
admin的头像-五八三admin2年前
040

怎么让英文大预言模型支持中文?(一)构建自己的tokenization

代码地址:https://github.com/taishan1994/sentencepiece_chinese_bpe Part1前言 目前,大语言模型呈爆发式的增长,其中,基于llama家族的模型占据了半壁江山。而原始的llama模型对中文的支持...
admin的头像-五八三admin2年前
040