深度学习共0篇 第4页
深度学习
AI模型部署:TensorRT模型INT8量化的Python实现-五八三

AI模型部署:TensorRT模型INT8量化的Python实现

AI模型部署:TensorRT模型INT8量化的Python实现 本文首发于公众号【DeepDriving】,欢迎关注。 概述 目前深度学习模型的参数在训练阶段基本上都是采用32位浮点(FP32)来表示,以便能有更大的动...
admin的头像-五八三admin2年前
0120
爆火论文“14行代码打败BERT”出现反转!改掉bug性能秒变最差-五八三

爆火论文“14行代码打败BERT”出现反转!改掉bug性能秒变最差

前言 50年前的kNN算法,只用14行代码在文本分类上超越风头正盛的Transformer,包括BERT 本文转载自量子位 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术...
admin的头像-五八三admin2年前
0180
【计算机视觉项目实战】中文场景识别-五八三

【计算机视觉项目实战】中文场景识别

⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ✨专栏介绍: 经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程...
admin的头像-五八三admin2年前
0100
作为一个老程序员,想对新人说什么?-五八三

作为一个老程序员,想对新人说什么?

前言 最近知乎上,有一位大佬邀请我回答下面这个问题,看到这个问题我百感交集,感触颇多。 在我是新人时,如果有前辈能够指导方向一下,分享一些踩坑经历,或许会让我少走很多弯路,节省更多的...
admin的头像-五八三admin2年前
090
大语言模型的预训练[6]:思维链(Chain-of-thought,CoT)定义原理详解以及在LLM上应用-五八三

大语言模型的预训练[6]:思维链(Chain-of-thought,CoT)定义原理详解以及在LLM上应用

大语言模型的预训练[6]:思维链(Chain-of-thought,CoT)定义原理详解、Zero-shot CoT、Few-shot CoT 以及在LLM上应用 1.思维链定义 背景 在 2017-2019 年之间,随着 Transformer 模型的提出,计...
admin的头像-五八三admin2年前
0120
深度学习(七)——神经网络的卷积操作-五八三

深度学习(七)——神经网络的卷积操作

卷积操作# 一、torch.nn中Convolution Layers函数的介绍# 1. 参数介绍# nn.Conv1d: Conv取自Convolution的前四个字母,1d代表的是一个一维操作。 nn.Conv2d: 2d表示是一个二维的操作,比如图像...
admin的头像-五八三admin2年前
0310
《深入浅出OCR》前言知识(二):深度学习知识总结-五八三

《深入浅出OCR》前言知识(二):深度学习知识总结

⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ✨专栏介绍: 经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程...
admin的头像-五八三admin2年前
0500
【CaiT】如何才能使VIT网络往更深层发展-五八三

【CaiT】如何才能使VIT网络往更深层发展

论文: Going deeper with Image Transformers 代码: Deit 前言   近些天综合看CNN 领域内的文章以及VIT领域内的文章,在比对这两大类模型设计的特点时有一篇文章提醒到我了,它与CNN领域内...
admin的头像-五八三admin2年前
0180
手把手教你搭建神经网络分类——基础篇-五八三

手把手教你搭建神经网络分类——基础篇

本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! beginning     之前给盆友们介绍了卷积神经网络CNN的基本结构,并简单实现了图像的二分类,相信大...
admin的头像-五八三admin2年前
070
深度学习语义分割篇——DeepLabV2原理详解篇-五八三

深度学习语义分割篇——DeepLabV2原理详解篇

本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ?作者简介:秃头小苏,致力于用最通俗的语言描述问题 ?专栏推荐:深度学习网络原理与实战 ?近期目标...
admin的头像-五八三admin2年前
040
惊艳!AI创意字体真绝了;6道AIGC高频面试题与解答;为啥语音助手还没集成LLM;深度学习算法红宝书 | ShowMeAI日报-五八三

惊艳!AI创意字体真绝了;6道AIGC高频面试题与解答;为啥语音助手还没集成LLM;深度学习算法红宝书 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 惊艳!手把手教你使用 Stable Diffusion 制作AI创意字体 最近AI创意字体刷爆了 ShowMeAI 社群!伙伴们纷纷惊叹这...
admin的头像-五八三admin2年前
0160
大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型应用以及各个版本之间的区别详解-五八三

大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型应用以及各个版本之间的区别详解

大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型应用以及各个版本之间的区别详解 1.GPT 模型 1.1 GPT 模型简介 在自然语言处理问题中,可从互联网上下载大量...
admin的头像-五八三admin2年前
0120
时间序列问题-五八三

时间序列问题

序言: 时间序列是将某个统计量按照时间的先后顺序,按照其统计的值排列成的数列。 时间序列是通过已经发生的知识,即就是序列的规律,预测未来序列的数值情况,通常应用于连续的预测问题。比如...
admin的头像-五八三admin2年前
0230
Domain Adaptation_few labels handing 缺少标注数据下的迁移学习方法。-五八三

Domain Adaptation_few labels handing 缺少标注数据下的迁移学习方法。

Domain Adaptation 介绍 :::info 了解Domian Adaptation之前,先了解 迁移学习(Transfer Learning) ::: 迁移学习(Transfer Learning)通俗来讲就是学会举一反三的能力,通过运用已有的知识来...
admin的头像-五八三admin2年前
070
人工智能LLM模型:奖励模型的训练、PPO 强化学习的训练、RLHF-五八三

人工智能LLM模型:奖励模型的训练、PPO 强化学习的训练、RLHF

人工智能LLM模型:奖励模型的训练、PPO 强化学习的训练、RLHF 1.奖励模型的训练 1.1大语言模型中奖励模型的概念 在大语言模型完成 SFT 监督微调后,下一阶段是构建一个奖励模型来对问答对作出得...
admin的头像-五八三admin2年前
0140
探索AI图像安全,助力可信AI发展-五八三

探索AI图像安全,助力可信AI发展

0. 前言 随着人工智能( Artificial Intelligence, AI )技术的发展,已经逐渐成为生活中不可或缺的一部分,为我们的生活带来了诸多便利和创新,但与此同时也带来了一系列的安全挑战,例如恶意篡...
admin的头像-五八三admin2年前
0130
人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法-五八三

人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法

人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法 1.SFT 监督微调 1.1 SFT 监督微调基本概念 SFT(Supervised Fine-Tuning)监督微调是指...
admin的头像-五八三admin2年前
030
人工智能自然语言处理:N-gram和TF-IDF模型详解-五八三

人工智能自然语言处理:N-gram和TF-IDF模型详解

人工智能自然语言处理:N-gram和TF-IDF模型详解 1.N-gram 模型 N-Gram 是一种基于统计语言模型的算法。它的基本思想是将文本里面的内容按照字节进行大小为 N 的滑动窗口操作,形成了长度是 N 的...
admin的头像-五八三admin2年前
040

如何正确地使用Pytorch 的 GPU 加速训练?

一、问题描述 在将原本运行在 CPU 上的 PyTorch 代码移动到 GPU 上时,容易报错: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu! (when che...
admin的头像-五八三admin2年前
0100
GAN入门|第二篇:人脸图像生成(DCGAN)-五八三

GAN入门|第二篇:人脸图像生成(DCGAN)

? 本文为?365天深度学习训练营 中的学习记录博客 ? 原作者:K同学啊 ? 参考文章:GAN入门|第二篇:人脸图像生成(DCGAN) ? 我的环境: 语言环境:Python3.10.11 编译器:Jupyter Notebook 深...
admin的头像-五八三admin2年前
040