深度学习-五八三-第4页

AI模型部署：TensorRT模型INT8量化的Python实现

AI模型部署：TensorRT模型INT8量化的Python实现本文首发于公众号【DeepDriving】，欢迎关注。概述目前深度学习模型的参数在训练阶段基本上都是采用32位浮点（FP32）来表示，以便能有更大的动...

admin2年前

0120

爆火论文“14行代码打败BERT”出现反转！改掉bug性能秒变最差

前言 50年前的kNN算法，只用14行代码在文本分类上超越风头正盛的Transformer，包括BERT 本文转载自量子位仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术...

admin2年前

0180

【计算机视觉项目实战】中文场景识别

⚠️本文为稀土掘金技术社区首发签约文章，30天内禁止转载，30天后未获授权禁止转载，侵权必究！ ✨专栏介绍：经过几个月的精心筹备，本作者推出全新系列《深入浅出OCR》专栏，对标最全OCR教程...

admin2年前

0100

作为一个老程序员，想对新人说什么？

前言最近知乎上，有一位大佬邀请我回答下面这个问题，看到这个问题我百感交集，感触颇多。在我是新人时，如果有前辈能够指导方向一下，分享一些踩坑经历，或许会让我少走很多弯路，节省更多的...

admin2年前

090

大语言模型的预训练[6]：思维链(Chain-of-thought，CoT)定义原理详解以及在LLM上应用

大语言模型的预训练[6]：思维链(Chain-of-thought，CoT)定义原理详解、Zero-shot CoT、Few-shot CoT 以及在LLM上应用 1.思维链定义背景在 2017-2019 年之间，随着 Transformer 模型的提出，计...

admin2年前

0120

深度学习（七）——神经网络的卷积操作

卷积操作# 一、torch.nn中Convolution Layers函数的介绍# 1. 参数介绍# nn.Conv1d: Conv取自Convolution的前四个字母，1d代表的是一个一维操作。 nn.Conv2d: 2d表示是一个二维的操作，比如图像...

博客文章

admin2年前

0310

《深入浅出OCR》前言知识（二）：深度学习知识总结

admin2年前

0500

【CaiT】如何才能使VIT网络往更深层发展

论文： Going deeper with Image Transformers 代码： Deit 前言近些天综合看CNN 领域内的文章以及VIT领域内的文章，在比对这两大类模型设计的特点时有一篇文章提醒到我了，它与CNN领域内...

admin2年前

0180

手把手教你搭建神经网络分类——基础篇

本文为稀土掘金技术社区首发签约文章，30天内禁止转载，30天后未获授权禁止转载，侵权必究! beginning 之前给盆友们介绍了卷积神经网络CNN的基本结构，并简单实现了图像的二分类，相信大...

admin2年前

070

深度学习语义分割篇——DeepLabV2原理详解篇

本文为稀土掘金技术社区首发签约文章，30天内禁止转载，30天后未获授权禁止转载，侵权必究！ ?作者简介：秃头小苏，致力于用最通俗的语言描述问题 ?专栏推荐：深度学习网络原理与实战 ?近期目标...

admin2年前

040

惊艳！AI创意字体真绝了；6道AIGC高频面试题与解答；为啥语音助手还没集成LLM；深度学习算法红宝书 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 惊艳！手把手教你使用 Stable Diffusion 制作AI创意字体最近AI创意字体刷爆了 ShowMeAI 社群！伙伴们纷纷惊叹这...

admin2年前

0160

大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型应用以及各个版本之间的区别详解

大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型应用以及各个版本之间的区别详解 1.GPT 模型 1.1 GPT 模型简介在自然语言处理问题中，可从互联网上下载大量...

admin2年前

0120

时间序列问题

序言：时间序列是将某个统计量按照时间的先后顺序，按照其统计的值排列成的数列。时间序列是通过已经发生的知识，即就是序列的规律，预测未来序列的数值情况，通常应用于连续的预测问题。比如...

admin2年前

0230

Domain Adaptation_few labels handing 缺少标注数据下的迁移学习方法。

Domain Adaptation 介绍 :::info 了解Domian Adaptation之前，先了解迁移学习（Transfer Learning） ::: 迁移学习（Transfer Learning）通俗来讲就是学会举一反三的能力，通过运用已有的知识来...

admin2年前

070

人工智能LLM模型：奖励模型的训练、PPO 强化学习的训练、RLHF

人工智能LLM模型：奖励模型的训练、PPO 强化学习的训练、RLHF 1.奖励模型的训练 1.1大语言模型中奖励模型的概念在大语言模型完成 SFT 监督微调后，下一阶段是构建一个奖励模型来对问答对作出得...

admin2年前

0140

探索AI图像安全，助力可信AI发展

0. 前言随着人工智能( Artificial Intelligence, AI )技术的发展，已经逐渐成为生活中不可或缺的一部分，为我们的生活带来了诸多便利和创新，但与此同时也带来了一系列的安全挑战，例如恶意篡...

admin2年前

0130

人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法

人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法 1.SFT 监督微调 1.1 SFT 监督微调基本概念 SFT（Supervised Fine-Tuning）监督微调是指...

admin2年前

030

人工智能自然语言处理：N-gram和TF-IDF模型详解

人工智能自然语言处理：N-gram和TF-IDF模型详解 1.N-gram 模型 N-Gram 是一种基于统计语言模型的算法。它的基本思想是将文本里面的内容按照字节进行大小为 N 的滑动窗口操作，形成了长度是 N 的...

admin2年前

040

如何正确地使用Pytorch 的 GPU 加速训练？

一、问题描述在将原本运行在 CPU 上的 PyTorch 代码移动到 GPU 上时,容易报错： Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu! (when che...

admin2年前

0100

GAN入门｜第二篇：人脸图像生成（DCGAN）

? 本文为?365天深度学习训练营中的学习记录博客 ? 原作者：K同学啊 ? 参考文章：GAN入门｜第二篇：人脸图像生成（DCGAN） ? 我的环境：语言环境：Python3.10.11 编译器：Jupyter Notebook 深...

admin2年前

040