深度学习共0篇 第9页
深度学习
语言大模型100K上下文窗口的秘诀-五八三

语言大模型100K上下文窗口的秘诀

上下文窗口(context window)是指语言模型在进行预测或生成文本时,所考虑的前一个词元(token)或文本片段的大小范围。 在语言模型中,上下文窗口对于理解和生成与特定上下文相关的文本至关重...
admin的头像-五八三admin2年前
0100
深度学习100例 | 第37天:人脸表情识别-五八三

深度学习100例 | 第37天:人脸表情识别

? 我的环境: 语言环境:Python3.10.11 编译器:Jupyter Notebook 深度学习框架:TensorFlow2.4.1 显卡(GPU):NVIDIA GeForce RTX 4070 ? 相关教程: 编译器教程:【新手入门深度学习 | 1-2:...
admin的头像-五八三admin2年前
0120
深度学习(四)——torchvision中数据集的使用-五八三

深度学习(四)——torchvision中数据集的使用

一、 科研数据集# 下载链接: https://pytorch.org/vision/stable/index.html 本文中我们使用的是CIFAR数据集 二、CIFAR10数据集详解# 具体网站: CIFAR10 — Torchvision 0.15 documentation 1...
admin的头像-五八三admin2年前
080
深度学习(九)——神经网络:最大池化的作用-五八三

深度学习(九)——神经网络:最大池化的作用

一、 torch.nn中Pool layers的介绍# 官网链接: https://pytorch.org/docs/stable/nn.html#pooling-layers 1. nn.MaxPool2d介绍# nn.MaxPool2d是在进行图像处理时,Pool layers最常用的函数 官...
admin的头像-五八三admin2年前
0210
深度学习语义分割篇——LR-ASPP原理详解+源码实战-五八三

深度学习语义分割篇——LR-ASPP原理详解+源码实战

本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ?作者简介:秃头小苏,致力于用最通俗的语言描述问题 ?专栏推荐:深度学习网络原理与实战 ?近期目标...
admin的头像-五八三admin2年前
050
深度学习应用篇-推荐系统[12]:经典模型-DeepFM模型、DSSM模型召回排序策略以及和其他模型对比-五八三

深度学习应用篇-推荐系统[12]:经典模型-DeepFM模型、DSSM模型召回排序策略以及和其他模型对比

深度学习应用篇-推荐系统[12]:经典模型-DeepFM模型、DSSM模型召回排序策略以及和其他模型对比 1.DeepFM模型 1.1.模型简介 CTR预估是目前推荐系统的核心技术,其目标是预估用户点击推荐内容的概...

强化学习从基础到进阶-常见问题和面试必知必答[2]:马尔科夫决策、贝尔曼方程、动态规划、策略价值迭代

强化学习从基础到进阶-常见问题和面试必知必答[2]:马尔科夫决策、贝尔曼方程、动态规划、策略价值迭代 1.马尔科夫决策核心词汇 马尔可夫性质(Markov property,MP):如果某一个过程未来的状...
admin的头像-五八三admin2年前
0130
开源免费,无需训练,只需一张图片让你轻松实现换脸-五八三

开源免费,无需训练,只需一张图片让你轻松实现换脸

开源库地址 roop 软件运行截图 效果图 安装 clone 代码到本地 git clone https://github.com/s0md3v/roop.git 创建 python 虚拟环境并激活 python -m venv .venv .venv\Scripts\activate 安装依...
admin的头像-五八三admin2年前
020
《设计深度学习系统》第五章:超参数优化服务-五八三

《设计深度学习系统》第五章:超参数优化服务

本章内容包括:  超参数及其重要性  两种常见的超参数优化方法(HPO)  设计一个HPO服务  三个流行的HPO库:Hyperopt、Optuna和Ray Tune 在前两章中,我们了解了模型的训练方式:一个训...
admin的头像-五八三admin2年前
070
人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法-五八三

人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法

人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法 1.SFT 监督微调 1.1 SFT 监督微调基本概念 SFT(Supervised Fine-Tuning)监督微调是指...
admin的头像-五八三admin2年前
030
一文读懂十二大深度神经网络-五八三

一文读懂十二大深度神经网络

本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! beginning     一提到深度神经网络,大家脑海中第一个浮现的无疑是卷积神经网络(Convolutional Ne...
admin的头像-五八三admin2年前
070
落地大模型应知必会(3): 如何构建多任务的LLM应用-五八三

落地大模型应知必会(3): 如何构建多任务的LLM应用

编者按:今年以来,大语言模型(LLM)已被广泛应用于各种自然语言处理任务,也越来越多地被用于构建复杂的语言应用。但是构建多任务的 LLM 应用仍面临一定的挑战,需要解决任务组合和调控等问题。...
admin的头像-五八三admin2年前
070
深度学习应用篇-计算机视觉-图像分类[2]:LeNet、AlexNet、VGG、GoogleNet、DarkNet模型结构、实现、模型特点详细介绍-五八三

深度学习应用篇-计算机视觉-图像分类[2]:LeNet、AlexNet、VGG、GoogleNet、DarkNet模型结构、实现、模型特点详细介绍

深度学习应用篇-计算机视觉-图像分类[2]:LeNet、AlexNet、VGG、GoogleNet、DarkNet模型结构、实现、模型特点详细介绍 1.LeNet(1998) LeNet是最早的卷积神经网络之一[1],其被提出用于识别手...
揭示GPT Tokenizer的工作原理-五八三

揭示GPT Tokenizer的工作原理

在GPT模型中,tokenization(词元化)指的是将用户输入的文本分割成token(词元)的过程,以让GPT能更好地理解输入文本的词义、句法和语义,以及生成更连贯的输出内容。这是非常重要的预处理操...
admin的头像-五八三admin2年前
020
强化学习从基础到进阶-案例与实践[4.1]:深度Q网络-DQN项目实战CartPole-v0-五八三

强化学习从基础到进阶-案例与实践[4.1]:深度Q网络-DQN项目实战CartPole-v0

强化学习从基础到进阶-案例与实践[4.1]:深度Q网络-DQN项目实战CartPole-v0 1、定义算法 相比于Q learning,DQN本质上是为了适应更为复杂的环境,并且经过不断的改良迭代,到了Nature DQN(即Vo...
admin的头像-五八三admin2年前
030
超越开源与闭源Code LLMs!——WizardCoder,一款Code Evol-Instruct tuning的代码生成模型-五八三

超越开源与闭源Code LLMs!——WizardCoder,一款Code Evol-Instruct tuning的代码生成模型

我正在参加「掘金·启航计划」 导语 这个工作的整体思路比较简洁,可以认为就是将之前一篇论文(WizardLM)中提出的Evol-instruct的思想应用到了Code LLM领域(之前是通用领域),整体论文方法...
admin的头像-五八三admin2年前
020

使用Python读取图片

一、Python学习两大道具# 1. dir()工具# 作用:支持打开package,看到里面的工具函数 示例: (1) 输出torch库包含的函数 Copydir(torch) (2) 输出torch.AVG函数中的参数 Copydir(torch.AVG) 2. ...
admin的头像-五八三admin2年前
0140
【CaiT】如何才能使VIT网络往更深层发展-五八三

【CaiT】如何才能使VIT网络往更深层发展

论文: Going deeper with Image Transformers 代码: Deit 前言   近些天综合看CNN 领域内的文章以及VIT领域内的文章,在比对这两大类模型设计的特点时有一篇文章提醒到我了,它与CNN领域内...
admin的头像-五八三admin2年前
0180
基于MMGeneration实现CycleGAN图像风格迁移-五八三

基于MMGeneration实现CycleGAN图像风格迁移

本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! beginning     之前在十二大深度神经网络中给盆友们简单介绍了GAN网络大家族。其中,CycleGAN算是...
admin的头像-五八三admin2年前
0220
深度学习(十一)——神经网络:线形层及其他层介绍-五八三

深度学习(十一)——神经网络:线形层及其他层介绍

一、正则化层中nn.BatchNorm2d简介# 主要作用:对输入函数采用正则化。正则化的主要作用是加快神经网络的训练速度。 Copyclass torch.nn.BatchNorm2d(num_features, eps=1e-05, momentum=0.1, a...
admin的头像-五八三admin2年前
0160