排序
attention总结(初版)
引言 本文将总结归纳个人搜集关于注意力机制的一些简单通俗理解,在失业期间作为个人充电的起始,本文不包含众多注意力机制以及其组合的变体,只为方便理解后续的一些算法做铺垫。 本文首先介绍...
深度学习应用篇-计算机视觉-语义分割综述[6]:DeepLab系列简介、DeepLabV3深入解读创新点、训练策略、主要贡献
深度学习应用篇-计算机视觉-语义分割综述[6]:DeepLab系列简介、DeepLabV3深入解读创新点、训练策略、主要贡献 0.DeepLabV3深入解读 1、DeepLab系列简介 1.1.DeepLabV1 作者发现Deep Convolutio...
深度学习应用篇-元学习[15]:基于度量的元学习:SNAIL、RN、PN、MN
深度学习应用篇-元学习[15]:基于度量的元学习:SNAIL、RN、PN、MN 1.Simple Neural Attentive Learner(SNAIL) 元学习可以被定义为一种序列到序列的问题, 在现存的方法中,元学习器的瓶颈是如...
探索Text-to-SQL前沿:ChatGPT在BIRD基准测试中未达到人类表现的一半性能
我正在参加「掘金·启航计划」 导语 随着像ChatGPT之类的大语言模型的迅速发展,NLP中许多的研究领域受到冲击,之前的一篇博客看看ChatGPT对Text-to-SQL任务的冲击介绍了清华大学团队使用ChatGP...
深度学习的优化算法
本周的内容主要是一些优化算法的知识点,这些优化算法可以帮助我们更好更快速的训练一个深度学习模型,Let's Go! 1. 优化算法的重要性 优化算法在机器学习和深度学习领域起着关键的作用,特别是...
Transformer作者:指令型智能体的构建之法
来源 | The Robot Brains Podcast OneFlow编译 翻译|徐佳渝、贾川、杨婷 2017年,Google发布的《Attention Is All You Need》论文提出了Transformer架构,这成为过去十年神经网络领域最具影响...
AI模型部署:TensorRT模型INT8量化的Python实现
AI模型部署:TensorRT模型INT8量化的Python实现 本文首发于公众号【DeepDriving】,欢迎关注。 概述 目前深度学习模型的参数在训练阶段基本上都是采用32位浮点(FP32)来表示,以便能有更大的动...
GPT-4.5前瞻:代码解释器,编程新纪元
继ChatGPT、GPT-4引爆语言大模型之后,近日发布的代码解释器(Code Interpreter)又将这一领域推向了高潮。 代码解释器是ChatGPT插件更新的一部分,可以读取上传的文件,执行代码,生成图表,进...
【智慧交通项目实战】 OCR车牌检测与识别项目实战(一):项目总览
??作者简介: CSDN、阿里云人工智能领域博客专家,新星计划计算机视觉导师,百度飞桨PPDE,专注大数据与AI知识分享。✨公众号:GoAI的学习小屋 ,免费分享书籍、简历、导图等,更有交流群分享...
AI模型部署实战:利用CV-CUDA加速视觉模型部署流程
本文首发于公众号【DeepDriving】,欢迎关注。 CV-CUDA简介 随着深度学习技术在计算机视觉领域的发展,越来越多的AI算法模型被用于目标检测、图像分割、图像生成等任务中,如何高效地在云端或者...
mini GPT 实现文本生成
前文 本文主要展示了如何实现微型的 GPT 模型完成文本生成任务,该模型只由 1 个 Transformer 块组成。 Data 这部分代码主要用于准备文本数据集进行语言模型训练,这里需要事先下载好 aclImdb ...
《设计深度学习系统》第三章:模型训练服务
本章涵盖了以下内容: 构建训练服务的设计原则 解释深度学习训练代码模式 浏览示例训练服务 使用开源训练服务,例如Kubeflow 决定何时使用公共云训练服务 机器学习中模型训练的任务并不仅仅是研...
GAN入门|第二篇:人脸图像生成(DCGAN)
? 本文为?365天深度学习训练营 中的学习记录博客 ? 原作者:K同学啊 ? 参考文章:GAN入门|第二篇:人脸图像生成(DCGAN) ? 我的环境: 语言环境:Python3.10.11 编译器:Jupyter Notebook 深...
深度学习100例 | 第31天-卷积神经网络(DenseNet)识别生活物品
? 我的环境: 语言环境:Python3.6.5 编译器:jupyter notebook 深度学习环境:TensorFlow2.4.1 显卡(GPU):NVIDIA GeForce RTX 3080 ? 相关教程: 编译器教程:【新手入门深度学习 | 1-2:编...
深度学习—04—模型选择、欠拟合和过拟合
4.4 模型选择、欠拟合和过拟合 我们的目标是发现模式,但是,我们如何才能确定模型是真正发现了一种泛化的模式, 而不是简单地记住了数据呢? 更正式地说,我们的目标是发现某些模式, 这些模式...
头疼!卷积神经网络是什么?CNN结构、训练与优化一文全解
本文全面探讨了卷积神经网络CNN,深入分析了背景和重要性、定义与层次介绍、训练与优化,详细分析了其卷积层、激活函数、池化层、归一化层,最后列出其训练与优化的多项关键技术:训练集准备与...
OneFlow源码解析:基础计算接口Primitive
作者|郑建华 此前,OneFlow 版本更新(mp.weixin.qq.com/s/FQiBMSDLD… 博客中的第 5 节对框架的“多设备适配”作了说明,原文摘录如下: OneFlow 提供简洁高效易扩展的硬件抽象层 EP(Executi...
关于RPG游戏的强化学习
摘要-近年来,研究人员在使用深度神经网络控制各种棋盘、竞技场和策略游戏方面取得了显著成功。然而,尝试控制角色扮演游戏(RPG)的尝试相对较少,而这些游戏在概念上可能最接近现实生活环境。...
强化学习从基础到进阶-案例与实践[4]:深度Q网络-DQN、double DQN、经验回放、rainbow、分布式DQN
强化学习从基础到进阶-案例与实践[4]:深度Q网络-DQN、double DQN、经验回放、rainbow、分布式DQN 传统的强化学习算法会使用表格的形式存储状态价值函数 V(s)V(s)V(s) 或动作价值函数 Q(s,a)Q(s...
强化学习从基础到进阶-案例与实践[4.2]:深度Q网络DQN-Cart pole游戏展示
强化学习从基础到进阶-案例与实践[4.2]:深度Q网络DQN-Cart pole游戏展示 强化学习(Reinforcement learning,简称RL)是机器学习中的一个领域,区别与监督学习和无监督学习,强调如何基于环境...