深度学习共0篇
深度学习
强化学习从基础到进阶-案例与实践[5]:梯度策略、添加基线(baseline)、优势函数、动作分配合适的分数(credit)-五八三

强化学习从基础到进阶-案例与实践[5]:梯度策略、添加基线(baseline)、优势函数、动作分配合适的分数(credit)

强化学习从基础到进阶-案例与实践[5]:梯度策略、添加基线(baseline)、优势函数、动作分配合适的分数(credit) 1 策略梯度算法 如图 5.1 所示,强化学习有 3 个组成部分:演员(actor)、环...
admin的头像-五八三admin2年前
060
关于语言大模型的八大论断-五八三

关于语言大模型的八大论断

近几个月来,语言大模型(LLM)的广泛公开部署引起了倡导者、政策制定者和许多领域学者们的新一轮关注和参与。Anthropic技术团队成员、纽约大学助理教授Samuel R. Bowman总结了八个可能引发思考...
admin的头像-五八三admin2年前
040
超参数调优、批量归一化以及深度学习框架-五八三

超参数调优、批量归一化以及深度学习框架

本篇博客的内容主要是超参数调优,批量归一化以及常见的深度学习框架,也是深度学习专项课程第二门课的最后一周课程内容,Let's Go! 超参数调优 在深度学习中,超参数调优是一个非常关键的过程。...
admin的头像-五八三admin2年前
040
【计算机视觉项目实战】中文场景识别-五八三

【计算机视觉项目实战】中文场景识别

⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ✨专栏介绍: 经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程...
admin的头像-五八三admin2年前
0100
Segment Anything【论文翻译】-五八三

Segment Anything【论文翻译】

论文基础信息如下 Abstract 我们介绍Segment Anything(SA)项目:这是一个全新的任务、模型和图像分割数据集。通过在数据收集循环中使用我们高效的模型,我们建立了迄今为止最大的分割数据集(...
admin的头像-五八三admin2年前
070
前馈神经网络解密:深入理解人工智能的基石-五八三

前馈神经网络解密:深入理解人工智能的基石

本文深入探讨了前馈神经网络(FNN)的核心原理、结构、训练方法和先进变体。通过Python和PyTorch的实战演示,揭示了FNN的多样化应用。 作者TechLead,拥有10+年互联网服务架构、AI产品研发经验...
admin的头像-五八三admin2年前
0140
深度学习应用篇-计算机视觉-目标检测[4]:综述、边界框bounding box、锚框(Anchor box)、交并比、非极大值抑制NMS、SoftNMS-五八三

深度学习应用篇-计算机视觉-目标检测[4]:综述、边界框bounding box、锚框(Anchor box)、交并比、非极大值抑制NMS、SoftNMS

深度学习应用篇-计算机视觉-目标检测[4]:综述、边界框bounding box、锚框(Anchor box)、交并比、非极大值抑制NMS、SoftNMS 1.目标检测综述 对计算机而言,能够“看到”的是图像被编码之后的...
admin的头像-五八三admin2年前
0130
MegEngine 使用小技巧:如何做 MegCC 的模型性能评测-五八三

MegEngine 使用小技巧:如何做 MegCC 的模型性能评测

MegCC 是一个深度学习模型编译器,具有以下特点: 极轻量级运行时:只在二进制文件中保留所需的计算内核。例如,MobileNet v1 的81KB运行时间 高性能:每个操作都经过专家精心优化 便携:只生...
admin的头像-五八三admin2年前
070
全国大数据与计算智能挑战赛:面向低资源的命名实体识别基线方案,排名13/64-五八三

全国大数据与计算智能挑战赛:面向低资源的命名实体识别基线方案,排名13/64

全国大数据与计算智能挑战赛:面向低资源的命名实体识别基线方案,排名13/64 全国大数据与计算智能挑战赛:面向低资源的命名实体识别baseline,排名13/64。第一名:0.68962791,基线:0.6790259...
admin的头像-五八三admin2年前
080
RepoCoder:通过迭代检索提升仓库级代码补全(Repository-Level Code Completion)-五八三

RepoCoder:通过迭代检索提升仓库级代码补全(Repository-Level Code Completion)

我正在参加「掘金·启航计划」 导语 本文介绍了一种名为 RepoCoder 的仓库级代码完成框架,它通过利用仓库级信息,结合相似度检索器和预训练的代码语言模型,提高了代码完成的准确性和效率。同...
admin的头像-五八三admin2年前
090
WideNet:让网络更宽而不是更深-五八三

WideNet:让网络更宽而不是更深

前言 本文介绍了新加坡国立大学在2022 aaai发布的一篇论文。WideNet是一种参数有效的框架,它的方向是更宽而不是更深。通过混合专家(MoE)代替前馈网络(FFN),使模型沿宽度缩放。使用单独LN用于...
admin的头像-五八三admin2年前
070

机器学习之回归

回归是机器学习中最常见的任务之一,回归(regression)问题预测的是一个连续值,而不是离散标签,比如根据气象数据预测明日气温,或者根据房地产数据估算房价(标量回归问题)。 接下来就以回...
admin的头像-五八三admin2年前
0100
大模型的无限上下文与数据集组合艺术-五八三

大模型的无限上下文与数据集组合艺术

来源 | Latent Space OneFlow编译 翻译|贾川、杨婷、宛子琳 上下文长度曾是GPT-3的最大限制之一。GPT-3最多只能接收4000个词元(3000词,6页),否则就会报错。因此,为处理长文档和提示(prom...
admin的头像-五八三admin2年前
060
模型选择、模型评估-五八三

模型选择、模型评估

一、模型选择 在机器学习中,我们通常在**「评估几个候选模型后选择最终的模型」**。 这个过程叫做模型选择。 有时候需要比较的是不同模型,有时候比较的是同一个模型下的不同超参数。 1、数据...
admin的头像-五八三admin2年前
070
深度学习入门系列(四):一文看懂波士顿房价预测(BOSTON_HOUSING)-五八三

深度学习入门系列(四):一文看懂波士顿房价预测(BOSTON_HOUSING)

# 深度学习入门系列(一):一文看懂 MNIST # 深度学习入门系列(二):一文看懂 IMDB # 深度学习入门系列(三):一文看懂 REUTERS BOSTON_HOUSING 这次我们要解决的问题是预测波士顿的房价。...
admin的头像-五八三admin2年前
0120
强化学习从基础到进阶-案例与实践[3]:表格型方法:Sarsa、Qlearning;蒙特卡洛策略、时序差分等以及Qlearning项目实战-五八三

强化学习从基础到进阶-案例与实践[3]:表格型方法:Sarsa、Qlearning;蒙特卡洛策略、时序差分等以及Qlearning项目实战

强化学习从基础到进阶-案例与实践[3]:表格型方法:Sarsa、Qlearning;蒙特卡洛策略、时序差分等以及Qlearning项目实战 策略最简单的表示是查找表(look-up table),即表格型策略(tabular pol...
admin的头像-五八三admin2年前
050
预约直播 | 展心展力MetaApp:基于DeepRec的稀疏模型训练实践-五八三

预约直播 | 展心展力MetaApp:基于DeepRec的稀疏模型训练实践

MetaApp-推荐广告研发部,主要负责 MetaApp 拳头产品 233 乐园的首页信息流的推荐和广告系统,是比较传统的推广搜组。本次议题介绍了 MetaApp-推荐广告研发部  从传统的TensorFlow(cpu)+自研...
admin的头像-五八三admin2年前
040
《设计深度学习系统》第七章:模型服务实战-五八三

《设计深度学习系统》第七章:模型服务实战

本章内容包括: 使用模型服务方法构建一个示例预测器 使用TorchServe和模型服务器方法构建一个示例服务 浏览流行的开源模型服务库和系统 解释生产模型发布过程 讨论模型发布后的监控 在前一章中...
admin的头像-五八三admin2年前
090
时间序列问题-五八三

时间序列问题

序言: 时间序列是将某个统计量按照时间的先后顺序,按照其统计的值排列成的数列。 时间序列是通过已经发生的知识,即就是序列的规律,预测未来序列的数值情况,通常应用于连续的预测问题。比如...
admin的头像-五八三admin2年前
0230
MegEngine Python 层模块串讲(下)-五八三

MegEngine Python 层模块串讲(下)

在前面的文章中,我们简单介绍了在 MegEngine imperative 中的各模块以及它们的作用。对于新用户而言可能不太了解各个模块的使用方法,对于模块的结构和原理也是一头雾水。Python 作为现在深...
admin的头像-五八三admin2年前
090