排序
【数据集】以人脸关键点为例讲解:如何通过开源项目快速制作关键点数据集
关键词: 人脸关键点 、 labelme 、 数据集 、 快速制作 、 批量制作 前言 人脸关键点检测是计算机视觉中的重要任务,它在人脸识别、表情识别、人脸美化等应用中发挥着关键作用。然而,为了...
AI模型部署:TensorRT模型INT8量化的Python实现
AI模型部署:TensorRT模型INT8量化的Python实现 本文首发于公众号【DeepDriving】,欢迎关注。 概述 目前深度学习模型的参数在训练阶段基本上都是采用32位浮点(FP32)来表示,以便能有更大的动...
作为一个老程序员,想对新人说什么?
前言 最近知乎上,有一位大佬邀请我回答下面这个问题,看到这个问题我百感交集,感触颇多。 在我是新人时,如果有前辈能够指导方向一下,分享一些踩坑经历,或许会让我少走很多弯路,节省更多的...
爆火论文“14行代码打败BERT”出现反转!改掉bug性能秒变最差
前言 50年前的kNN算法,只用14行代码在文本分类上超越风头正盛的Transformer,包括BERT 本文转载自量子位 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术...
【计算机视觉项目实战】中文场景识别
⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ✨专栏介绍: 经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程...
大语言模型的预训练[6]:思维链(Chain-of-thought,CoT)定义原理详解以及在LLM上应用
大语言模型的预训练[6]:思维链(Chain-of-thought,CoT)定义原理详解、Zero-shot CoT、Few-shot CoT 以及在LLM上应用 1.思维链定义 背景 在 2017-2019 年之间,随着 Transformer 模型的提出,计...
深度学习(七)——神经网络的卷积操作
卷积操作# 一、torch.nn中Convolution Layers函数的介绍# 1. 参数介绍# nn.Conv1d: Conv取自Convolution的前四个字母,1d代表的是一个一维操作。 nn.Conv2d: 2d表示是一个二维的操作,比如图像...
《深入浅出OCR》前言知识(二):深度学习知识总结
⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ✨专栏介绍: 经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程...
【CaiT】如何才能使VIT网络往更深层发展
论文: Going deeper with Image Transformers 代码: Deit 前言 近些天综合看CNN 领域内的文章以及VIT领域内的文章,在比对这两大类模型设计的特点时有一篇文章提醒到我了,它与CNN领域内...
惊艳!AI创意字体真绝了;6道AIGC高频面试题与解答;为啥语音助手还没集成LLM;深度学习算法红宝书 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 惊艳!手把手教你使用 Stable Diffusion 制作AI创意字体 最近AI创意字体刷爆了 ShowMeAI 社群!伙伴们纷纷惊叹这...
手把手教你搭建神经网络分类——基础篇
本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! beginning 之前给盆友们介绍了卷积神经网络CNN的基本结构,并简单实现了图像的二分类,相信大...
大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型应用以及各个版本之间的区别详解
大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型应用以及各个版本之间的区别详解 1.GPT 模型 1.1 GPT 模型简介 在自然语言处理问题中,可从互联网上下载大量...
深度学习语义分割篇——DeepLabV2原理详解篇
本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ?作者简介:秃头小苏,致力于用最通俗的语言描述问题 ?专栏推荐:深度学习网络原理与实战 ?近期目标...
努力做最好的自己,其他的交给天意(关于高考)
前言 首先,因为马上要高考了,然后写这篇文章是因为受人所托,后面想想,高考确实使我们人生中的一件大事,也是一个转折点,所以想了想就写了这篇文章,里面写的是有关家长要做的和考生自己要...
时间序列问题
序言: 时间序列是将某个统计量按照时间的先后顺序,按照其统计的值排列成的数列。 时间序列是通过已经发生的知识,即就是序列的规律,预测未来序列的数值情况,通常应用于连续的预测问题。比如...
Domain Adaptation_few labels handing 缺少标注数据下的迁移学习方法。
Domain Adaptation 介绍 :::info 了解Domian Adaptation之前,先了解 迁移学习(Transfer Learning) ::: 迁移学习(Transfer Learning)通俗来讲就是学会举一反三的能力,通过运用已有的知识来...
人工智能LLM模型:奖励模型的训练、PPO 强化学习的训练、RLHF
人工智能LLM模型:奖励模型的训练、PPO 强化学习的训练、RLHF 1.奖励模型的训练 1.1大语言模型中奖励模型的概念 在大语言模型完成 SFT 监督微调后,下一阶段是构建一个奖励模型来对问答对作出得...
探索AI图像安全,助力可信AI发展
0. 前言 随着人工智能( Artificial Intelligence, AI )技术的发展,已经逐渐成为生活中不可或缺的一部分,为我们的生活带来了诸多便利和创新,但与此同时也带来了一系列的安全挑战,例如恶意篡...
人工智能自然语言处理:N-gram和TF-IDF模型详解
人工智能自然语言处理:N-gram和TF-IDF模型详解 1.N-gram 模型 N-Gram 是一种基于统计语言模型的算法。它的基本思想是将文本里面的内容按照字节进行大小为 N 的滑动窗口操作,形成了长度是 N 的...
人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法
人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法 1.SFT 监督微调 1.1 SFT 监督微调基本概念 SFT(Supervised Fine-Tuning)监督微调是指...