人工智能共897篇 第43页
人工智能
多模态大语言模型 LlaVA 论文解读:Visual Instruction Tuning-五八三

多模态大语言模型 LlaVA 论文解读:Visual Instruction Tuning

代码:https://github.com/haotian-liu/LLaVA 总览 在这篇论文中,作者首次尝试使用纯语言 GPT-4 生成多模态语言图像指令遵循数据(insruction-following data)。 通过对此类生成数据进行指令...
admin的头像-五八三admin2年前
0110
你的私人ChatGPT来啦!-五八三

你的私人ChatGPT来啦!

一、申请 OpenAI API Key 1. 访问OpenAI的官网。 platform.openai.com/account/api… 2. 登录之后点击右上角自己的头像。 3. 点击下面的 View API keys。 4. 点左侧导航里面的 API Keys。 5. ...
图像识别,不必造轮子-五八三

图像识别,不必造轮子

闲来无事研究了百度图像识别 API,发现该功能还算强大,在此将其使用方法总结成教程,提供大家学习参考 首先预览下效果 从以上预览图中可看出,每张图片识别出5条数据,每条数据根据识别度从高...

机器学习基础-监督学习-标签编码之标签映射(Label Encoding)

标签映射(Label Encoding)是一种常见的标签编码方法,将每个标签都映射为一个整数,常用于分类问题。在标签数量较少的情况下,标签映射可以简单有效地将标签转换为数字表示。 下面是一个使用 ...

springboot集成mqtt

Spring Boot 是基于 Spring 框架的便捷开发的一套工具,可以极大地提高开发人员的开发效率。MQTT(Message Queuing Telemetry Transport)是基于发布订阅(Publish/Subscribe)模式的轻量级消息...
admin的头像-五八三admin2年前
020
击败LLaMA?史上最强「猎鹰」排行存疑,符尧7行代码亲测,LeCun转赞-五八三

击败LLaMA?史上最强「猎鹰」排行存疑,符尧7行代码亲测,LeCun转赞

【新智元导读】前几天公布的LLM排行榜引发业内人士广泛讨论,新模型Falcon在性能上真的能打过LLaMA吗?符尧实测来了! 前段时间,初出茅庐的猎鹰(Falcon)在LLM排行榜碾压LLaMA,在整个社区激...
admin的头像-五八三admin2年前
060
GPT总设计师:大型语言模型的未来-五八三

GPT总设计师:大型语言模型的未来

来源 | Stanford eCorner OneFlow编译 翻译 | 杨婷、宛子琳、贾川 回头来看,ChatGPT的横空出世验证了Ilya Sutskever此前预想的AI发展方向(mp.weixin.qq.com/s/Q1G0Yv11W… 在OpenAI成立早期,...
耗时一下午,我实现了 GPT Terminal,真正拥有了专属于我的 GPT 终端!-五八三

耗时一下午,我实现了 GPT Terminal,真正拥有了专属于我的 GPT 终端!

项目地址:github.com/ltyzzzxxx/g… 欢迎大家Star、提出PR,共同维护,打造真正意义上的 GPT 终端! 项目介绍 GPT Terminal 是一个让你在终端上与 GPT 进行自由对话的平台。 在这里,你可以更...
admin的头像-五八三admin2年前
050
深度学习应用篇-推荐系统[11]:推荐系统的组成、场景转化指标(pv点击率,uv点击率,曝光点击率)、用户数据指标等评价指标详解-五八三

深度学习应用篇-推荐系统[11]:推荐系统的组成、场景转化指标(pv点击率,uv点击率,曝光点击率)、用户数据指标等评价指标详解

深度学习应用篇-推荐系统[11]:推荐系统的组成、场景转化指标(pv点击率,uv点击率,曝光点击率)、用户数据指标等评价指标详解 1. 推荐系统介绍 在网络技术不断发展和电子商务规模不断扩大的背景...
编码生成矩阵与检错监督矩阵-五八三

编码生成矩阵与检错监督矩阵

本专栏包含信息论与编码的核心知识,按知识点组织,可作为教学或学习的参考。markdown版本已归档至【Github仓库:github.com/timerring/i… 】或者公众号【AIShareLab】回复 信息论 获取。 线性...
admin的头像-五八三admin2年前
030
田渊栋新作:打开1层Transformer黑盒,注意力机制没那么神秘-五八三

田渊栋新作:打开1层Transformer黑盒,注意力机制没那么神秘

【新智元导读】 AI理论再进一步,破解ChatGPT指日可待? Transformer架构已经横扫了包括自然语言处理、计算机视觉、语音、多模态等多个领域,不过目前只是实验效果非常惊艳,对Transformer工作...
admin的头像-五八三admin2年前
030
基于深度学习的高精度足球检测识别系统(PyTorch+Pyside6+YOLOv5模型)-五八三

基于深度学习的高精度足球检测识别系统(PyTorch+Pyside6+YOLOv5模型)

摘要:基于深度学习的高精度足球检测识别系统可用于日常生活中或野外来检测与定位足球目标,利用深度学习算法可实现图片、视频、摄像头等方式的足球目标检测识别,另外支持结果可视化与图片或视...
StableStudio:来自 Stability AI 的开源聊天和图像生成UI-五八三

StableStudio:来自 Stability AI 的开源聊天和图像生成UI

StableStudio 是 Stability AI 开源项目,是 DreamStudio 的开源迭代版本,而 DreamStudio 是专门为其 AI 图像生成模型 Stable Diffusion 开发的专有界面。 GitHub:github.com/Stability-A… S...
自然驱动的解决方案,可使人工智能更节能更高效-五八三

自然驱动的解决方案,可使人工智能更节能更高效

编辑 | 萝卜皮 一辆汽车的「生命」周期内,排放约 126,000 磅的温室气体二氧化碳(CO2)。将这些排放与人工智能(AI)技术留下的碳足迹进行比较。仅 2019 年,训练顶级人工智能便产生了超过 625...
admin的头像-五八三admin2年前
050
GNN+领域知识,川大提出高普适性共晶筛选模型(代码开源)-五八三

GNN+领域知识,川大提出高普适性共晶筛选模型(代码开源)

作者 | 江源远 编辑 | 萝卜皮&闻菲 指导老师 | 蒲雪梅 共晶工程已经成为制药、有机功能材料以及含能材料等领域中改善性能的有效手段,实验往往是通过大量的试错尝试来确定合适的共晶对,实...
admin的头像-五八三admin2年前
050
MirrorGAN 问世!浙大等提出文本 - 图像新框架,刷新 COCO 纪录-五八三

MirrorGAN 问世!浙大等提出文本 – 图像新框架,刷新 COCO 纪录

【新智元导读】 浙大、悉尼大学等高校研究员提出 MirrorGAN,作为全局 - 局部注意和语义保持的文本 - 图像 - 文本框架,解决文本描述和视觉内容之间的语义一致性问题,并在 COCO 数据集上刷新了...
admin的头像-五八三admin2年前
0150
华人小哥打造乔布斯版ChatGPT,网友:感觉他复活了-五八三

华人小哥打造乔布斯版ChatGPT,网友:感觉他复活了

金磊 发自 凹非寺 量子位 | 公众号 QbitAI 走ChatGPT的路,让乔布斯“复活”。 一位华人小哥就真把这事给做成了,还搞了一个App名叫Steve Mind。 玩法和ChatGPT非常相似,只需一个简单的动作—...
admin的头像-五八三admin2年前
080
DeepMind提出视觉问答新模型,CLEVR精度98.8%-五八三

DeepMind提出视觉问答新模型,CLEVR精度98.8%

DeepMind为视觉问题回答提出了一种新的硬注意力机制,它只保留了回答问题所需的少量视觉特征。减少需要处理的特征使得能够训练更大的关系模型,并在CLEVR上实现98.8%的准确率。 论文地址: arx...
admin的头像-五八三admin2年前
0100
亚马逊Q4利润下滑98%/ 盖茨:ChatGPT意义不亚于互联网诞生/ ICLR 2023放榜… 今日更多新鲜事在此-五八三

亚马逊Q4利润下滑98%/ 盖茨:ChatGPT意义不亚于互联网诞生/ ICLR 2023放榜… 今日更多新鲜事在此

日报君 发自 凹非寺 量子位 | 公众号 QbitAI 大家好,今天是2月3日,星期五。 喜欢下班的打工人们,今天可以喜提本周第七次(也是最后一次)下班了! 来跟日报君看看科技圈的今日大事吧。 ICLR ...
admin的头像-五八三admin2年前
080
马斯克矩阵模拟错了?这个试验证明人类不是「缸中之脑」-五八三

马斯克矩阵模拟错了?这个试验证明人类不是「缸中之脑」

【新智元导读】 你相信马斯克的矩阵模拟吗?还是相信人类是生活在现实世界的?最近一项人脑研究调查对「人类生活在基础现实」这一说法提供了有力证据,我们并非「缸中之脑」。 也许你也曾经思考...
admin的头像-五八三admin2年前
0130