排序
MirrorGAN 问世!浙大等提出文本 – 图像新框架,刷新 COCO 纪录
【新智元导读】 浙大、悉尼大学等高校研究员提出 MirrorGAN,作为全局 - 局部注意和语义保持的文本 - 图像 - 文本框架,解决文本描述和视觉内容之间的语义一致性问题,并在 COCO 数据集上刷新了...
【斯坦福AI Lab综述】弱监督:一种新的机器学习编程范式
【新智元导读】 手工标记大量数据始终是开发机器学习的一大瓶颈。斯坦福 AI Lab 的研究人员探讨了一种通过编程方式生成训练数据的 “弱监督” 范式,并介绍了他们的开源 Snorkel 框架。 近年来...
LeCun 推荐:最新 PyTorch 图神经网络库,速度比DGL快15倍(GitHub + 论文)
【新智元导读】 德国研究者提出最新几何深度学习扩展库 PyTorch Geometric (PyG),具有快速、易用的优势,使得实现图神经网络变得非常容易。作者开源了他们的方法,并提供教程和实例。 过去十年...
谷歌重磅开源NLP通用框架Lingvo,91位作者带来强悍功能
【新智元导读】 谷歌近日开源了一个强大的 NLP 深度学习框架 Lingvo,侧重于语言相关任务的序列模型,如机器翻译、语音识别和语音合成。过去两年来,谷歌已经发表了几十篇使用 Lingvo 获得 SOTA...
人类不要笑,机器人会思考了!
【新智元导读】 哥伦比亚大学打造一只“从零开始”认识自己的机器人,这个机器人在物理学、几何学或运动动力学方面没有先验知识,但经过35小时训练,能够100%完成设定任务,具备自我意识。 “有...
自然语言理解新基准:谷歌重磅发布开放问答数据集,30 万自然提问 + 人工注释答案
【新智元导读】 今天,谷歌重磅发布自然问题数据集 (Natural Questions),包含 30 万个自然发生的问题和人工注释的答案,16000 个示例,并发起基于此数据集的问答系统挑战赛。有望成为自然语言...
Jeff Dean 撰文:一文看全谷歌 AI 2018 研究成果,全程干货!
【新智元导读】 谷歌 AI 团队负责人 Jeff Dean 今天发表博客文章,总结了谷歌的研究团队在 2018 年的主要研究成果。 谷歌 AI 团队负责人 Jeff Dean 今天发布博客文章,总结了谷歌的研究团队在 2...
史上最强 Atari 游戏通关算法:蒙特祖玛获分超过 200 万!
【新智元导读】 Atari 游戏史上最强通关算法来了——Go-Explore!蒙特祖玛获分超过 200 万,平均得分超过 40 万;Pitfall 平均超过 21000 分! 通关 Atari 游戏的最强算法来了! 在强化学习中,...
旧照片着色修复神器!自注意力GAN效果惊艳
一个模型可以实现多个图像修改任务!本文作者结合自注意力GAN、逐渐增大的训练方式等技术,实现了惊艳的旧照片着色效果。 图像着色、图像增强、恢复旧图像等是计算机视觉领域的热点问题,不过,...
MIT韩松团队:AutoML自动模型压缩,全面超越手工调参
MIT韩松团队和Google Cloud的研究人员提出AutoML模型压缩技术,利用强化学习将压缩流程自动化,完全无需人工,而且速度更快,性能更高。 模型压缩是在计算资源有限、能耗预算紧张的移动设备上有...
DensePose姿态转换模型,只需一张照片合成动画效果
DensePose团队在ECCV 2018发表又一杰作:密集人体姿态转换!这是一个基于DensePose的姿势转换系统,仅根据一张输入图像和目标姿势,生成数字人物的动画效果。 DensePose 是 Facebook 研究员 Nat...
MIT用AI实现3分钟自动抠图,精细到头发丝
MIT CSAIL的研究人员开发了一种基于深度学习的图像编辑工具,能够自动抠图,替换任何图像的背景。他们称之为“图像软分割”,这个系统能够分析原始图像的纹理和颜色,仅需3~4分钟,生成非常自然...
深度教练:让深度学习模拟人类教学过程,大幅减少训练数据和时间
本文作者:邓侃,复星集团AI首席科学家、大数医达创始人 DeepMind日前公开了他们首款医疗AI落地产品,能诊断50多种眼疾,精度超越人类医生。为了训练这个系统,DeepMind 用了近1.5万个人工标注...
比RNN快136倍!上交大提出SRNN,能做并行计算
上海交通大学最新提出切片循环神经网络(SRNN),其速度是标准RNN的136倍,并且还能更快!对六个大型情绪分析数据集的实验表明,SRNN的性能均优于标准RNN。 论文和开源代码地址: arxiv.org/pdf...
DeepMind 重磅:神经算术逻辑单元,Keras 实现
DeepMind 最新提出 “神经算术逻辑单元”,旨在解决神经网络数值模拟能力不足的问题。与传统架构相比,NALU 在训练期间的数值范围内和范围外都得到了更好的泛化。论文引起大量关注,本文附上大...
DeepMind提出视觉问答新模型,CLEVR精度98.8%
DeepMind为视觉问题回答提出了一种新的硬注意力机制,它只保留了回答问题所需的少量视觉特征。减少需要处理的特征使得能够训练更大的关系模型,并在CLEVR上实现98.8%的准确率。 论文地址: arx...
UCL等提出完全可微自适应神经树:神经网络与决策树完美结合
UCL、帝国理工和微软的研究人员合作,将神经网络与决策树结合在一起,提出了一种新的自适应神经树模型ANT,打破往局限,可以基于BP算法做训练,在MNIST和CIFAR-10数据集上的准确率高达到99%和90...
中科院团队开发了一种多视图图协作学习模型,可从空间分辨转录组学数据中阐明肿瘤异质性
编辑 | 萝卜皮 空间解析转录组学 (SRT) 技术使研究人员能够获得对组织结构和细胞发育的新见解,尤其是在肿瘤中。然而,缺乏对生物背景和多视图特征的计算开发严重阻碍了组织异质性的阐明。 在这...
韦伯太空望远镜观测的宇宙新图像,将由一个名为Morpheus的深度学习框架来分析
编辑 | 萝卜皮 2022 年 7 月 11 日,美国航空航天局公布了詹姆斯·韦伯太空望远镜(James Webb Space Telescope,JWST)拍摄的第一张全彩图像,这让全世界的人类感到震惊和欣喜。 当然,人类并...
通用蛋白质设计新方法,谷歌研究团队:具有分层功能的从头蛋白质设计的条件生成建模
编辑 | 萝卜皮 蛋白质设计对于医学和生物技术应用变得越来越重要。由于蛋白质形成的复杂机制,新蛋白质的产生需要繁琐且耗时的计算或实验协议。同时,机器学习通过利用大量可用数据来解决复杂问...