排序
蒙娜丽莎“复活”了!jpg变gif,只需一张图片就能合成动画
【新智元导读】 还记得哈利・波特第一次来到霍格沃茨看到墙上那些既会动又会说话的挂画是多么惊讶吗?如果我们可以将挂画 “复活”,和 500 多年前的蒙娜丽莎来场穿越时空的对话会怎样呢?感谢 ...
Nature 封面:哈佛打造史上最轻飞行机器人!自重仅 259 毫克,太阳能供电,可自主飞行
【新智元导读】 今天,Nature 封面发表一项重磅研究:哈佛大学开发出史上最轻的自主飞行机器人!这个蜜蜂机器人仅 259 毫克,只需太阳能供电就能实现持续、不受束缚的飞行! 早在达芬奇的时代,...
LSTM之父最新力作:颠倒强化学习,用监督学习解决RL问题
【新智元导读】 LSTM 的发明人、深度学习大牛 Jürgen Schmidhuber 和团队的最新研究“颠倒强化学习”引起热议,该研究提出使用监督学习来解决RL问题的新方法,并在一些任务击败了传统的baselin...
《Science》论文:人脑只需单个神经元就可进行XOR异或运算
【新智元导读】柏林洪堡大学等机构的研究者最新的研究证实,人类皮层上层中发现的一种新型电信号,皮层神经元树突臂中的微小区室每个都可以执行数学逻辑上的复杂操作,而不是像之前人们所认为的...
深度教练:让深度学习模拟人类教学过程,大幅减少训练数据和时间
本文作者:邓侃,复星集团AI首席科学家、大数医达创始人 DeepMind日前公开了他们首款医疗AI落地产品,能诊断50多种眼疾,精度超越人类医生。为了训练这个系统,DeepMind 用了近1.5万个人工标注...
谷歌重磅开源NLP通用框架Lingvo,91位作者带来强悍功能
【新智元导读】 谷歌近日开源了一个强大的 NLP 深度学习框架 Lingvo,侧重于语言相关任务的序列模型,如机器翻译、语音识别和语音合成。过去两年来,谷歌已经发表了几十篇使用 Lingvo 获得 SOTA...
MIT用AI实现3分钟自动抠图,精细到头发丝
MIT CSAIL的研究人员开发了一种基于深度学习的图像编辑工具,能够自动抠图,替换任何图像的背景。他们称之为“图像软分割”,这个系统能够分析原始图像的纹理和颜色,仅需3~4分钟,生成非常自然...
何恺明等最新论文:实例分割全新方法 TensorMask,效果比肩 Mask R-CNN
【新智元导读】FAIR 何恺明、Ross 等人最新提出实例分割的通用框架 TensorMask,首次在定性和定量上都接近于 Mask R-CNN 框架,为探索密集实例分割方法提供基础。 现代实例分割方法主要是先检测...
MIT韩松团队:AutoML自动模型压缩,全面超越手工调参
MIT韩松团队和Google Cloud的研究人员提出AutoML模型压缩技术,利用强化学习将压缩流程自动化,完全无需人工,而且速度更快,性能更高。 模型压缩是在计算资源有限、能耗预算紧张的移动设备上有...
再破新纪录!微软最新 NLP 模型 3 项评分全面超越人类水平!
【新智元导读】 近日,微软亚研院 NLP 团队和微软 Redmond 语音对话团队,在斯坦福大学的会话问答 (CoQA) 挑战赛中取得佳绩,三项评分全面超越人类水平 媲美人类对话水平! 由微软亚洲研究院(M...
ICLR 2019 最佳论文揭晓!NLP 深度学习、神经网络压缩成焦点
【新智元导读】 ICLR 2019 今天在官网公布了最佳论文奖!两篇最佳论文分别来自 Mila / 加拿大蒙特利尔大学、微软蒙特利尔研究院和 MIT CSAIL,主题分别集中在 NLP 深度学习模型和神经网络压缩。...
草图秒变风景照,英伟达神笔马良 GauGAN 终于开源了
【新智元导读】 英伟达最近发布的图像合成 “黑魔法” GauGAN 效果令人惊叹,现在,相关代码和预训练模型终于公开了。 还记得英伟达在 GTC 2019 披露的令人惊叹的图像生成器 GauGAN 吗?仅凭几...
史上最强 Atari 游戏通关算法:蒙特祖玛获分超过 200 万!
【新智元导读】 Atari 游戏史上最强通关算法来了——Go-Explore!蒙特祖玛获分超过 200 万,平均得分超过 40 万;Pitfall 平均超过 21000 分! 通关 Atari 游戏的最强算法来了! 在强化学习中,...
DensePose姿态转换模型,只需一张照片合成动画效果
DensePose团队在ECCV 2018发表又一杰作:密集人体姿态转换!这是一个基于DensePose的姿势转换系统,仅根据一张输入图像和目标姿势,生成数字人物的动画效果。 DensePose 是 Facebook 研究员 Nat...
同声传译被攻陷!谷歌发布 Translatotron 直接语音翻译系统
【新智元导读】 今天,谷歌发布 Translatotron 语音翻译系统,这是第一个可以直接将一个人的声音从一种语言转换成另一种语言,同时保持说话人的声音和节奏的翻译模型。 让说不同语言的人更容易...
旧照片着色修复神器!自注意力GAN效果惊艳
一个模型可以实现多个图像修改任务!本文作者结合自注意力GAN、逐渐增大的训练方式等技术,实现了惊艳的旧照片着色效果。 图像着色、图像增强、恢复旧图像等是计算机视觉领域的热点问题,不过,...
自然语言理解新基准:谷歌重磅发布开放问答数据集,30 万自然提问 + 人工注释答案
【新智元导读】 今天,谷歌重磅发布自然问题数据集 (Natural Questions),包含 30 万个自然发生的问题和人工注释的答案,16000 个示例,并发起基于此数据集的问答系统挑战赛。有望成为自然语言...
重新思考图卷积网络:GNN 只是一种滤波器
【新智元导读】 最新研究提出,图神经网络仅对特征向量进行低通滤波,不具有非线性流形学习特性。论文提出了一种基于图形信号处理的理论框架,用于分析图神经网络。 图神经网络已成为解决图结构...
Jeff Dean 撰文:一文看全谷歌 AI 2018 研究成果,全程干货!
【新智元导读】 谷歌 AI 团队负责人 Jeff Dean 今天发表博客文章,总结了谷歌的研究团队在 2018 年的主要研究成果。 谷歌 AI 团队负责人 Jeff Dean 今天发布博客文章,总结了谷歌的研究团队在 2...
人类不要笑,机器人会思考了!
【新智元导读】 哥伦比亚大学打造一只“从零开始”认识自己的机器人,这个机器人在物理学、几何学或运动动力学方面没有先验知识,但经过35小时训练,能够100%完成设定任务,具备自我意识。 “有...