排序
火山引擎DataTester:三类AB实验,让企业营销拥有灵敏“网感”
更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 作者:火山引擎AB测试 近日,火山引擎数智平台举办了“走进火山-全链路增长:数据飞轮转动消费新生力”...
顺丰基于 Flink CDC + Hudi 推进实时业务落地
摘要:本文整理自大数据研发高级工程师唐尚文,在 Flink Forward Asia 2022 数据集成专场的分享。本篇内容主要分为三个部分: 应用场景 实践与优化 未来规划 点击查看原文视频 & 演讲PPT 一...
【ElasticSearch】大数据量情况下的前缀、中缀实时搜索方案
简述 业务开发中经常会遇到这样一种情况,用户在搜索框输入时要实时展示搜索相关的结果。要实现这个场景常用的方案有Completion Suggester、search_as_you_type。那么这两种方式有什么区别呢?...
无数据,不 AI!Databricks Data + AI 峰会亮点总结
作者:RisingWave 创始人 & CEO 吴英骏 相比于去年重金押宝于数据湖仓,Databricks 今年在宣传上可谓是“all in AI”:不仅请了 Eric Schmidt(前任谷歌 CEO )与 Satya Nadella(现任微软 ...
百亿规模京东实时浏览记录系统的设计与实现 | 京东云技术团队
1. 系统介绍 浏览记录系统主要用来记录京东用户的实时浏览记录,并提供实时查询浏览数据的功能。在线用户访问一次商品详情页,浏览记录系统就会记录用户的一条浏览数据,并针对该浏览数据进行商...
河北幸福消费金融基于 Apache Doris 构建实时数仓,查询提速 400 倍!
本文导读: 随着河北幸福消费金融的客户数量和放贷金额持续上升,如何依托大数据、数据分析等技术来提供更好决策支持、提高工作效率和用户体验,成为了当前亟需解决的问题。基于此,公司决定搭...
Apache Doris 1.2.6 版本正式发布|版本通告
亲爱的社区小伙伴们,我们很高兴地宣布,Apache Doris 于 2023 年 7 月 17 日迎来 1.2.6 版本的正式发布!在 1.2.6 版本中,Doris 团队已经修复了自 1.2.5 版本发布以来若干问题或性能改进项,...
Flink CDC & MongoDB 联合实时数仓的探索实践
摘要:本文整理自 XTransfer 技术专家, Flink CDC Maintainer 孙家宝,在 Flink Forward Asia 2022 数据集成专场的分享。本篇内容主要分为四个部分: MongoDB 在实时数仓的探索 MongoDB CDC Con...
Flink 遇见 Apache Celeborn:统一的数据 Shuffle 服务
作者| 熊佳树( 履霜) 我们非常高兴的宣布 Apache Celeborn(Inclubating)[1] 正式支持 Flink,Celeborn 于去年 12 月份正式进入 Apache 软件基金会 (ASF) 的孵化器,一直致力打造统一的中间...
Hadoop-HDFS
概述 HDFS的产生背景和定义 背景 随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的...
【Flink】详解Flink任务提交流程
前言 大家好,我们的gzh是朝阳三只大明白,满满全是干货,分享近期的学习知识以及个人总结(包括读研和IT),跪求一波关注,希望和大家一起努力、进步!! 启动一个任务 通常我们会使用 bin/fli...
北京汽车:传统车厂向“用户服务”转型的新范本
摘要:用户决定价值 英国大文豪狄更斯曾在《双城记》中说:“这是最好的时代,也是最坏的时代”。大浪淘沙之下,汽车产业的故事正是当下制造业最恢宏和吸睛的叙事,恢宏在于增长速度,吸睛则在...
火山引擎DataLeap如何解决SLA治理难题(二):申报签署流程与复盘详解
更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 申报签署流程详解 火山引擎DataLeap SLA保障的前提是先达成SLA协议。在SLA保障平台中,以申报单签署的...
比代码解释器强大10倍:Noteable ChatGPT插件才是数据分析的王者
在快速发展的数据分析领域里,真正能够简化复杂的分析流程,让更多人都能像专家一样去而分析数据的工具必然会在这个领域产生变革性的影响。 ChatGPT和Noteable结合就能产生这样的影响!它结合了...
补齐OLAP引擎短板!ByteHouse 是如何实现流批一体的?
更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 计算机领域一直流传一句话——“没有银弹”,这句话出自计算机科学家布鲁克斯《没有银弹》一书,意思是...
MapReduce实现TopN的效果
1、背景 最近在学习Hadoop的MapReduce,此处记录一下如何实现 TopN 的效果,以及在MapReduce中如何实现 自定义分组。 2、需求 我们有一份数据,数据中存在如下3个字段,订单编号,订单项和订单项...
Flink 在新能源场站运维的应用
摘要:本文整理自中南电力设计院工程师、注册测绘师姚远,在 Flink Forward Asia 2022 行业案例专场的分享。本篇内容主要分为四个部分: 建设背景 技术架构 应用落地 后续及其他 点击查看原文视...
联通 Flink 实时计算平台化运维实践
摘要:本文整理自联通数科实时计算团队负责人、Apache StreamPark Committer 穆纯进在 Flink Forward Asia 2022 平台建设专场的分享,本篇内容主要分为四个部分: 实时计算平台背景介绍 Flink ...
基于Docker搭建Hadoop大数据集群环境
1 引子 因兼具跨平台兼容性优、资源消耗少、自动化程度高、运行稳定、环境隔离等优点,Docker大受欢迎,在应用打包、分发、部署、开源分享方面得到广泛应用。其实Docker在本地快速安装试用及学...
Trino on k8s 编排部署进阶篇
一、概述 Trino on Kubernetes(Trino在Kubernetes上的部署)是将Trino查询引擎与Kubernetes容器编排平台相结合,以实现在Kubernetes集群上部署、管理和运行Trino的解决方案。 Trino(之前称为P...