大数据共0篇
大数据
一张图读懂TuGraph Analytics开源技术架构-五八三

一张图读懂TuGraph Analytics开源技术架构

TuGraph Analytics(内部项目名GeaFlow)是蚂蚁集团开源的分布式实时图计算引擎,即流式图计算。通过SQL+GQL融合分析语言对表模型和图模型进行统一处理,实现了流、批、图一体化计算,并支持了E...
admin的头像-五八三admin2年前
0220
火山引擎DataLeap的Data Catalog系统公有云实践-五八三

火山引擎DataLeap的Data Catalog系统公有云实践

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 Data Catalog是一种元数据管理的服务,会收集技术元数据,并在其基础上提供更丰富的业务上下文与语义,...
admin的头像-五八三admin2年前
0150
超级品牌,都在打造数据飞轮-五八三

超级品牌,都在打造数据飞轮

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 引入 「收钱吧到账15元。」 从北京大栅栏的糖葫芦铺子,到南京夫子庙的鸭血粉丝汤馆,再到广州珠江畔的...
admin的头像-五八三admin2年前
0150
如何精准预测天气?火山引擎ByteHouse与大地量子这么做-五八三

如何精准预测天气?火山引擎ByteHouse与大地量子这么做

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 伴随着气象技术的发展以及城市气象设施的完善,气象监测服务能力在不断提高,实现短期甚至中长期的气象...
admin的头像-五八三admin2年前
0110
从源代码编译构建Apach Spark3.2.4-五八三

从源代码编译构建Apach Spark3.2.4

编译说明 对于大多数用户来说,使用官方预编译版本的Spark已经足够满足日常需求。只有在特定的场景和需求下,重新编译Spark才是必需的。 编译Spark源代码的场景、原因如下: 1.定制需求: 如果...
admin的头像-五八三admin2年前
0160
Apache Doris 2.0.0 版本正式发布:盲测性能 10 倍提升,更统一多样的极速分析体验-五八三

Apache Doris 2.0.0 版本正式发布:盲测性能 10 倍提升,更统一多样的极速分析体验

亲爱的社区小伙伴们,我们很高兴地向大家宣布,Apache Doris 2.0.0 版本已于 2023 年 8 月 11 日正式发布,有超过 275 位贡献者为 Apache Doris 提交了超过 4100 个优化与修复。 在 2.0.0 版本...
admin的头像-五八三admin2年前
0280
从源代码编译构建Hive3.1.3-五八三

从源代码编译构建Hive3.1.3

编译说明 使用Hive官方提供的预编译安装包是最常见和推荐的方式来使用Hive,适用于大多数用户。这些预编译的安装包经过了测试和验证,在许多不同的环境中都能正常运行。 在某些特定情况下,可能...
admin的头像-五八三admin2年前
0170
Apache Paimon 流式数据湖 V 0.4 与后续展望-五八三

Apache Paimon 流式数据湖 V 0.4 与后续展望

摘要:本文整理自阿里云开源大数据表存储团队负责人、阿里巴巴高级技术专家,Apache Flink PMC,Paimon PPMC 李劲松(之信)在 Apache Paimon Meetup 的分享。本篇内容主要分为四个部分: 湖存...
admin的头像-五八三admin2年前
0160
环路检测在风控领域的应用实践丨Fabarta 技术专栏-五八三

环路检测在风控领域的应用实践丨Fabarta 技术专栏

导读: 本文分享了在使用图分析引擎开发风控算法时遇到的挑战,以及我们采取的方案和措施,介绍环路检测算法在风控场景的探索和工程化方案,分享算法效率优化、硬件资源限制下的算法探索的一些...
admin的头像-五八三admin2年前
0160
网易互娱出海之旅:大数据平台上云架构设计与实践-五八三

网易互娱出海之旅:大数据平台上云架构设计与实践

2020 年初,随着网易互娱的海外业务增长与海外数据合规的需求,我们开始了网易互娱大数据离线计算平台迁移出海的工作。前期,我们采取了云主机裸机加上高性能 EBS 块存储的方案。但是,这个方案...
admin的头像-五八三admin2年前
0170
ApacheCon - 云原生大数据上的 Apache 项目实践-五八三

ApacheCon – 云原生大数据上的 Apache 项目实践

Apache 软件基金会的官方全球系列大会 CommunityOverCode Asia(原 ApacheCon Asia)首次中国线下峰会将于 2023 年 8 月 18-20 日在北京丽亭华苑酒店举办,大会含 17 个论坛方向、上百个前沿议...
admin的头像-五八三admin2年前
0110
字节跳动基于火山引擎DataLeap的一站式数据治理架构实践-五八三

字节跳动基于火山引擎DataLeap的一站式数据治理架构实践

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 在7月22日举行的 ArchSummit 全球架构师峰会(深圳站)上,来自火山引擎DataLeap的技术专家为大家带来...
admin的头像-五八三admin2年前
0140
OceanBase X Flink 基于原生分布式数据库构建实时计算解决方案-五八三

OceanBase X Flink 基于原生分布式数据库构建实时计算解决方案

摘要:本文整理自 OceanBase 架构师周跃跃,在 Flink Forward Asia 2022 实时湖仓专场的分享。本篇内容主要分为四个部分: 分布式数据库 OceanBase 关键技术解读 生态对接以及典型应用场景 Ocea...
admin的头像-五八三admin2年前
0150
小米基于 Flink 的实时计算资源治理实践-五八三

小米基于 Flink 的实时计算资源治理实践

摘要:本文整理自小米高级软件工程师张蛟,在 Flink Forward Asia 2022 生产实践专场的分享。本篇内容主要分为四个部分: 发展现状与规模 框架层治理实践 平台层治理实践 未来规划与展望 点击查...
admin的头像-五八三admin2年前
0160
UData查询引擎优化-如何让一条SQL性能提升数倍 | 京东云技术团队-五八三

UData查询引擎优化-如何让一条SQL性能提升数倍 | 京东云技术团队

1 UData-解决数据使用的最后一公里 1.1 背景 在大数据的范畴,我们经历了数据产业化的历程,从各个生产系统将数据收集起来,经过实时和离线的数据处理最终汇集在一起,成为我们的主题域数据,下...
admin的头像-五八三admin2年前
0140

火山引擎VeDI助力零售品牌私域运营 实现与会员高效“沟通”

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 小程序正在成为零售品牌与会员高效沟通的第二阵地。 过去,零售品牌多依赖电商平台与会员保持互动联系...
admin的头像-五八三admin2年前
0180

火山引擎DataTester:AB实验平台未来演进趋势是怎样的?

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 近日,DataFun联合行行AI举办第四届“数据智能创新与实践人工智能大会,火山引擎DataTester数据科学家...
admin的头像-五八三admin2年前
0140
收钱吧与火山引擎VeDI合作一年后 有了哪些新变化?-五八三

收钱吧与火山引擎VeDI合作一年后 有了哪些新变化?

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 收钱吧正在和火山引擎数智平台(VeDI)跑出一条业务提效新通路。 相关数据显示,收钱吧的日服务人次就...
admin的头像-五八三admin2年前
0180
火山引擎DataLeap数据质量动态探查及相关前端实现-五八三

火山引擎DataLeap数据质量动态探查及相关前端实现

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 需求背景 火山引擎DataLeap数据探查上线之前,数据验证都是通过写SQL方式进行查询的,从编写SQL,到解...
admin的头像-五八三admin2年前
090
实现无限存储:基于JuiceFS 创建 Samba 和 NFS 共享-五八三

实现无限存储:基于JuiceFS 创建 Samba 和 NFS 共享

随着企业数据量的持续增长,存储容量需求日益增大。如何采用没有容量上限的云存储替换本容量有限的本地磁盘,已成为广泛的需求和共识。特别是在企业中常用的 Samba 和 NFS 共享,如果能够使用云...
admin的头像-五八三admin2年前
0280