大数据共0篇 第2页
大数据
河北幸福消费金融基于 Apache Doris 构建实时数仓,查询提速 400 倍!-五八三

河北幸福消费金融基于 Apache Doris 构建实时数仓,查询提速 400 倍!

本文导读: 随着河北幸福消费金融的客户数量和放贷金额持续上升,如何依托大数据、数据分析等技术来提供更好决策支持、提高工作效率和用户体验,成为了当前亟需解决的问题。基于此,公司决定搭...
admin的头像-五八三admin2年前
0520
企业诊断屋:服饰美妆电商如何用A/B测试赋能业务-五八三

企业诊断屋:服饰美妆电商如何用A/B测试赋能业务

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 随着社会经济复苏,服饰美妆的消费市场回暖,国潮品牌正强势崛起和海外品牌进军,让不断增长的美妆市场...
admin的头像-五八三admin2年前
090
火山引擎DataLeap的Data Catalog系统公有云实践-五八三

火山引擎DataLeap的Data Catalog系统公有云实践

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 Data Catalog是一种元数据管理的服务,会收集技术元数据,并在其基础上提供更丰富的业务上下文与语义,...
admin的头像-五八三admin2年前
0150
揭秘阿里云 Flink 智能诊断利器——Flink Job Advisor-五八三

揭秘阿里云 Flink 智能诊断利器——Flink Job Advisor

作者: 藏红 一、引言 阿里云实时计算 Flink 作为一款专业级别的高性能实时大数据处理系统,它在各种业务场景中都发挥了关键的作用。丰富而复杂的上下游系统让它能够支撑实时数仓、实时风控、实...
admin的头像-五八三admin2年前
050
一站式数据可观测性平台 Datavines 正式开源啦-五八三

一站式数据可观测性平台 Datavines 正式开源啦

Datavines是一站式开源数据可观测性平台,提供元数据管理、数据概览报告、数据质量管理,数据分布查询、数据趋势洞察等核心能力,致力于帮助用户全面地了解和掌管数据,让您做到心中有数,目前...
admin的头像-五八三admin2年前
0120
Flink+StarRocks 实时数据分析新范式-五八三

Flink+StarRocks 实时数据分析新范式

摘要:本文整理自 StarRocks 社区技术布道师谢寅,在 Flink Forward Asia 2022 实时湖仓的分享。本篇内容主要分为五个部分: 极速数据分析 实时数据更新 StarRocks Connector For Apache Flink ...
admin的头像-五八三admin2年前
050
大数据实时链路备战——数据双流高保真压测 | 京东云技术团队-五八三

大数据实时链路备战——数据双流高保真压测 | 京东云技术团队

一、大数据双流建设 1.1 数据双流 大数据时代,越来越多的业务依赖实时数据用于决策,比如促销调整,点击率预估、广告分佣等。为了保障业务的顺利开展,也为了保证整体大数据链路的高可用性,越...
admin的头像-五八三admin2年前
0210
JDV背后的技术-助力618 | 京东云技术团队-五八三

JDV背后的技术-助力618 | 京东云技术团队

一、项目介绍 JDV(可视化大屏)是京东内部搭建可视化大屏的数据工具平台,内置10+种模版特效,40+种风格各异的图表、导航等组件。与集团其他数据工具打通,支持一站式、自助化、拖拽式搭建大屏...
admin的头像-五八三admin2年前
0100

数据类型错误带来严重后果!一文读懂怎么正确选择数据类型

确保数据质量应该是IT专业人员最重要的目标之一。如今,这一点比以往任何时候都更为重要,因为组织依靠数据来驱动其人工智能和机器学习算法。如果你希望做出准确的决策,就需要准确、高质量的数...
admin的头像-五八三admin2年前
020

广电用户画像分析之数据基本分析与预处理

引言 数据分析在今天的数字化时代变得越来越重要,尤其是对于媒体行业来说。了解用户的收视行为和对媒体的偏好可以帮助媒体公司制定更有效的营销策略和优化内容推荐。本文将介绍如何使用Spark进...
admin的头像-五八三admin2年前
020
Apache Doris 在头部票务平台的应用实践:报表开发提速数十倍、毫秒级查询响应-五八三

Apache Doris 在头部票务平台的应用实践:报表开发提速数十倍、毫秒级查询响应

作者|国内某头部票务平台 大数据开发工程师 刘振伟 本文导读: 随着在线平台的发展,票务行业逐渐实现了数字化经营,企业可以通过在线销售、数字营销和数据分析等方式提升运营效率与用户体验。...
admin的头像-五八三admin2年前
050
MapReduce实现TopN的效果-五八三

MapReduce实现TopN的效果

1、背景 最近在学习Hadoop的MapReduce,此处记录一下如何实现 TopN 的效果,以及在MapReduce中如何实现 自定义分组。 2、需求 我们有一份数据,数据中存在如下3个字段,订单编号,订单项和订单项...
admin的头像-五八三admin2年前
0100
字节跳动 EB 级 Iceberg 数据湖的机器学习应用与优化-五八三

字节跳动 EB 级 Iceberg 数据湖的机器学习应用与优化

深度学习的模型规模越来越庞大,其训练数据量级也成倍增长,这对海量训练数据的存储方案也提出了更高的要求:怎样更高性能地读取训练样本、不使数据读取成为模型训练的瓶颈,怎样更高效地支持特...
admin的头像-五八三admin2年前
0140
字节跳动基于火山引擎DataLeap的一站式数据治理架构实践-五八三

字节跳动基于火山引擎DataLeap的一站式数据治理架构实践

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 在7月22日举行的 ArchSummit 全球架构师峰会(深圳站)上,来自火山引擎DataLeap的技术专家为大家带来...
admin的头像-五八三admin2年前
0140

火山引擎 DataLeap:从短视频 APP 实践来看,如何统一数据指标口径?

短视频正在成为越来越多人发现世界的窗口,其背后的创作者生态建设是各大短视频 APP 不可忽视的重要组成部分。 为了激励更多优质内容生产,某短视频 APP 经常面向创作者主办投稿活动,而在复盘...
admin的头像-五八三admin2年前
050

Apache Doris 1.2.5 版本正式发布

亲爱的社区小伙伴们,我们很高兴地宣布,Apache Doris 于 2023 年 6 月 19 日迎来 1.2.5 版本的正式发布!在 1.2.5 版本中,Doris 团队已经修复了自 1.2.4 版本发布以来近 210 个问题或性能改进...
admin的头像-五八三admin2年前
050
通俗易懂数仓建模—Inmon范式建模与Kimball维度建模-五八三

通俗易懂数仓建模—Inmon范式建模与Kimball维度建模

在数据仓库领域,有两位大师,一位是“数据仓库”之父 Bill Inmon,一位是数据仓库权威专家 Ralph Kimball,两位大师每人都有一本经典著作,Inmon大师著作《数据仓库》及Kimball大师的《数仓工...
admin的头像-五八三admin2年前
0130
百亿规模京东实时浏览记录系统的设计与实现 | 京东云技术团队-五八三

百亿规模京东实时浏览记录系统的设计与实现 | 京东云技术团队

1. 系统介绍 浏览记录系统主要用来记录京东用户的实时浏览记录,并提供实时查询浏览数据的功能。在线用户访问一次商品详情页,浏览记录系统就会记录用户的一条浏览数据,并针对该浏览数据进行商...
admin的头像-五八三admin2年前
050
火山引擎数智平台旗下DataWind升级半年报 6大功能助力企业数据消费-五八三

火山引擎数智平台旗下DataWind升级半年报 6大功能助力企业数据消费

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 “以数据消费促数据生产”——是火山引擎提出的数据飞轮的核心理念,在这一理念的指导下,智能数据洞察...
admin的头像-五八三admin2年前
0120
一张图读懂TuGraph Analytics开源技术架构-五八三

一张图读懂TuGraph Analytics开源技术架构

TuGraph Analytics(内部项目名GeaFlow)是蚂蚁集团开源的分布式实时图计算引擎,即流式图计算。通过SQL+GQL融合分析语言对表模型和图模型进行统一处理,实现了流、批、图一体化计算,并支持了E...
admin的头像-五八三admin2年前
0220