数据分析共0篇 第3页
数据分析
Matplotlib绘制平行坐标系-五八三

Matplotlib绘制平行坐标系

平行坐标系,是一种含有多个垂直平行坐标轴的统计图表。一般的分析图表都是分析二维的数据,而平行坐标系特别适合于分析维度较多的数据。 比如,对于学生成绩,每门学科都是一个维度,且每门学...
admin的头像-五八三admin2年前
0160
Matplotlib基础-图例-五八三

Matplotlib基础-图例

Matplotlib 中的图例是帮助观察者理解图像数据的重要工具。图例通常包含在图像中,用于解释不同的颜色、形状、标签和其他元素。 1. 主要参数 当不设置图例的参数时,默认的图例是这样的。 impor...
admin的头像-五八三admin2年前
0120
基于ClickHouse解决活动海量数据问题 | 京东云技术团队-五八三

基于ClickHouse解决活动海量数据问题 | 京东云技术团队

1、背景 魔笛活动平台要记录每个活动的用户行为数据,帮助客服、运营、产品、研发等快速处理客诉、解决线上问题并进行相关数据分析和报警。可以预见到需要存储和分析海量数据,预估至少几十亿甚...
admin的头像-五八三admin2年前
030
Matplotlib基础-动画-五八三

Matplotlib基础-动画

matplotlib的动画一直是一个强大但使用频率不高的功能,究其原因,一方面展示动画需要一定的媒介,没有图形和文字展示方便;二来大家更关心的是分析结果的最终图表,图表的动态展示则没有那么重...
admin的头像-五八三admin2年前
0130

广电用户画像分析之根据客户消费内容添加标签

本篇博客将介绍如何添加用户消费标签和用户消费等级标签. 建议阅读之前先阅读数据预处理的博客再读本篇博客. 相关前提: 广电用户画像分析之数据基本分析与预处理 - 掘金 (juejin.cn) 根据客户...
admin的头像-五八三admin2年前
030
pandas小技巧-DataFrame的显示样式-五八三

pandas小技巧-DataFrame的显示样式

上一篇介绍了DataFrame的显示参数,主要是对DataFrame中值进行调整。 本篇介绍DataFrame的显示样式的调整,显示样式主要是对表格本身的调整,比如颜色,通过颜色可以突出显示重要的值,观察数据...
admin的头像-五八三admin2年前
0140
数据仓库性能测试方法论与工具集-五八三

数据仓库性能测试方法论与工具集

目录 目录目录数据仓库 v.s. 传统数据库数据仓库性能测试案例性能指标测试方案测试场景测试数据集测试用例性能指标测试脚本工具基准环境准备硬件环境软件环境测试操作步骤Cloudwave 执行步骤导...
admin的头像-五八三admin2年前
0250
数据分析框架1.0 从黄金思维圈到万能三步走-五八三

数据分析框架1.0 从黄金思维圈到万能三步走

有上过我SQL实战项目课程的同学会知道,这个项目很复杂,因为我在万能三步走的基础上,把分析逻辑拆成了两层:数据层和业务层。 虽然逻辑复杂了,但同学反馈很实用,甚至有同学在工作中反复回看...
admin的头像-五八三admin2年前
0140
【Clickhouse】ReplaceingMergeTree引擎final实现合并去重探索 | 京东云技术团队-五八三

【Clickhouse】ReplaceingMergeTree引擎final实现合并去重探索 | 京东云技术团队

前言 在OLAP实践中,在有数据更新的场景中,比如存储订单数据,我们经常会用到ReplaceingMergeTree引擎来去重数据,以获取数据的最新状态。但是ReplaceingMergeTree引擎实现数据的去重合并的操...
admin的头像-五八三admin2年前
090
比代码解释器强大10倍:Noteable ChatGPT插件才是数据分析的王者-五八三

比代码解释器强大10倍:Noteable ChatGPT插件才是数据分析的王者

在快速发展的数据分析领域里,真正能够简化复杂的分析流程,让更多人都能像专家一样去而分析数据的工具必然会在这个领域产生变革性的影响。 ChatGPT和Noteable结合就能产生这样的影响!它结合了...
admin的头像-五八三admin2年前
0140
数据清理在数据科学中的重要性-五八三

数据清理在数据科学中的重要性

什么是数据清理? 推荐:使用NSDT场景编辑器助你快速搭建可编辑的3D应用场景 在数据科学中,数据清理是识别不正确数据并修复错误的过程,以便最终数据集可供使用。错误可能包括重复字段、格式不...
admin的头像-五八三admin2年前
0140

基于Spark的大规模日志分析

本文分享自华为云社区《【实战经验分享】基于Spark的大规模日志分析【上进小菜猪大数据系列】》,作者:上进小菜猪。 随着互联网的普及和应用范围的扩大,越来越多的应用场景需要对海量数据进行...
火山引擎DataLeap的Data Catalog系统公有云实践 (上)-五八三

火山引擎DataLeap的Data Catalog系统公有云实践 (上)

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 前言 Data Catalog 通过汇总技术和业务元数据,解决大数据生产者组织梳理数据、数据消费者找数和理解数...
admin的头像-五八三admin2年前
0100
pandas小技巧-随机挑选子集-五八三

pandas小技巧-随机挑选子集

在 pandas 中,如果遇到数据量特别大的情况,随机挑选 DataFrame 的子集可以帮助我们更深入地了解数据,从而更好地进行数据分析和决策。 随机挑选子集的用途主要有: 评估数据质量:随机挑选 Da...
admin的头像-五八三admin2年前
0120
Matplotlib基础-绘图配置-五八三

Matplotlib基础-绘图配置

Matplotlib 提供了大量配置参数,这些参数可以但不限于让我们从整体上调整通过 Matplotlib 绘制的图形样式,这里面的参数还有很多是功能性的,和其他工具结合时需要用的配置。 通过plt.rcParams...
admin的头像-五八三admin2年前
0130
Apache Doris 冷热分层技术如何实现存储成本降低 70%?-五八三

Apache Doris 冷热分层技术如何实现存储成本降低 70%?

在数据分析的实际场景中,冷热数据往往面临着不同的查询频次及响应速度要求。例如在电商订单场景中,用户经常访问近 6 个月的订单,时间较久远的订单访问次数非常少;在行为分析场景中,需支持...
火山引擎DataLeap如何解决SLA治理难题(二):申报签署流程与复盘详解-五八三

火山引擎DataLeap如何解决SLA治理难题(二):申报签署流程与复盘详解

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 申报签署流程详解 火山引擎DataLeap SLA保障的前提是先达成SLA协议。在SLA保障平台中,以申报单签署的...
admin的头像-五八三admin2年前
0240
【线性代数】二次型-五八三

【线性代数】二次型

文章内容 二次型及其标准型 配方法 正/负定二次型 二次型及其标准型 什么是二次型和其标准型 定义:数域K上的一个n元二次型是系数在K中的n个变量的二次齐次多项式 一般形式:f(x1,x2,⋯ ,xn)=(...
admin的头像-五八三admin2年前
0120
广电用户画像分析之根据用户行为数据进行筛选与标签添加-五八三

广电用户画像分析之根据用户行为数据进行筛选与标签添加

在数据处理和分析领域,我们经常需要根据用户的行为数据进行筛选和标签添加,以便更好地理解用户行为和偏好。在本篇博客中,我们将介绍两个示例,展示如何根据用户的收视行为数据和订单信息进行...
admin的头像-五八三admin2年前
040
如何基于 Apache Doris 构建新一代日志分析平台|解决方案-五八三

如何基于 Apache Doris 构建新一代日志分析平台|解决方案

作者:肖康,SelectDB 技术 副总裁 、Apache Doris Committer 日志数据是企业大数据体系中重要的组成部分之一,这些数据记录了网络设备、操作系统以及应用程序的详细历史行为,蕴含了丰富的信息...
admin的头像-五八三admin2年前
0160