数据分析共0篇 第2页
数据分析
Matplotlib基础-3D图形-五八三

Matplotlib基础-3D图形

matplotlib 在1.0版本之前其实是不支持3D图形绘制的。 后来的版本中,matplotlib加入了3D图形的支持,不仅仅是为了使数据的展示更加生动和有趣。更重要的是,由于多了一个维度,扩展了其展示数...
admin的头像-五八三admin2年前
0120

广电用户画像分析之使用SVM预测用户是否挽留

在本篇博客中,我们将介绍如何使用支持向量机(SVM)模型来预测用户是否挽留。我们将使用Spark的ML库来实现这一目标,并通过构建和训练SVM模型,以及对测试集进行预测和评估,来解决这个分类问...
admin的头像-五八三admin2年前
0100
pandas小技巧-花哨的DataFrame-五八三

pandas小技巧-花哨的DataFrame

最近github上发现了一个库(plottable),可以用简单的方式就设置出花哨的 DataFrame 样式。 github上的地址:github.com/znstrider/p… 1. 安装 通过 pip 安装: pip install plottable 2. 行...
admin的头像-五八三admin2年前
0210
明晰柱状图和直方图的区别-五八三

明晰柱状图和直方图的区别

在众多的分析图表中,柱状图和直方图算是特别容易被混淆的两种图,因为它们在外形上非常相似。比如: 而实际上,它们所表达的含义和应用的场景却完全不同。 1. 概念 柱状图,是一种使用矩形条,...
admin的头像-五八三admin2年前
070

数据分析师如何用SQL解决业务问题?

本文来自问答。 提问:数据分析人员需要掌握sql到什么程度? 请问做一名数据分析人员,在sql方面需要掌握到什么程度呢?会增删改查就可以了吗?还是说关于开发的内容也要会?不同阶段会有不同的...
admin的头像-五八三admin2年前
0150
Dubbo负载均衡策略之一致性哈希 | 京东云技术团队-五八三

Dubbo负载均衡策略之一致性哈希 | 京东云技术团队

本文主要讲解了一致性哈希算法的原理以及其存在的数据倾斜的问题,然后引出解决数据倾斜问题的方法,最后分析一致性哈希算法在Dubbo中的使用。通过这篇文章,可以了解到一致性哈希算法的原理以...
admin的头像-五八三admin2年前
030
跟我一起从零开始学python(九)numpy+pandas+matplotlib-五八三

跟我一起从零开始学python(九)numpy+pandas+matplotlib

前言 回顾之前讲了python语法编程 ,必修入门基础和网络编程,多线程/多进程/协程等方面的内容,后续讲到了数据库编程篇MySQL,Redis,MongoDB篇,和机器学习,全栈开发前面没看的也不用往前翻...
admin的头像-五八三admin2年前
0110
Apache Doris 2.0.0 版本正式发布:盲测性能 10 倍提升,更统一多样的极速分析体验-五八三

Apache Doris 2.0.0 版本正式发布:盲测性能 10 倍提升,更统一多样的极速分析体验

亲爱的社区小伙伴们,我们很高兴地向大家宣布,Apache Doris 2.0.0 版本已于 2023 年 8 月 11 日正式发布,有超过 275 位贡献者为 Apache Doris 提交了超过 4100 个优化与修复。 在 2.0.0 版本...
admin的头像-五八三admin2年前
0280

Apache Doris 1.2.5 版本正式发布

亲爱的社区小伙伴们,我们很高兴地宣布,Apache Doris 于 2023 年 6 月 19 日迎来 1.2.5 版本的正式发布!在 1.2.5 版本中,Doris 团队已经修复了自 1.2.4 版本发布以来近 210 个问题或性能改进...
admin的头像-五八三admin2年前
050
Redis数据倾斜与JD开源hotkey源码分析揭秘 | 京东物流技术团队-五八三

Redis数据倾斜与JD开源hotkey源码分析揭秘 | 京东物流技术团队

1 前言 之前旁边的小伙伴问我热点数据相关问题,在给他粗略地讲解一波redis数据倾斜的案例之后,自己也顺道回顾了一些关于热点数据处理的方法论,同时也想起去年所学习JD开源项目hotkey——专门...
admin的头像-五八三admin2年前
0420

如何调试移动应用程序数据库问题并优化数据存储性能

在移动应用开发的动态领域中,无缺陷的用户体验是最终目标。然而,在表面下隐藏着一个复杂的数据存储和检索网络。当数据库问题出现时,它们可能会干扰甚至最精心设计的应用程序。这就是为什么了...
admin的头像-五八三admin2年前
080
如何用 NPS 打破技术与业务的次元壁?-五八三

如何用 NPS 打破技术与业务的次元壁?

「不了解利益相关者的需求是僵尸 Scrum 团队的四大常见症状之一,其主要表现为成员们忽视价值链上下游的内容,无法或不愿意带来任何改变或影响」,《拯救僵尸 Scrum》如是写道。 它们的工作,以...
admin的头像-五八三admin2年前
0170

广电用户画像分析之探索各个表中的记录数和字段phone_no的空值数

首先我们需要搭建大数据环境,详情可参考下文构建大数据环境:Hadoop、MySQL、Hive、Scala和Spark的安装与配置 - 掘金 (juejin.cn) 数据集分析 根据提供的五个数据集,可到此处查看: 链接:pan...
admin的头像-五八三admin2年前
070
小册上新|基于 Python 的数据分析与可视化-五八三

小册上新|基于 Python 的数据分析与可视化

在这个数字化时代,数据成为了无处不在的宝藏,而掌握数据分析的技能就像拥有了一把开启宝库的魔法钥匙。 那你可以思考一个问题:学好数据分析,可以干什么呢?估计很多小伙伴心里也有了答案。 ...
admin的头像-五八三admin2年前
0450
Matplotlib基础-结合地图-五八三

Matplotlib基础-结合地图

如果分析的数据与地域相关,那么,把分析结果结合地图一起展示的话,会让可视化的效果得到极大的提升。 比如,分析各省GDP数据,人口数据,用柱状图,饼图之类的虽然都可以展示分析结果,不过,...
admin的头像-五八三admin2年前
0160
A/B试验概述-五八三

A/B试验概述

A/B试验概述 1 引言 本文主要分享A/B试验的相关概念。我将主要从以下几个方面对A/B试验进行分享:A/B试验的基本原理、实验流程、构用场景和常见问题等。 2 基本原理 A/B试验是一种常用的实验设...
admin的头像-五八三admin2年前
0160
Matplotlib基础-画布-五八三

Matplotlib基础-画布

Matplotlib 库是一个用于数据可视化和绘图的 Python 库。它提供了大量的函数和类,可以帮助用户轻松地创建各种类型的图表,包括直方图、箱形图、散点图、饼图、条形图和密度图等。 使用 Matplot...
admin的头像-五八三admin2年前
0140
ChatGPT让人人都是数据分析师: 如何使用Code Interpreter-五八三

ChatGPT让人人都是数据分析师: 如何使用Code Interpreter

OpenAI终于开放Code Interpreter给所有Plus用户使用了,这是一个天大的好消息,我迫不及待就开始了测试,测试结果也是喜出望外。由于Python代码的加持,能发挥Code Interpreter最大能力的领域就...
admin的头像-五八三admin2年前
040
Matplotlib基础-样式表-五八三

Matplotlib基础-样式表

Matplotlib库 由于诞生的比较早,所以其默认的显示样式很难符合现在的审美,这也是它经常为人诟病的地方。 不过,经过版本更迭之后,现在 Matplotlib 已经内置了很多样式表,通过使用不同的样式...
admin的头像-五八三admin2年前
0210
DataLeap的全链路智能监控报警实践(三): 系统实现-五八三

DataLeap的全链路智能监控报警实践(三): 系统实现

系统实现 整体架构 基线 管理模块:负责基线创建、更新、删除等操作,管理基线元信息,包括保障任务,承诺时间,余量及报警配置等); 基线 实例生成:系统每天定时触发生成基线实例,生成实例...
admin的头像-五八三admin2年前
060