数据分析共0篇
数据分析
pandas小技巧-随机挑选子集-五八三

pandas小技巧-随机挑选子集

在 pandas 中,如果遇到数据量特别大的情况,随机挑选 DataFrame 的子集可以帮助我们更深入地了解数据,从而更好地进行数据分析和决策。 随机挑选子集的用途主要有: 评估数据质量:随机挑选 Da...
admin的头像-五八三admin2年前
0120
Matplotlib基础-绘图配置-五八三

Matplotlib基础-绘图配置

Matplotlib 提供了大量配置参数,这些参数可以但不限于让我们从整体上调整通过 Matplotlib 绘制的图形样式,这里面的参数还有很多是功能性的,和其他工具结合时需要用的配置。 通过plt.rcParams...
admin的头像-五八三admin2年前
0130
Apache Doris 冷热分层技术如何实现存储成本降低 70%?-五八三

Apache Doris 冷热分层技术如何实现存储成本降低 70%?

在数据分析的实际场景中,冷热数据往往面临着不同的查询频次及响应速度要求。例如在电商订单场景中,用户经常访问近 6 个月的订单,时间较久远的订单访问次数非常少;在行为分析场景中,需支持...
火山引擎DataLeap如何解决SLA治理难题(二):申报签署流程与复盘详解-五八三

火山引擎DataLeap如何解决SLA治理难题(二):申报签署流程与复盘详解

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 申报签署流程详解 火山引擎DataLeap SLA保障的前提是先达成SLA协议。在SLA保障平台中,以申报单签署的...
admin的头像-五八三admin2年前
0240
【线性代数】二次型-五八三

【线性代数】二次型

文章内容 二次型及其标准型 配方法 正/负定二次型 二次型及其标准型 什么是二次型和其标准型 定义:数域K上的一个n元二次型是系数在K中的n个变量的二次齐次多项式 一般形式:f(x1,x2,⋯ ,xn)=(...
admin的头像-五八三admin2年前
0120
广电用户画像分析之根据用户行为数据进行筛选与标签添加-五八三

广电用户画像分析之根据用户行为数据进行筛选与标签添加

在数据处理和分析领域,我们经常需要根据用户的行为数据进行筛选和标签添加,以便更好地理解用户行为和偏好。在本篇博客中,我们将介绍两个示例,展示如何根据用户的收视行为数据和订单信息进行...
admin的头像-五八三admin2年前
040
如何基于 Apache Doris 构建新一代日志分析平台|解决方案-五八三

如何基于 Apache Doris 构建新一代日志分析平台|解决方案

作者:肖康,SelectDB 技术 副总裁 、Apache Doris Committer 日志数据是企业大数据体系中重要的组成部分之一,这些数据记录了网络设备、操作系统以及应用程序的详细历史行为,蕴含了丰富的信息...
admin的头像-五八三admin2年前
0160
2023年常用的医学分析和科研绘图工具合集-五八三

2023年常用的医学分析和科研绘图工具合集

专业的医学分析和科研绘图在医学研究、临床实践和教育培训中起到重要的作用,可以提高医学专业人员的工作效率和决策质量,同时也促进医学科学的发展和进步。 详细的资源及不停更地址: 科研常用...
admin的头像-五八三admin2年前
080
开源免费用|Apache Doris 2.0 推出跨集群数据复制功能-五八三

开源免费用|Apache Doris 2.0 推出跨集群数据复制功能

随着企业业务的发展,系统架构趋于复杂、数据规模不断增大,数据分布存储在不同的地域、数据中心或云平台上的现象越发普遍,如何保证数据的可靠性和在线服务的连续性成为人们关注的重点。在此基...
admin的头像-五八三admin2年前
090
教你数据解析神功,成为PC端爬虫工程师的高手!-五八三

教你数据解析神功,成为PC端爬虫工程师的高手!

数据解析是爬虫工程师采集数据的重要环节,它的目的是从爬取到的网页中提取出需要的数据。常用的数据解析方法有正则表达式、XPath、BeautifulSoup等。 其中,正则表达式是一种强大的文本匹配工...
admin的头像-五八三admin2年前
040
ChatGPT代码解释器 vs Noteable插件:数据分析能力7000字深度对比-五八三

ChatGPT代码解释器 vs Noteable插件:数据分析能力7000字深度对比

ChatGPT这样的大语言模型能够通过对话让用户进行非常复杂的大数据分析,带来了数据分析领域的变革。无论是使用ChatGPT自己的代码解释器,还是使用安装了Noteable等第三方插件的ChatGPT,你都可...
admin的头像-五八三admin2年前
0150
Matplotlib基础-3D图形-五八三

Matplotlib基础-3D图形

matplotlib 在1.0版本之前其实是不支持3D图形绘制的。 后来的版本中,matplotlib加入了3D图形的支持,不仅仅是为了使数据的展示更加生动和有趣。更重要的是,由于多了一个维度,扩展了其展示数...
admin的头像-五八三admin2年前
0120

广电用户画像分析之使用SVM预测用户是否挽留

在本篇博客中,我们将介绍如何使用支持向量机(SVM)模型来预测用户是否挽留。我们将使用Spark的ML库来实现这一目标,并通过构建和训练SVM模型,以及对测试集进行预测和评估,来解决这个分类问...
admin的头像-五八三admin2年前
0100
pandas小技巧-花哨的DataFrame-五八三

pandas小技巧-花哨的DataFrame

最近github上发现了一个库(plottable),可以用简单的方式就设置出花哨的 DataFrame 样式。 github上的地址:github.com/znstrider/p… 1. 安装 通过 pip 安装: pip install plottable 2. 行...
admin的头像-五八三admin2年前
0210
明晰柱状图和直方图的区别-五八三

明晰柱状图和直方图的区别

在众多的分析图表中,柱状图和直方图算是特别容易被混淆的两种图,因为它们在外形上非常相似。比如: 而实际上,它们所表达的含义和应用的场景却完全不同。 1. 概念 柱状图,是一种使用矩形条,...
admin的头像-五八三admin2年前
070

数据分析师如何用SQL解决业务问题?

本文来自问答。 提问:数据分析人员需要掌握sql到什么程度? 请问做一名数据分析人员,在sql方面需要掌握到什么程度呢?会增删改查就可以了吗?还是说关于开发的内容也要会?不同阶段会有不同的...
admin的头像-五八三admin2年前
0150
Dubbo负载均衡策略之一致性哈希 | 京东云技术团队-五八三

Dubbo负载均衡策略之一致性哈希 | 京东云技术团队

本文主要讲解了一致性哈希算法的原理以及其存在的数据倾斜的问题,然后引出解决数据倾斜问题的方法,最后分析一致性哈希算法在Dubbo中的使用。通过这篇文章,可以了解到一致性哈希算法的原理以...
admin的头像-五八三admin2年前
030
跟我一起从零开始学python(九)numpy+pandas+matplotlib-五八三

跟我一起从零开始学python(九)numpy+pandas+matplotlib

前言 回顾之前讲了python语法编程 ,必修入门基础和网络编程,多线程/多进程/协程等方面的内容,后续讲到了数据库编程篇MySQL,Redis,MongoDB篇,和机器学习,全栈开发前面没看的也不用往前翻...
admin的头像-五八三admin2年前
0110
Apache Doris 2.0.0 版本正式发布:盲测性能 10 倍提升,更统一多样的极速分析体验-五八三

Apache Doris 2.0.0 版本正式发布:盲测性能 10 倍提升,更统一多样的极速分析体验

亲爱的社区小伙伴们,我们很高兴地向大家宣布,Apache Doris 2.0.0 版本已于 2023 年 8 月 11 日正式发布,有超过 275 位贡献者为 Apache Doris 提交了超过 4100 个优化与修复。 在 2.0.0 版本...
admin的头像-五八三admin2年前
0280

Apache Doris 1.2.5 版本正式发布

亲爱的社区小伙伴们,我们很高兴地宣布,Apache Doris 于 2023 年 6 月 19 日迎来 1.2.5 版本的正式发布!在 1.2.5 版本中,Doris 团队已经修复了自 1.2.4 版本发布以来近 210 个问题或性能改进...
admin的头像-五八三admin2年前
050