探索用户行为数据分析:从基础查询到高级分析 【GaussDB(for MySQL)】

举报
wzsのcloud 发表于 2024/10/27 15:21:52 2024/10/27
【摘要】 本文提供了使用GaussDB(for MySQL)进行数据查询的操作指导。首先,通过SQL查询展示了用户基本信息。接着,介绍了分析付费用户的步骤,包括按性别统计的付费用户数量和总收入,以及不同消费类型的收入分布。文章采用具体SQL示例,逐步引导读者完成各项操作,旨在帮助开发者掌握GaussDB的数据处理技巧,以更好地理解和利用用户数据。

目标概述

本文旨在通过具体的SQL查询示例和数据分析,帮助读者掌握如何使用华为云的GaussDB(for MySQL)进行高效的数据处理与分析。我将从用户基本信息、付费用户行为、消费模式等多个维度入手,提供详细的查询方法和结果解读。通过这些分析,我希望揭示用户行为的关键洞察,并提出切实可行的改进措施和未来发展方向。无论是初学者还是经验丰富的开发者,本文都将为您提供宝贵的实践经验和指导助力您在数据分析领域更进一步,以数据驱动决策,优化产品和服务,提升用户体验

GaussDB(for MySQL)的特点

GaussDB(for MySQL)是华为推出的高性能、高扩展性云数据库服务,它深度优化了数据库内核,实现了超百万级QPS吞吐,支持计算存储分离架构和1写15只读节点的配置,满足高并发业务需求。同时,它100%兼容开源MySQL生态,支持跨AZ部署、数据三副本存储和故障秒级切换,确保数据安全可靠且业务高可用。此外,GaussDB(for MySQL)还具备低成本效益,支持按需付费和自动扩容,降低了企业的存储成本。

产品链接:https://www.huaweicloud.cn/product/gaussdbformysql.html

image.png

选择GaussDB(for MySQL)进行数据分析的优势

选择GaussDB(for MySQL)进行数据分析,主要是因为其高性能能够满足实时分析的需求,快速处理大量数据并提供出色的查询性能。同时,GaussDB(for MySQL)的高扩展性支持大数据量存储,随着数据量的增长可以自动伸缩,无需担心存储容量问题。此外,其高可靠性和低成本效益也为企业提供了数据安全保障和运维成本降低的优势,使得数据分析更加高效、稳定和经济

数据分析准备

创建实例

  1. 创建实例

image.png

  1. 实例正在创建中

image.png

  1. 实例创建成功,点击登录按钮进行登录

image.png

  1. 输入账号密码等配置信息,点击登录

image.png

创建数据库

  1. 新建数据库:behaviordate

image.png

  1. 导入已经提供的sql文件

image.png

  1. 进行文件导入的配置

image.png

  1. 点击确定

image.png

  1. 导入成功,显示已完成

image.png

用户数据分析

新建sql查询

image.png

用户基础信息查询

目标:

  • 了解用户群体的基本构成。
  • 如何通过SQL获取并分析用户基础信息。
  1. 查询用户总人数
SELECT COUNT(*) AS total_users FROM behaviordate;

image.png

  1. 查询8月新增注册用户数(查询的是2024年的8月份)
SELECT COUNT(*) AS new_users_in_august
FROM behaviordate
WHERE MONTH(Registration_time) = 8 AND YEAR(Registration_time) = 2024;

image.png

  1. 男女人数以及比例
-- 男女人数及比例
SELECT
    gender,
    COUNT(*) AS count,
    (COUNT(*) * 100.0 / (SELECT COUNT(*) FROM behaviordate)) AS percentage
FROM behaviordate
GROUP BY gender;

image.png

付费用户分析

目标:

  • 确定哪些用户是活跃的消费者。
  • 从性别、消费额等多个维度深入挖掘付费用户的行为模式。

付费用户数(即有消费金额记录的用户)

SELECT COUNT(DISTINCT user_id) AS paying_users
FROM behaviordate
WHERE Consumption_amount > 0;

image.png

按性别统计付费用户数

SELECT
    gender,
    COUNT(DISTINCT CASE WHEN Consumption_amount > 0 THEN user_id ELSE NULL END) AS paying_users
FROM behaviordate
GROUP BY gender;

image.png

查询每个用户的总消费金额

SELECT
    user_id,
    SUM(Consumption_amount) AS total_consumption
FROM behaviordate
WHERE Consumption_amount > 0
GROUP BY user_id
ORDER BY total_consumption DESC;

image.png

查询消费金额最高的前10名用户

SELECT
    user_name,
    user_id,
    SUM(Consumption_amount) AS total_consumption
FROM behaviordate
WHERE Consumption_amount > 0
GROUP BY user_id, user_name
ORDER BY total_consumption DESC
LIMIT 10;

image.png

消费行为分析

目标:

  • 总览平台的财务表现。
  • 对不同消费习惯的用户进行细致剖析,识别主要收入来源。

总收入(所有用户的总消费金额)

SELECT SUM(Consumption_amount) AS total_revenue
FROM behaviordate;

image.png

查询已经付费用户特征

-- 付费用户特征
SELECT
    COUNT(DISTINCT CASE WHEN Consumption_amount > 0 THEN user_id ELSE NULL END) AS paying_users,
    COUNT(DISTINCT CASE WHEN consumption_type = '月卡' THEN user_id ELSE NULL END) AS monthly_card_users,
    COUNT(DISTINCT CASE WHEN consumption_type = '道具充值' THEN user_id ELSE NULL END) AS recharge_users
FROM behaviordate;

image.png

查询月卡用户,充值用户(按消费区间分类:1-100, 101-999, 1000+)

-- 按消费区间分类
SELECT
    COUNT(CASE WHEN Consumption_amount BETWEEN 1 AND 100 THEN 1 ELSE NULL END) AS low_consumers,
    COUNT(CASE WHEN Consumption_amount BETWEEN 101 AND 999 THEN 1 ELSE NULL END) AS medium_consumers,
    COUNT(CASE WHEN Consumption_amount >= 1000 THEN 1 ELSE NULL END) AS high_consumers
FROM behaviordate
WHERE Consumption_amount > 0;

image.png

按月统计注册用户数

SELECT
    DATE_FORMAT(Registration_time, '%Y-%m') AS registration_month,
    COUNT(*) AS user_count
FROM behaviordate
GROUP BY registration_month
ORDER BY registration_month;

image.png

消费类型统计收入

SELECT
    consumption_type,
    SUM(Consumption_amount) AS total_revenue
FROM behaviordate
WHERE Consumption_amount > 0
GROUP BY consumption_type;

image.png

非活跃用户分析

目标:

  • 探讨非消费用户的存在原因及潜在价值。
  • 提供策略以激活这部分用户群体。

查询从未消费过的用户

SELECT *
FROM behaviordate
WHERE user_id NOT IN (SELECT user_id FROM behaviordate WHERE Consumption_amount > 0);

image.png

数据可视化

数据项 数值
用户总数 3123
8月新增注册用户数 89
男性用户数 1596
女性用户数 1527
付费用户数 2283
男性付费用户数 1131
女性付费用户数 1152
总收入 ¥123,463.89
付费用户特征 支付用户: 2283; 月卡: 177; 道具充值: 2122
按消费区间分类 1-100: 2270; 101-999: 2; 1000+: 0
按消费类型统计收入 道具充值: ¥118,153.89; 月卡充值: ¥5,310.00

结论与建议

通过对behaviordate数据集的深入分析,获得了用户基础信息、付费用户行为、消费模式以及非活跃用户的多个关键洞察。这些分析不仅揭示了用户增长趋势、性别分布、高价值客户特征和不同消费层次的需求,还为未来的产品改进和营销策略提供了数据支持。基于这些洞察,可以通过提供专属优惠和服务增强高价值用户的忠诚度,优化新用户引导流程以提高留存率,利用性别比例和付费用户特征设计个性化推广活动,调整产品定价策略吸引更多中低消费用户,并通过创建活跃的用户社区和定期举办线上线下活动来增强用户粘性。此外,建立定期的数据分析机制并引入高级数据分析工具如机器学习算法,将有助于持续监控用户行为变化,提前采取行动,从而提升现有用户的满意度和忠诚度,吸引更多新用户,实现业务的可持续增长

我正在参加【体验云数据库GaussDB(for MySQL)即抽奖,征文赢华为云开发者定制大礼包!】征文活动

征文链接:https://bbs.huaweicloud.cn/blogs/436298

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。