- 简介
- 目录大纲
- 最新文档
- 文集下载
数据分析总结
数据分析 什么是==数据分析==? 数据分析:对大量有序或无序的数据进行信息的集中整合、运算提取、展示等操作,通过这些操作找出研究对象的内在规律。 ==目的==:揭示事物运动、变化、发展的规律。 ==意义==:提高系统运行效率、优化系统作业流程、预测未来发展趋势。 pandas 什么是==pandas==? Pandas的名字来源于面板数据(Panel Data)与数据分析(data an...……
MARKJY - 2025年11月3日 16:22
数据可视化总结
数据可视化 什么是==数据可视化==? 数据可视化是为了使得数据更高效地反应数据情况,便于让读者更高效阅读,通过数据可视化突出数据背后的规律,以此突出数据中的重要因素 做这些之前必须不能忘记的就是导入模块和设置中文字体 ```python 导入模块 import matplotilb.pyplot as plt import pandas as pd 设置中文字体(常见可视化库中 默认字体通...……
MARKJY - 2025年11月3日 16:21
ChenJiaYing-第三周工作汇报
第三周工作汇报 作者:陈家颖、陈梓兴 本周进度概述 本周已经开始在同一台Linux虚拟机==双人合作搭建==CentOS7.9->Hadoop+MySQL+Zookeeper+Kafka 但由于Kafka4.1.0的==启动失败==问题,导致时间不足还==未整体完成==,目前陈梓兴Hadoop+MySQL部分只完成了Hadoop(Hadoop可运行,子模块无法运行) Kafka问题...……
MARKJY - 2025年10月31日 14:29
ChenJiaYing-第一周工作汇报
日期:2025-10-17 周期:大数据实训平台搭建阶段 一、总体进展 已完成 Hadoop 3.4.2 与 ZooKeeper 3.9.4 分布式集群的部署、调通与验证,两大核心组件均进入 可对外服务状态,为后续赛题实训奠定基座。 二、交付清单与量化结果 | 模块 | 交付内容 | 关键指标 | 达成情况 | | --- | --- | --- | --- | | ZooKeeper | ...……
MARKJY - 2025年10月31日 13:51
Hadoop搭建
IP固定 nmtui 主机名修改 hostnamectl set-hostname master 关闭防火墙 systemctl stop firewalld systemctl disable firewalld 映射文件修改 /etc/hosts 10.155.151.99 a01 用户创建 useradd hadoop passwd hadoop 用户提权、用户组提权 Hadoop:r...……
MARKJY - 2025年10月31日 13:50