大数据-码上记-青岛软件培训-Java培训-Python培训学校-万码学堂

大数据笔记

王姐姐 2024-11-19 18:46

如何把mysql数据库中的数据导入OpenSearch

将MySQL数据库中的数据导入OpenSearch，通常涉及几个步骤，包括数据导出、数据转换和数据导入。

(858)

(0)

0

王姐姐 2024-04-28 09:08

hadoop和spark的区别和联系

Hadoop和Spark是大数据处理领域两个不同的开源框架，它们既有区别又有联系。两者在使用场景，处理速度，生态系统等方面有所区别。

(1180)

(0)

0

王姐姐 2024-04-28 08:59

hadoop hdfs常见命令

1.操作命令操作命令是以 hdfs dfs 开头的命令。通过这些命令，用户可以完成 HDFS 文件的复制、删除和查找等操作。

(523)

(0)

0

王姐姐 2024-04-10 10:45

这里有几款好用的开源推荐系统推荐算法

目前互联网上所能找到的知名开源推荐系统(open source project for recommendation system)，并附上了个人的一些简单点评（未必全面准确），这方面的中文资料很少见，希望对国内的朋友了解掌握推荐系统有帮助。

(663)

(0)

0

牛叔叔 2024-03-31 17:06

Apache Flink的前世今生

Apache Flink 是一个开源的流处理框架，由Apache软件基金会开发和维护，旨在为实时和批处理数据提供统一的计算引擎。Flink的设计理念是支持无边界和有边界的流数据上的有状态计算，这使得它特别适用于处理持续不断的实时数据流，同时也能有效处理传统的批量数据集。

(727)

(0)

0

牛叔叔 2024-03-31 17:00

聊一聊hadoop有哪些替代方案？

Hadoop虽然一直是大数据处理领域的基石，但随着时间的推移和技术的发展，出现了一些新的或经过改进的分布式数据处理和存储解决方案，这些方案可以作为Hadoop某些组件的替代品或补充方案。

(1332)

(0)

0

牛叔叔 2024-03-31 16:59

带你用5分钟简单了解一下hadoop分布式计算框架

Hadoop是一个开源的分布式计算框架，主要用于处理和分析海量数据。这个框架由Apache软件基金会开发和维护，起初由Doug Cutting和Mike Cafarella创建，灵感来源于Google的MapReduce论文和Google File System（GFS）的研究成果。

(647)

(0)

0

王姐姐 2024-02-02 09:51

RabbitMQ的应用场景

主要应用在异步处理、应用解耦、流量削峰、日志处理、消息通信等方面。

(697)

(0)

0

王姐姐 2024-02-02 09:11

RabbitMQ和Kafka对比

吞吐量较低：Kafka和RabbitMQ都可以，吞吐量高：Kafka。

(683)

(0)

0

王姐姐 2023-12-10 11:53

ELK(ElasticSearch、Logstash、Kibana)安装及配置

ELK是三个开源软件的缩写，分别表示：Elasticsearch , Logstash, Kibana。Elasticsearch是个开源分布式搜索引擎，提供搜集、分析、存储数据三大功能。Logstash主要是用来日志的搜集、分析、过滤日志的工具，支持大量的数据获取方式。Kibana可以为 Logstash 和 ElasticSearch 提供的日志分析友好的 Web 界面，可以帮助汇总、分析和搜索重要数据日志。

(1640)

(0)

0

Page 1 of 3

1
2
3