365bet游戏开户-约彩365官旧版本网客户端下载-365双试投注

Est. 1980 · 每日复古新闻

万字长文:OceanBase保姆级教程详解

万字长文:OceanBase保姆级教程详解

文章目录

前言一、OceanBase是什么?二、各大公司选择他的原因Boss直聘通过OceanBase节省70%存储成本?(一)存储成本ClickHouse 存储引擎调研OceanBase 存储引擎调研1. 存储引擎架构2. 数据压缩技术

(二)高可用和稳定性ClickHouseOceanBase

三、 OceanBase 自带智能化的白屏 OCP 平台工具四、 OceanBase 快速安装部署(一)、系统要求(二)、快速安装方式1. 使用 OceanBase All-in-One 部署工具(推荐)2. 使用 Docker 快速体验

(三)、集群部署(生产环境参考)(四)、基本操作(五)、常见问题(六)、参考资源

五、集成SpringBoot(一)、准备工作(二)、配置数据源1. 添加 OceanBase JDBC 驱动依赖2. 配置 `application.yml`3. 注意事项

(三)、使用 Spring Data JPA 操作 OceanBase1. 定义实体类2. 创建 Repository 接口3. 编写 Service 和 Controller

(四)、使用 MyBatis 操作 OceanBase1. 添加 MyBatis 依赖2. 创建 Mapper 接口和 XML3. 在 `application.yml` 中配置 MyBatis

(五)、测试集成(六)、高级配置(可选)1. 使用连接池(如 HikariCP)2. 事务管理3. 多数据源配置

(七)、常见问题集成总结参考资源

六、总结1. 分布式架构,无限扩展2. 高可用与强一致性3. 高性能与低延迟4. 兼容性与低成本5. 金融级可靠性6. 场景适用性广7. 生态与工具完善

七、总结对比(vs 传统数据库)适用企业类型核心价值

前言

目前OceanBase已经逐渐成熟,并展现出强大的实力,越来越多的公司选择从Mysql迁移到OceanBase,并且该项目在github上的star已经来到了7k+,那么他究竟有什么魔力让越来越的公司去选择他,下面将为大家揭晓答案!

一、OceanBase是什么?

OceanBase 是一个分布式数据库系统,由阿里巴巴集团自主研发的。它是一种面向在线事务处理 (OLTP) 和在线分析处理 (OLAP) 的新型分布式关系型数据库系统,设计目标是为了解决海量数据的存储和处理问题。OceanBase 基于共享架构,具有高性能、高可用性、高扩展性和高容错性等特点。

以下是一些 OceanBase 的主要特点:

分布式架构:OceanBase 是一个分布式系统,数据存储在多个节点上,每个节点负责存储和处理部分数据。多副本机制:OceanBase 采用了多副本机制来保证数据的可靠性和高可用性。数据在多个节点上进行副本存储,即使某个节点发生故障,系统仍然可以继续提供服务。自动化负载均衡:OceanBase 内置了负载均衡机制,能够自动调整数据的分布和负载,保证各个节点的负载均衡。分布式事务支持:OceanBase 提供了强一致性的分布式事务支持,能够保证事务的原子性、一致性、隔离性和持久性。强大的存储引擎:OceanBase 内置了高性能的存储引擎,支持多种数据模型,包括关系型数据、半结构化数据和非结构化数据。高性能查询:OceanBase 具有优化的查询引擎,能够快速执行复杂的查询操作,支持实时分析和实时报表等应用场景。可扩展性:OceanBase 具有良好的可扩展性,可以根据业务需求动态扩展节点和存储容量。

总的来说,OceanBase 是一款功能强大的分布式数据库系统,适用于大规模数据存储和处理的场景,如电子商务、金融、物联网等领域。

不过仅仅凭借这些特点能让企业更换现有的数据库我想还不够?先看下面社区的企业案例截图图。

从上面的企业案例中我们可以看到,不管是在线教育还是银行或者互联网公司都在做相关的尝试和迁移,而且这么做的的公司越来越多,因为OceanBase不仅仅从性能上较其他关系型数据库有所提升,而且它在存储空间也做了大量优化,让企业用更加低的投入成本,享受比原先更好的服务,那么他们何乐而不为呢。

二、各大公司选择他的原因

Boss直聘通过OceanBase节省70%存储成本?

Boss直聘我想大家都不陌生,作为一名打工人怎么可能不在上面投简历呢?没在上面投过的我只能说:

BOSS直聘是一款开创性的在线招聘产品,采用全球首创的互联网“直聘”模式。目前,它已发展成为中国最大的招聘平台之一。其负责的BOSS业务场景主要涉及存储招聘过程中的聊天记录信息,这些数据量极大,每天增量达到5亿到10亿条。与招聘相关的聊天记录通常是一次性写入,之后很少被访问或更新,属于写多读少的特点。

面对不断增长的在线数据,特别是那些访问频率极低甚至从未被访问的历史聊天记录,占用了巨大的在线业务库存储空间,达到PB级别,导致了大量硬件资源的浪费,增加了企业的IT成本。同时,随着数据量的增加,在线数据库变得庞大臃肿,查询效率逐渐下降,给后续的数据变更和扩展带来了阻碍。

为了解决这些问题,他们的解决方案是对历史聊天记录进行冷热数据分离。热数据存储在多个MySQL集群中,采用分库分表的方式管理。每月定期清理过期数据,并将其滚动写入历史归档库。 看起来也没毛病,基本上目前主流的解决方式。

那么他们在对超大容量的归档库进行选型时候对这几个数据库:MySQL、ClickHouse、OceanBase、某开源分布式数据库(以下简称为DB-U),从存储成本、高可用这两个方面对归档库进行评估。

(一)存储成本

分别写入1亿行相同的单副本数据,并对其磁盘的使用情况进行对比:

这成本一目了然了吧,知道该选谁了吧,但毕竟要知道啥原因导致的存储成本降低。

ClickHouse 存储引擎调研

ClickHouse 存储成本低的原因显而易见,就是因为它的存储引擎是基于列存的。相比行存存储引擎,ClickHouse 同一列中的数据属于同一类型,压缩效果显著。列存往往有着高达十倍甚至更高的压缩比,节省了大量的存储空间,降低了存储成本。

但对于历史归档库一般都是写多读少的场景,像 ClickHouse 这种纯列存的存储引擎在这里并不能发挥出查询性能好的优势,相反列存引擎写入性能差的劣势还被放大了。

OceanBase 存储引擎调研

1. 存储引擎架构

OceanBase 的存储引擎基于 LSM Tree 架构,将数据分为基线数据(放在 SSTable 中)和增量数据(放在 MemTable/SSTable 中)两部分,其中基线数据是只读的,一旦生成就不再被修改;增量数据支持读写。

数据库的DML(数据操作语言)操作,包括插入、更新、删除等,首先写入内存中的MemTable。这使得写入性能相当于内存数据库,非常适合历史归档库写入频率高于读取的场景。当MemTable达到一定大小时,会转储到磁盘成为增量的SSTable(持久化存储表,见图中红色箭头部分)。这个过程是批量的顺序写,相比B+树的离散随机写,大大提高了写入性能。

2. 数据压缩技术

作为一款 HTAP 数据库产品, OceanBase 使用基于 LSM-Tree 架构的存储引擎,同时支持 OLTP 与 OLAP 负载,这种存储架构提供了优秀的数据压缩能力。在 OceanBase 中,增量数据会写入 clog 和 memtable 中, OceanBase 的 memtable 是内存中的 B+ 树索引,提供高效的事务处理能力。 memtable 会定期通过 compaction 生成硬盘持久化数据 sstable ,多层 sstable会采用 leveled compaction 策略进行增量数据重整。sstable 中数据块的存储分为两层,其中 2M 定长的数据块(宏块)作为 sstable 写入 I / O 的最小单元,存储在宏块中的变长数据块(微块)作为数据块压缩和读 I / O 的最小单元。

(二)高可用和稳定性

除了存储成本以外,他们还对归档库选型中的候选者 ClickHouse 和 OceanBase 的高可用能力和稳定性进行了对比。

ClickHouse

clickHouse 需要依赖来zookeeper,通过Replication 复制来实现集群之前副本的数据同步,保证了在不同的物理设备上有多个数据副本,减少了数据丢失的风险。 不过clickHouse 不支持线性扩展,当数据增长过快,可能会导致整个集群不可用,另外由于依赖zookeeper,那么在排查问题时链路也增加了,并且当zookeeper出现问题,也容易造成数据丢失。

OceanBase

OceanBase 是原生的分布式数据库,原生就可以保证多个数据副本之间的一致性,它们利用了基于 Paxos 分布式一致性协议保证了在任一时刻只有当多数派副本达成一致时,才能推选一个 Leader, 保证主副本的唯一性来对外提供数据服务。也就是说,OceanBase 通过多副本和 Paxos 协议来保证数据库的高可用。

相比 MySQL 和 ClickHouse 的高可用方案方案,OceanBase 的高可用方案降低了我们的运维难度和业务变更难度。而且 OceanBase 的多地多副本架构和 Paxos 一致性协议,还能够支持数据副本分别存储在同城和异地,实现异地容灾。

综合考虑他们最终选择了OceanBase ,从落地实践,到最终70%业务成本节省,对他们来说选择OceanBase是正确的。

三、 OceanBase 自带智能化的白屏 OCP 平台工具

OceanBase Control Platform (OCP) 是一个管理平台,专门用于管理OceanBase数据库系统。它提供了一套丰富的功能和工具,用于监控、调整、配置和管理OceanBase数据库集群的各个方面。

以下是OCP的主要特点和功能:

监控与警报:OCP允许管理员实时监控OceanBase数据库集群的性能指标和运行状态。它可以收集和展示各种关键指标,如吞吐量、延迟、负载情况等,并提供警报功能,及时通知管理员可能出现的问题或异常情况。配置管理:OCP提供了集中式的配置管理功能,管理员可以通过界面轻松地管理OceanBase数据库集群的配置信息。这包括数据库参数、节点配置、集群拓扑等。性能调优:OCP提供了性能调优工具,帮助管理员优化数据库集群的性能。通过分析性能指标和数据库配置,管理员可以调整参数和配置,以提升系统性能和稳定性。版本管理:OCP支持OceanBase数据库软件的版本管理。管理员可以通过OCP界面方便地进行数据库软件的升级、回滚和版本控制。安全管理:OCP提供了安全管理功能,包括用户管理、权限管理等。管理员可以通过OCP管理用户账号、角色权限等安全相关的配置。故障管理:OCP具有故障管理功能,可以帮助管理员及时识别和处理数据库集群中的故障。它提供了故障诊断工具和故障处理指南,帮助管理员快速恢复服务。可扩展性:OCP是一个可扩展的平台,支持插件式开发和定制化。管理员可以根据实际需求开发定制化的功能模块,扩展OCP的功能和能力。

总的来说,OceanBase Control Platform (OCP) 是一个功能强大的管理平台,为管理员提供了全面、便捷的管理工具和功能,帮助他们有效地管理和运维OceanBase数据库集群。

四、 OceanBase 快速安装部署

OceanBase 是一款高性能、高可用的分布式关系数据库,支持海量数据存储和高并发访问。以下是 OceanBase 快速安装部署的步骤指南,适用于测试或开发环境:

(一)、系统要求

• 操作系统:CentOS/RHEL 7.x/8.x、Ubuntu 20.04/22.04、Anolis OS 等(推荐使用 CentOS 7.x)。 • 资源要求: • 单机测试环境:4 核 CPU、8GB 内存、100GB 磁盘空间。 • 生产环境:建议至少 16 核 CPU、64GB 内存、SSD 硬盘。 • 依赖项: • 关闭防火墙或开放 OceanBase 默认端口(如 2881-2883、3881-3883)。 • 确保时钟同步(使用 NTP 或 Chrony)。

(二)、快速安装方式

1. 使用 OceanBase All-in-One 部署工具(推荐)

OceanBase Deployer (OBD) 是官方提供的自动化部署工具,适合快速搭建单机或集群环境。

步骤:

安装 OBD:

# 通过 yum 安装(需配置 OceanBase 镜像源)

sudo yum install -y ob-deploy

或直接下载 RPM 包:

wget https://mirrors.aliyun.com/oceanbase/community/stable/el/7/x86_64/ob-deploy-1.3.1-1.el7.x86_64.rpm

sudo rpm -ivh ob-deploy-1.3.1-1.el7.x86_64.rpm

初始化配置文件: 创建配置文件 mini-local.yaml(单机测试):

oceanbase-ce:

servers:

- name: server1

ip: 127.0.0.1

global:

home_path: /home/admin/oceanbase

data_dir: /data

redo_dir: /redo

memory_limit: 8G # 至少 8G 内存

system_memory: 4G

cpu_count: 4

devname: eth0

production_mode: false # 测试环境关闭生产模式

cluster_id: 1

部署并启动集群:

obd cluster deploy ob-test -c mini-local.yaml

obd cluster start ob-test

验证部署:

obd cluster display ob-test

mysql -h127.1 -uroot -P2881 -N -e "show databases;"

2. 使用 Docker 快速体验

适用于本地测试环境,快速启动 OceanBase 实例。

步骤:

拉取 OceanBase 镜像:

docker pull oceanbase/oceanbase-ce

启动容器:

docker run -d --name oceanbase \

-p 2881-2883:2881-2883 \

-e MINI_MODE=1 \ # 单机模式

oceanbase/oceanbase-ce

进入容器并连接数据库:

docker exec -it oceanbase bash

mysql -uroot -h127.1 -P2881

(三)、集群部署(生产环境参考)

若需部署多节点集群,需配置 yaml 文件定义 Zone 和节点信息:

oceanbase-ce:

servers:

- name: server1

ip: 192.168.1.101

- name: server2

ip: 192.168.1.102

- name: server3

ip: 192.168.1.103

global:

memory_limit: 64G

datafile_size: 200G

log_disk_size: 100G

cluster_id: 100

cluster_name: ob-cluster

zones:

- name: zone1

servers: ["server1"]

- name: zone2

servers: ["server2"]

- name: zone3

servers: ["server3"]

执行部署命令:

obd cluster deploy ob-prod -c cluster.yaml

obd cluster start ob-prod

(四)、基本操作

连接数据库:

mysql -h -uroot -P2881 -N

创建租户和用户:

CREATE RESOURCE UNIT unit1 MAX_CPU 4, MEMORY_SIZE '8G';

CREATE RESOURCE POOL pool1 UNIT='unit1', UNIT_NUM=1;

CREATE TENANT obtest RESOURCE_POOL_LIST=('pool1') SET OB_COMPATIBILITY_MODE='mysql';

CREATE USER 'user' IDENTIFIED BY 'password';

查看集群状态:

SELECT * FROM oceanbase.DBA_OB_SERVERS;

(五)、常见问题

内存不足:确保 memory_limit 配置足够(至少 8G)。端口冲突:检查 2881-2883 和 3881-3883 端口是否被占用。日志路径权限:确保 /data、/redo 等目录有写入权限。

(六)、参考资源

• 官方文档:OceanBase 文档中心 • GitHub 仓库:OceanBase CE

通过以上步骤,您可以在 10 分钟内完成 OceanBase 的快速部署!

想要快速体验oceanbase的可参考docker 安装方式 https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000000507531

五、集成SpringBoot

https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000000508409

将 Spring Boot 与 OceanBase 集成,主要涉及配置数据源、使用 JPA 或 MyBatis 操作数据库。以下是详细步骤和示例:

(一)、准备工作

OceanBase 环境就绪 • 确保 OceanBase 已安装并运行(单机或集群模式)。 • 创建数据库和用户(如果使用 MySQL 兼容模式):

CREATE DATABASE demo_db;

CREATE USER 'demo_user' IDENTIFIED BY 'Demo@123';

GRANT ALL PRIVILEGES ON demo_db.* TO 'demo_user';

Spring Boot 项目初始化 • 使用 Spring Initializr 创建项目,选择依赖: ◦ Spring Web(用于 REST API) ◦ Spring Data JPA(或 MyBatis) ◦ JDBC API

(二)、配置数据源

1. 添加 OceanBase JDBC 驱动依赖

OceanBase 兼容 MySQL 协议,可以直接使用 MySQL Connector/J 驱动。 在 pom.xml 中添加:

mysql

mysql-connector-java

8.0.30

2. 配置 application.yml

在 src/main/resources/application.yml 中配置 OceanBase 数据源:

spring:

datasource:

url: jdbc:mysql://:2881/demo_db?useUnicode=true&characterEncoding=utf8&useSSL=false&serverTimezone=UTC

username: demo_user

password: Demo@123

driver-class-name: com.mysql.cj.jdbc.Driver

jpa:

hibernate:

ddl-auto: update # 自动创建表结构(测试环境用)

show-sql: true

properties:

hibernate:

dialect: org.hibernate.dialect.MySQL8Dialect

3. 注意事项

• 时区问题:如果 OceanBase 默认时区与应用不一致,可在 url 中添加 &serverTimezone=Asia/Shanghai。 • 兼容性模式:OceanBase 支持 MySQL 兼容模式,无需修改 SQL 语法。

(三)、使用 Spring Data JPA 操作 OceanBase

1. 定义实体类

import javax.persistence.*;

import lombok.Data;

@Data

@Entity

@Table(name = "user")

public class User {

@Id

@GeneratedValue(strategy = GenerationType.IDENTITY)

private Long id;

private String name;

private String email;

}

2. 创建 Repository 接口

import org.springframework.data.jpa.repository.JpaRepository;

public interface UserRepository extends JpaRepository {

}

3. 编写 Service 和 Controller

@Service

public class UserService {

@Autowired

private UserRepository userRepository;

public User createUser(User user) {

return userRepository.save(user);

}

public List getAllUsers() {

return userRepository.findAll();

}

}

@RestController

@RequestMapping("/api/users")

public class UserController {

@Autowired

private UserService userService;

@PostMapping

public User createUser(@RequestBody User user) {

return userService.createUser(user);

}

@GetMapping

public List getAllUsers() {

return userService.getAllUsers();

}

}

(四)、使用 MyBatis 操作 OceanBase

1. 添加 MyBatis 依赖

org.mybatis.spring.boot

mybatis-spring-boot-starter

2.3.0

2. 创建 Mapper 接口和 XML

@Mapper

public interface UserMapper {

@Insert("INSERT INTO user(name, email) VALUES(#{name}, #{email})")

@Options(useGeneratedKeys = true, keyProperty = "id")

void insert(User user);

@Select("SELECT * FROM user")

List findAll();

}

3. 在 application.yml 中配置 MyBatis

mybatis:

mapper-locations: classpath:mapper/*.xml

configuration:

map-underscore-to-camel-case: true

(五)、测试集成

启动 Spring Boot 应用:

mvn spring-boot:run

通过 API 测试: • 创建用户:

curl -X POST http://localhost:8080/api/users \

-H "Content-Type: application/json" \

-d '{"name": "Alice", "email": "alice@example.com"}'

• 查询用户列表:

curl http://localhost:8080/api/users

验证 OceanBase 数据:

SELECT * FROM demo_db.user;

(六)、高级配置(可选)

1. 使用连接池(如 HikariCP)

Spring Boot 默认使用 HikariCP,可在 application.yml 中优化配置:

spring:

datasource:

hikari:

maximum-pool-size: 10

connection-timeout: 30000

2. 事务管理

在 Service 层添加 @Transactional:

@Service

public class UserService {

@Transactional

public User createUser(User user) {

// 业务逻辑

}

}

3. 多数据源配置

如果需要同时连接多个 OceanBase 实例,需自定义多个 DataSource 和 EntityManager(参考 Spring Boot 多数据源文档)。

(七)、常见问题

驱动兼容性:确保 MySQL Connector/J 版本与 OceanBase 兼容(建议 8.x)。连接超时:检查 OceanBase 端口(默认 2881)是否开放,防火墙是否放行。时区错误:在 url 中显式指定时区(如 &serverTimezone=UTC)。依赖冲突:排除默认的 HikariCP 或 Tomcat JDBC 池(如有冲突)。

集成总结

通过以上步骤,Spring Boot 可以无缝集成 OceanBase,支持 JPA 或 MyBatis 操作数据库。关键点包括:

使用 MySQL 协议配置数据源。确保驱动版本和时区配置正确。通过 JPA 或 MyBatis 简化数据库操作。

参考资源

• OceanBase JDBC 文档 • Spring Boot Data Access 文档

参考文档: https://open.oceanbase.com/blog/8600130 https://open.oceanbase.com/blog/8983073840

六、总结

OceanBase 作为一款高性能、高可用的分布式关系数据库,在多个场景下展现出显著优势,以下是其主要使用好处总结:

1. 分布式架构,无限扩展

• 水平扩展:通过多节点分布式架构,轻松应对数据量增长和并发压力,支持 PB 级数据存储和 百万级 QPS。 • 弹性扩容:在线动态添加节点,无需停机即可扩展存储和计算能力。 • 多租户隔离:支持多租户资源隔离,不同业务共享集群但互不影响,节省硬件成本。

2. 高可用与强一致性

• 自动容灾:基于 Paxos 协议的多副本机制,数据强一致(RPO=0),故障时自动切换(RTO<30秒)。 • 多地多中心部署:支持跨机房、跨城市容灾,满足金融级容灾需求。 • 无单点故障:分布式架构天然避免单点故障,服务持续可用。

3. 高性能与低延迟

• OLTP 优化:针对事务处理优化,支持高并发低延迟的在线交易场景(如支付、订单)。 • 实时 HTAP:一套引擎同时支持 OLTP(事务处理)和 OLAP(实时分析),避免数据冗余同步。 • 智能优化器:基于代价的优化器(CBO)自动选择最优执行计划。

4. 兼容性与低成本

• MySQL/Oracle 兼容:高度兼容 MySQL 5.7/8.0 协议及 Oracle 语法,迁移成本极低。 • 开源开放:社区版(CE)完全开源,无商业授权费用,降低 TCO(总拥有成本)。 • 存储压缩:高效数据压缩技术(如行列混存),存储成本降低 70% 以上。

5. 金融级可靠性

• 数据强一致:全局一致性快照,确保分布式事务的 ACID 特性。 • 高可靠存储:数据多副本(默认 3 副本)存储,支持自动修复和校验。 • 全链路监控:内置运维监控工具(OCP、OBAgent),支持慢查询分析和性能调优。

6. 场景适用性广

• 金融核心系统:满足高并发交易、资金清算等场景的强一致需求(如网商银行、支付宝)。 • 电商与物联网:海量订单、日志数据的高效存储与实时分析。 • 政企数字化转型:支持大数据量、高并发的政务或企业级应用。

7. 生态与工具完善

• 丰富工具链:提供数据迁移工具(OMS)、开发工具(ODC)、运维平台(OCP)等。 • 云原生支持:无缝集成 Kubernetes,支持公有云、私有云及混合云部署。 • 社区活跃:背靠阿里云和开源社区,持续迭代新功能(如向量化计算、HTAP 增强)。

七、总结对比(vs 传统数据库)

场景传统数据库(如 MySQL)OceanBase数据规模单机 TB 级,扩展复杂分布式 PB 级,弹性扩展高可用性主从异步复制,RPO>0多副本强一致,RPO=0资源成本硬件要求高,存储成本高多租户隔离,存储压缩,成本降低 70%HTAP 能力需分离 OLTP/OLAP 系统一套引擎支持混合负载容灾能力依赖外部工具实现跨机房容灾原生支持多地多中心部署

适用企业类型

• 金融行业:银行、保险、证券等对一致性要求严苛的场景。 • 互联网公司:电商、社交、游戏等海量数据高并发业务。 • 政企单位:政务云、能源、物流等需要大规模数据管理的场景。

核心价值

• 风险可控:金融级可靠性保障业务连续性。 • 降本增效:开源免费 + 资源利用率提升,长期成本优势显著。 • 技术前瞻:分布式架构支撑未来 5-10 年业务增长需求。

通过上述优势,OceanBase 已成为替代传统集中式数据库(如 Oracle、MySQL)和应对大数据挑战的理想选择,如果对以上的内容有疑问或者想交流可在评论区留下您的看法。

转自:https://blog.csdn.net/qq_28754027/article/details/136330172

相关文章