99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

2022年數(shù)據(jù)庫發(fā)展總結(jié)

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 2023-01-10 10:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大家知道 2022 年我又創(chuàng)業(yè)了,加入以虎哥 Startup 的 Databend 這個(gè)公司擔(dān)任聯(lián)創(chuàng),我也從傳統(tǒng)的 OLTP 轉(zhuǎn)戰(zhàn)到 OLAP,今年也接觸了更多大數(shù)據(jù)用戶。趁著元旦假期整理一下思路,從數(shù)據(jù)角度和大家聊一下 2022 年數(shù)據(jù)庫發(fā)展,這里首先聲明這篇文章更多只代表個(gè)人觀點(diǎn),大家看看就好,有興趣后面找機(jī)會(huì)再交流。

中國(guó)數(shù)據(jù)庫行業(yè)隨著 2021 年 7 月 PingCAP 完成 3.4億美元融資,估值達(dá)到 30 億美金。把中國(guó)數(shù)據(jù)庫行業(yè)引爆了。2022 年 達(dá)夢(mèng)數(shù)據(jù)庫 IPO 12 月 23 日 順利過會(huì),如果上市成功預(yù)計(jì)估計(jì)在 500 億人民幣,不出意外的話,這將是科創(chuàng)板最大的 IPO 之一。

那么你知道中國(guó)的數(shù)據(jù)公司有多少嗎?據(jù)不完全的統(tǒng)計(jì)已經(jīng)超過 300 +, 那 2023 年數(shù)據(jù)庫市場(chǎng)又是什么變化呢?我這里拋出來 5 個(gè)問題和大家討論一下。

Q1. 中國(guó)和海外數(shù)據(jù)庫的差距還有多遠(yuǎn)?

Q2. 未來是 OLTP 還是 OLAP ?

Q3. 從國(guó)際上來看 HTAP 是不是未來?

Q4. MySQL DBA 和大數(shù)據(jù)從業(yè)者會(huì)有什么改變?

Q5. 現(xiàn)在還是不是數(shù)據(jù)方向的創(chuàng)業(yè)好的時(shí)機(jī)?

Q1: 中國(guó)和海外數(shù)據(jù)庫的差距還有多遠(yuǎn)?

也許有很多朋友認(rèn)為,我們現(xiàn)在國(guó)內(nèi)有 300+ 數(shù)據(jù)庫公司,每家公司的產(chǎn)品都有獨(dú)到之處,應(yīng)該全球的數(shù)據(jù)庫上來看,我們是最先進(jìn)的了吧。例如:2019 年 OB 打榜了 TPCC , 全球開源項(xiàng)目 TiDB, …

如果單純的比中國(guó)數(shù)據(jù)庫和海外數(shù)據(jù)庫差多遠(yuǎn),其實(shí)都比較主觀,那么不如通過 OB 打榜 TPCC 來分析一下。

其實(shí)如果懂行人來看 OB 打榜第一名,感覺說是中國(guó)數(shù)據(jù)庫第一次參與了 TPCC 更有意義。首先 2019 年的打榜離 Oracle 上次打榜 2010 年過去了9年,在硬件,系統(tǒng),軟件都有變化的情況下做到和 Oracle 上次打榜基本相同的成績(jī):tpmC為6.25, Oracle 第二名1.01USD,從成本上來講幾乎相差無幾。OB 打榜公布的第一次打榜費(fèi)用:380,452,842 元(人民幣),,通過個(gè)事情可以說我們追上了人家 9 年前的實(shí)力。也許被行內(nèi)人指出來了,OB 也覺得需要再次雄起一下,2020 年 OB 再次打榜 TPCC 花費(fèi):2,814,509,552 人民幣,實(shí)現(xiàn) 3.98 元/tpmC 細(xì)心的朋友可能對(duì)比出來硬件再次提升了,機(jī)器規(guī)模又翻 7 倍+ 的情況再次打榜。因?yàn)槊考业?TPCC 壓測(cè)程序都不開源,大家也基本是壓著 tpmC 上限是 12.86 測(cè)試, 高于這個(gè)值就被視為全內(nèi)存操作的無效測(cè)試。

粗略整理了一些數(shù)據(jù)方便對(duì)比:

157d1a7c-902a-11ed-bfe3-dac502259ad0.png

從上面的數(shù)據(jù)看,測(cè)試數(shù)據(jù)基本上都是貼著 12.86 進(jìn)行,你懂的。

如果通過這個(gè)測(cè)試來對(duì)比中國(guó)數(shù)據(jù)和海外數(shù)據(jù)庫的先進(jìn),我的觀點(diǎn)是:

1. 中國(guó)的分布式數(shù)據(jù)庫可以進(jìn)行 PB 級(jí)別的操作

2. 中國(guó)的分布式數(shù)據(jù)可以進(jìn)行到上十萬個(gè)+ core 一起工作

3. 中國(guó)分布式服務(wù)器可以達(dá)到上千臺(tái)一起工作

那我們先進(jìn)嗎?我只能說我目前沒看到有項(xiàng)目能運(yùn)行起來這個(gè)環(huán)境,畢竟一個(gè)數(shù)據(jù)庫項(xiàng)目花 28億人民幣(3年費(fèi)用),我還沒見過。OB 的測(cè)試基于是基于云上來評(píng)測(cè)的。我們也來看看海外的云上的 RDS 及對(duì)應(yīng)的報(bào)價(jià)。

Oracle Cloud 上 MySQL 報(bào)價(jià)

159d1282-902a-11ed-bfe3-dac502259ad0.png

MySQL 單集群 HTAP 解決方案,月成本:2萬美金,存儲(chǔ)最大支持: 50T 。

AWS Aurora VM 報(bào)價(jià)

15b31cb2-902a-11ed-bfe3-dac502259ad0.png

AWS 的 Aurora 最高配支持 5 PB 存儲(chǔ)每月 517,256 美元,其中存儲(chǔ)太貴占到:512,000 美元,實(shí)際生產(chǎn)中肯定不會(huì)這么干,真正的 OLTP 數(shù)據(jù)不會(huì)有這么多,更多的數(shù)據(jù)可以歸檔到 Databend ,Snowflake 類在線數(shù)倉中來降低成本,這類云數(shù)倉每 TB 的成本一個(gè)月在 120元左右。

阿里云 PolarDB

15c764c4-902a-11ed-bfe3-dac502259ad0.png

這個(gè)就成本算我覺得阿里的 PolarDB 價(jià)格是優(yōu)于 Oracle , AWS 的價(jià)格?;剡^頭來看:中國(guó)的數(shù)據(jù)庫和海外的數(shù)據(jù)庫差距還有多遠(yuǎn)?

從 [DB-engines](DB-Engines Ranking - popularity ranking of relational DBMS[1]DB-Engines Ranking - popularity ranking of relational DBMS[2]) 排名上看到 TiDB 排名 49 位,GBase 排名 79 位, OceanBase 排名 87 位, TDSQL for MySQL 排名 101 位, 阿里云前150名排名中進(jìn)入 4 位。

我的感覺確是我們部分場(chǎng)景確時(shí)超越海外的產(chǎn)品,但海外的產(chǎn)品感覺向著更加務(wù)實(shí)的方向在發(fā)展。反觀國(guó)內(nèi)這種超大集群的引導(dǎo),造成的用戶不必要的成本浪費(fèi)。

海外數(shù)據(jù)庫今年發(fā)展方向:

- 云原生方向:CockroachDB(排名 34 位), YougabyteDB (排名 44 位), Snowflake (排名 8 位)

- 更加易用的方向發(fā)展:更方便維護(hù),例如 PlanetScale 在 OLTP 中對(duì)數(shù)據(jù)引入 git branch 概念

- DB Serverless 按使用時(shí)間付費(fèi),存儲(chǔ)按使用空間付費(fèi),不再為預(yù)留付費(fèi)

從這些方面看來,國(guó)內(nèi)的數(shù)據(jù)庫追趕的很快,國(guó)內(nèi)也有上面類似的產(chǎn)品,但真正 get 到靈魂,這些理念被企業(yè)所接受,估計(jì)還需要 3-5 年時(shí)間。

Q2. 未來是 OLTP 還是 OLAP ?

首先從 TPCC 打榜上來看,數(shù)據(jù)庫廠商對(duì)于這個(gè) Benchmark 大都是失去興趣了,也冷靜了,微信群里也沒有因?yàn)榇虬穸M(jìn)行口水,我們也成熟了。因?yàn)榛旧洗蠹乙捕济靼?,在一定成本預(yù)算下,選擇出來合適的產(chǎn)品就可以。例如:業(yè)務(wù)對(duì) SQL 響應(yīng)指標(biāo)要求 500 ms 以下,支持 3000 QPS 就可以滿足業(yè)務(wù),支持到 IPO 沒啥問題了,在這樣的前提下,大家肯定不再是按打榜來選擇,因?yàn)榇蠹以跀?shù)據(jù)庫這個(gè)方向上有所積累后,可以選擇的開源產(chǎn)品太多了,甚至云的上 RDS 采購一個(gè)也夠用了。整體上來看現(xiàn)在 OLTP 已經(jīng)非常成熟,現(xiàn)在 OLTP 賣貨,更多是打著安全,有保障,合作聯(lián)合開發(fā)(賣數(shù)據(jù)庫保險(xiǎn)一樣在賣貨) 。

大家口水了多年:MySQL ,PostgreSQL 誰更強(qiáng),爭(zhēng)論多年后,也終于有了一個(gè)初步的結(jié)果。在互聯(lián)網(wǎng)領(lǐng)域里 MySQL 還是當(dāng)之無愧的王者, Pg 也在國(guó)產(chǎn)化領(lǐng)域中披上各種馬甲在沖鋒, MySQL 也在披著馬甲,還有套著 Pg 往前沖的。基本上也可以說 OLTP 基本是一種成熟狀態(tài),最終誰能在這波浪潮中贏下來,就看誰能擁抱一個(gè)更加開放的生態(tài),整合更多的合作伙伴,輸出更多解決方案,例如:銀行系統(tǒng)運(yùn)行,火車票售票系統(tǒng), 電力的數(shù)據(jù)庫系統(tǒng)。

OLTP 的成熟,但 OLTP 的成本通常比較高,大家也會(huì)把 OLTP 的數(shù)據(jù)慢慢轉(zhuǎn)向 OLAP 對(duì)外提供服務(wù),也就意味著 OLAP 可以創(chuàng)造更多的財(cái)富?我現(xiàn)在算是從 OLTP 跨入了 OLAP ,給大家分享倆個(gè) 2022 年我看到案例。

Case1 一個(gè)朋友在從事獵頭行業(yè),別人找他要人后,他總能很快的找到意向標(biāo)的人給甲方,并較快的獲得到甲方的認(rèn)可。這個(gè)事情,最初我看到覺得他太牛X了,我也非常好奇他怎么做到的?后來熟悉后才知道他就是 OLAP 運(yùn)用的高手,他獲取 gharchive.org 上數(shù)據(jù)存入 Databend(Databend + COS) , 然后對(duì)甲方想要的技術(shù)人員畫像,這樣些人可能對(duì)什么 Repo 感興趣,然后找到對(duì)應(yīng)的 Repo 中的貢獻(xiàn)者,聯(lián)系其中活躍的人,給他們分享機(jī)會(huì),獲得認(rèn)可。他是我見過轉(zhuǎn)獵頭比較成功的程序員。

Case 2 分析區(qū)塊鏈錢包,進(jìn)行跟投(純屬虛構(gòu))我們?cè)诔垂芍?,?jīng)常想著可以看看今天誰買了什么,或是大家都在買什么就可以有很多決策了,但這些數(shù)據(jù)需要去購買,而且非常的貴,還拿不到成交和賬戶的對(duì)關(guān)系。在區(qū)塊鏈中,這一切都是透明的,誰花了多少錢,買了什么,這一切都在鏈上。今年看到一些猛人對(duì)鏈上的數(shù)據(jù)進(jìn)行解析后,分析出來盈利最多的 Top 1000 然后再找到適合個(gè)人風(fēng)格的進(jìn)行跟投。這個(gè)也可以說 OLAP 的一個(gè)應(yīng)用。

舉了倆個(gè)個(gè)人在使用 OLAP 的場(chǎng)景,其實(shí)企業(yè)的使用 OLAP 的場(chǎng)景也非常多,也有成熟的套路,只是后續(xù)的 OLAP 的成本會(huì)越來越低,越有利于用戶的使用。

目前也可以說是海量的數(shù)據(jù)時(shí)代,在 OLAP 中數(shù)據(jù)到 PB 級(jí)都和玩一樣,今年經(jīng)歷了 N 多單天數(shù)據(jù)量在 100T 以上的項(xiàng)目,也讓我對(duì) Databend 這個(gè)項(xiàng)目產(chǎn)生了非常大的敬意,這類數(shù)據(jù)的壓縮基本能達(dá) 8-20倍的壓縮, 同時(shí)還能較好的支持計(jì)算。

新一代的云原生 OLAP 也在替代著傳統(tǒng)大數(shù)據(jù)項(xiàng)目, SQL 成為統(tǒng)一語言,新一代的云原生 OLAP 也會(huì)讓大數(shù)據(jù)項(xiàng)目越來越簡(jiǎn)單。OLAP 讓大數(shù)據(jù)項(xiàng)目也在向著:更便宜,更好用,高性能 的方向發(fā)展。

16043a48-902a-11ed-bfe3-dac502259ad0.png

Q3. 從國(guó)際上來看 HTAP 是不是未來?

HTAP( Hybrid transaction/analytical processing) 是一個(gè)數(shù)據(jù)庫的超融合方案,把事務(wù)處理和分析處理都集中在一個(gè)系統(tǒng)中對(duì)外提供服務(wù)。目前這也是 OLTP 方向的數(shù)據(jù)庫在追求的一個(gè)重要方向。

目前國(guó)內(nèi)實(shí)現(xiàn) HTAP 數(shù)據(jù)庫有:

TiDB

OceanBase

PolarDB (阿里)

TDSQL-H ( 騰訊)

BaikalDB (百度)

海外實(shí)現(xiàn) HTAP 數(shù)據(jù)庫有:

MySQL + Heatwave

Snowflake

SingleStore( 前身 MemSQL)

AlloyDB( Google)

Aurora + Redshift

可以說一時(shí)間大家把是否支持 HTAP 作為數(shù)據(jù)庫對(duì)比的一個(gè)重要指標(biāo),更夸張的一個(gè)論調(diào)說:HTAP 是 MySQL 生態(tài)的最佳歸宿。實(shí)質(zhì)上這里有一個(gè)前提在 10TB 以下 HTAP 感覺可以一戰(zhàn),再大一點(diǎn) HTAP 的方案的成本不是一般用能扛住。以至于很多用戶產(chǎn)品演示時(shí)上最貴的 HTAP 過關(guān)再說,交付時(shí)可能掛一個(gè)PostgreSQL 也能滿足客戶實(shí)際場(chǎng)景也不少, 同時(shí)今年可能是因?yàn)樾星椴缓?,遇到挺多?00-400臺(tái) HTAP 集群,數(shù)據(jù)量在 500T 左右的用戶抱怨復(fù)雜 SQL 影響整體集群處理能力,也不太敢擴(kuò)容,把數(shù)據(jù)定期歸檔到 Databend ,利用 Databend + 對(duì)象存儲(chǔ)對(duì)外分擔(dān)一部分的查詢分析,從而降低成本。

那么 HTAP 是不是未來?

我覺得是的。用戶最終賺錢的是業(yè)務(wù),讓業(yè)務(wù)可以更加簡(jiǎn)單的可以在數(shù)據(jù)庫上運(yùn)行起來,把 OLTP 和 OLAP 包裝起來對(duì)用戶透明,絕對(duì)是一個(gè)非常硬的需求,這估計(jì)也是 Snowflake 今年增長(zhǎng)特別快的原因之一吧。

但 HTAP 也有他的局限性,價(jià)格太貴。通常在云環(huán)境中,我們認(rèn)為計(jì)算和網(wǎng)絡(luò)是最貴的,但在 HTAP 數(shù)據(jù)庫系統(tǒng)中,當(dāng)存儲(chǔ)增長(zhǎng)到一定量時(shí),你會(huì)發(fā)現(xiàn)好像計(jì)算和網(wǎng)絡(luò)又是最便宜的,但這些相對(duì)于對(duì)象存儲(chǔ) 1T 一個(gè)月只要 110元(國(guó)內(nèi)更便宜)無法相比,這也是我個(gè)人感覺 HTAP 適合中小型項(xiàng)目快速 Startup 讓業(yè)務(wù)賺到錢生存下來,再說利用云原生數(shù)據(jù)庫相關(guān)技術(shù)把成本和運(yùn)維降下來。

Q4. MySQL DBA 和大數(shù)據(jù)從業(yè)者會(huì)有什么改變?

這個(gè)時(shí)代一切都在變, 我剛工作那會(huì)能把 LAMP + Squid 順利 40 分鐘內(nèi)安裝完畢入職 Sina 都沒啥問題了,再早一點(diǎn)幫別人安裝一個(gè) Oracle RAC 一晚上賺個(gè) IBM T40 也沒啥問題,再后來 Oracle OCP 失業(yè)了, MySQL 時(shí)代來了, 大數(shù)據(jù)時(shí)代來了,AI 時(shí)時(shí)代來了,一浪接一浪,總有拍死在沙灘上的,當(dāng)然也有乘風(fēng)破浪的弄潮兒,其實(shí)在這些 IT 大浪中,你能抓住一浪基本生活無優(yōu),早期 BAT 的朋友不知道是不是有錢,還看到他們天天加班,但都住著千萬以上的房子,開最騷氣的車。我說這些想表達(dá)什么呢?我想說:選擇比努力更重要

MySQL DBA 和大數(shù)據(jù)從業(yè)者從業(yè)者會(huì)有什么挑戰(zhàn)呢?

首先我們說一下 MySQL DBA 面臨什么挑戰(zhàn)?

MySQL 方面的技術(shù),現(xiàn)在非常成熟,合理的使用基本可以做到按年計(jì)算不停機(jī)

使用 MySQL 低級(jí)錯(cuò)誤越來越少,例如早期做 SQL 注入攻擊和檢測(cè)的,基本不存在了

MySQL 在現(xiàn)在開發(fā)架構(gòu)中已經(jīng)融入 Serverless , 離服務(wù)越來越近

更多的用戶選擇了使用云上 RDS 開局, 傳統(tǒng)的 DBA 事情越來越少

研究 MySQL 內(nèi)核上手的人也越來越多

現(xiàn)在有利于 MySQL DBA 的點(diǎn):

國(guó)內(nèi)化乙方需要一大波交付的 DBA, 基本大家都招聘 MySQL DBA 為主

k8s + MySQL 的融合需要更多面向 IaC 方面的 DBA

有較強(qiáng)業(yè)務(wù)能力的 MySQL DBA 會(huì)有越來越多的機(jī)會(huì)

其實(shí)早期各個(gè)云 RDS 出現(xiàn)后, DBA 圈子里就有一種聲音:云平臺(tái)的 RDS 可能把 MySQL DBA 干掉, RDS 平臺(tái)的人員還各種掩飾這個(gè)問題,現(xiàn)在看來是真正發(fā)生了 :) 其實(shí)這個(gè)也可是可以預(yù)見的,一個(gè)云平臺(tái) RDS 開發(fā)通常在百人以上的規(guī)模,把 DBA 能想到事情,基本都可以自動(dòng)化實(shí)現(xiàn)了。

再來說一下面向大數(shù)據(jù)人員面臨的挑戰(zhàn):

現(xiàn)在來看 Hadoop 生態(tài),基本要成為歷史,笨重的 Mapreduce 編程終會(huì)被 SQL 替代

傳統(tǒng)的復(fù)雜的大數(shù)據(jù)會(huì)趨向越來越簡(jiǎn)單化,以前看大數(shù)據(jù)架構(gòu)中,很多公司在重度依賴 kafka, 存儲(chǔ)可能 40 臺(tái), 中間的 Kafka + 數(shù)據(jù)洗清機(jī)器可能是 80-100 臺(tái)

大數(shù)據(jù)架構(gòu)師決定把數(shù)據(jù)存儲(chǔ)幾種數(shù)據(jù)庫,大數(shù)據(jù)工程師每天就在應(yīng)對(duì)數(shù)據(jù)的清洗和不同數(shù)據(jù)源中數(shù)據(jù)一致性的比對(duì)

業(yè)務(wù)產(chǎn)出不明顯,但部門成本比較高,更多是面抽報(bào)表,ad-hoc 查詢生活

中心化團(tuán)隊(duì),容易成為瓶頸,整天奔跑在救火線上的工作模式

現(xiàn)在利用于 大數(shù)據(jù)從業(yè) 人員的點(diǎn):

內(nèi)心對(duì)數(shù)據(jù)質(zhì)量有一定的敏感

理解不同數(shù)據(jù)的使用習(xí)慣和資源的空閑

經(jīng)歷過大數(shù)據(jù)業(yè)務(wù)系統(tǒng)的磨礪(建立在對(duì)業(yè)務(wù)有理解的基礎(chǔ)上)

大數(shù)據(jù)平臺(tái)原來那波 Hadoop 生態(tài)的的現(xiàn)在可能是 Hive, Hbase, HDFS 為主,HDFS 的成功,也讓很多做對(duì)象存儲(chǔ)創(chuàng)業(yè)較為成功,例如 xsky 對(duì)象存儲(chǔ),在互聯(lián)網(wǎng)和傳統(tǒng)企業(yè)都占據(jù)了半壁江山。但 Hive 現(xiàn)在也在被很多產(chǎn)品所替代,如;Doris, Clickhouse, Presto, Trino, Impala, 還有國(guó)內(nèi)很多基于 Greenplum 的二開產(chǎn)品,也有新生代云原生數(shù)倉:Databend 都在看著這塊市場(chǎng)。

那么 MySQL DBA 和大數(shù)據(jù)從業(yè)人員未來在哪里?

MySQL DBA 如果不轉(zhuǎn)型現(xiàn)在最好的歸宿乙方數(shù)據(jù)庫公司,如果能跟上節(jié)奏抓著 MySQL + k8s 或是 熟悉 Terraform , SQL 自動(dòng)審核類工具,了解 CI 還可以在互聯(lián)網(wǎng)企業(yè)一戰(zhàn)(DevOPS 運(yùn)維時(shí)代真的來了,運(yùn)維代碼化,避免了面?zhèn)骺谑?,無法追錄過程的運(yùn)維時(shí)代), 其實(shí)也給了互聯(lián)網(wǎng) DBA 一個(gè)更大的想象空間,例如利用云輕松實(shí)現(xiàn)多 IDC 多中心設(shè)計(jì),利用 metabase 輕松實(shí)現(xiàn)一個(gè) CMDB + 數(shù)據(jù)控查詢系統(tǒng),利用 terraform 輕松把基礎(chǔ)資源管理起來。

大數(shù)據(jù)人員現(xiàn)在分為兩類,一個(gè)報(bào)表展現(xiàn)人員,另一個(gè)數(shù)據(jù)整理人員,比較危險(xiǎn)的是數(shù)據(jù)整理人員,對(duì)于 Databend 這類云原生數(shù)倉( Snowflake 開源實(shí)現(xiàn))中很多理念如果落地,會(huì)大大簡(jiǎn)化大數(shù)據(jù)方面人力和資產(chǎn)的投入,把大數(shù)據(jù)走向一個(gè) case by case 模式,同時(shí)又較方便的實(shí)現(xiàn)各部門數(shù)據(jù)的共享,互惠。大數(shù)據(jù)數(shù)據(jù)人員最終會(huì)變成數(shù)據(jù)質(zhì)量,數(shù)據(jù)血緣方面的專家。

161a2574-902a-11ed-bfe3-dac502259ad0.png

Q5. 現(xiàn)在還是不是數(shù)據(jù)方向的創(chuàng)業(yè)好的時(shí)機(jī)?

對(duì)于數(shù)據(jù)庫創(chuàng)業(yè)來講,我覺得今年可能不是一個(gè)好時(shí)間,但市場(chǎng)也不缺乏好機(jī)會(huì)。為什么說現(xiàn)在不是一個(gè)好時(shí)間呢?2021年資本差不多已經(jīng)完成了數(shù)據(jù)軟件的布局,很多公司甚至也是高估值拿到了融資,這個(gè)過程中也不乏一些摸魚創(chuàng)業(yè)者,其實(shí)資本也都不傻,都會(huì)看明白的。我們知道對(duì)于基礎(chǔ)架構(gòu)創(chuàng)業(yè)比較漫長(zhǎng),看海外的產(chǎn)品 10 年都屬于正常現(xiàn)象, 第一個(gè) 3 年能完成產(chǎn)品開發(fā)+打磨迭代到成熟, 然后就是3-4年的生態(tài)建設(shè),接下來 3 年才是商業(yè)收獲的過程,這個(gè)過程也可以說是漫長(zhǎng)的,對(duì)資本來講是一個(gè)收獲比較慢的過程。數(shù)據(jù)庫融資方面感覺在 2021 年 10 月份以后,資本忽然集體冷靜下來了。2022 年也可以說是市場(chǎng)最不景氣的一年,但也不要泄氣,看美國(guó)成名的數(shù)據(jù)庫公司也都是在經(jīng)濟(jì)危機(jī)時(shí)間創(chuàng)建的,經(jīng)濟(jì)危機(jī)時(shí)不知道做什么,就節(jié)衣縮食,專心做個(gè)數(shù)據(jù)庫吧。

但我們需要明白中國(guó)的數(shù)據(jù)庫市場(chǎng)相對(duì)還是比較低,據(jù) 2021 年的市場(chǎng)評(píng)估,全球數(shù)據(jù)庫市場(chǎng) 700 億美元, 中國(guó)市場(chǎng)只有 47 億美元,僅占 5.2%。這以至于 2022 年大部數(shù)據(jù)庫公司也在忙著社區(qū)建設(shè),更多的希望通過開源帶動(dòng)商業(yè)發(fā)展,以至于現(xiàn)在給我的感覺是全球基礎(chǔ)架構(gòu)開源看中國(guó)。

國(guó)內(nèi)數(shù)據(jù)庫市場(chǎng)是面對(duì)大額采購時(shí),各大公司的 CTO, CIO 可能至少面對(duì) 10 家以上(現(xiàn)在數(shù)據(jù)庫估計(jì)在 400 家以上) 的數(shù)據(jù)庫公司在清洗, 大公司的 CTO, CIO 也都是經(jīng)過市場(chǎng)考驗(yàn)的戰(zhàn)士,他們也是冷靜的決策者,以至于決策過程也變得更加的長(zhǎng)。

那么現(xiàn)在還是不是數(shù)據(jù)庫公司的創(chuàng)建的好機(jī)會(huì),我覺得市場(chǎng)在這個(gè)冷靜期,以及 2022 年資本市場(chǎng)環(huán)境不好, 2023 年估計(jì)會(huì)有不少數(shù)據(jù)創(chuàng)業(yè)公司離場(chǎng),但隨著達(dá)夢(mèng) IPO 成功,我估計(jì)還會(huì)讓資本有點(diǎn)小小的沖動(dòng)。另一個(gè)實(shí)際情況是 MariaDB 借殼上市直接到現(xiàn)在跌了差不多 70% + 。

1633d1c2-902a-11ed-bfe3-dac502259ad0.jpg

那對(duì)于想進(jìn)入數(shù)據(jù)庫創(chuàng)業(yè)者的機(jī)會(huì)是什么樣呢?

和我交流過數(shù)據(jù)創(chuàng)業(yè)的人,我通常給的建議是:求差異,利他人,共建生態(tài),這三點(diǎn)來謀發(fā)展。2022 年在做 DTCC 規(guī)劃過程中,我給唐川講今年也可以搞一個(gè)開源秀,讓在 DTCC 參考的嘉賓及公司或是想創(chuàng)業(yè)的伙伴有更多的爆光機(jī)會(huì),最后經(jīng)過幾輪討論后,很快就把開源小秀場(chǎng)落地,我看現(xiàn)在已經(jīng)進(jìn)行了 7 期。這個(gè)大家可以想想這個(gè)欄目為什么能做起來。我在 2022 年遇到同行問的最多一句話是有沒有質(zhì)量高一點(diǎn)的 meetup 推薦~~~, 甚至有的公司已經(jīng)開始各種地方碰瓷宣傳。實(shí)質(zhì)上你會(huì)發(fā)現(xiàn)海外真正牛 X 的產(chǎn)品對(duì)中國(guó)都是禁售的,中國(guó)的 IP 不能注冊(cè),中國(guó)的信用卡不支付,所以自家就不用碰了,真正做事,可以研究一下海外的產(chǎn)品吧, 一個(gè)月 3000-4000 元的基本成本投入就可以把一個(gè)基礎(chǔ)的數(shù)倉項(xiàng)目運(yùn)營(yíng)起來,這個(gè)放到現(xiàn)在國(guó)內(nèi)的所有的數(shù)倉項(xiàng)目中都是無法實(shí)現(xiàn)的,真的是創(chuàng)業(yè)是我輩當(dāng)自強(qiáng)。

現(xiàn)在看來單純創(chuàng)業(yè)上來講, 做現(xiàn)有數(shù)據(jù)庫的改善或是增強(qiáng),甚至是數(shù)據(jù)生庫的服務(wù)都比從 0 開始做一個(gè)數(shù)據(jù)庫比較安全。這塊在 Rust 生態(tài)有一些不錯(cuò)的參考,如:

readyset 用于提升現(xiàn)有數(shù)據(jù)庫的性能和可用性,支持 MySQL, PostgreSQL , 看到這個(gè)項(xiàng)目時(shí),也讓我想起了內(nèi)心一直在規(guī)劃的 update server , 看看別人已經(jīng)實(shí)現(xiàn)了。

Polars 輕量級(jí) DataFrame , 這塊今年美團(tuán)基于 Databend 社區(qū)的 databend-meta 也搞了一個(gè)類似的工具,感覺也是挺贊的,這塊也是 Databend 2023 的規(guī)劃之一。

我覺得這些是有絕對(duì)的生命力,也是對(duì)社區(qū)和業(yè)務(wù)是有絕對(duì)幫助的。如果你一定要在這個(gè)方面創(chuàng)業(yè),你也可以考慮這些方向,例如我現(xiàn)在也比較看好的

Tapdata 實(shí)時(shí)數(shù)據(jù)同步工具,有點(diǎn)把 Oracle 的 Golden Gate SAAS 化的感覺

sqlpad[3] 網(wǎng)頁版本的 SQL 編輯器

類似于 metabase 的商業(yè)化支持:衡石科技(可能已經(jīng)比 metabase 強(qiáng)大了)

另外如果對(duì)數(shù)據(jù)庫方面創(chuàng)業(yè)有較強(qiáng)的執(zhí)念,可以先想清楚定位,不能只把生意定位在國(guó)內(nèi)還是海外,一定要想清楚做這個(gè)事情究竟可以給社會(huì)創(chuàng)造什么價(jià)值,這才是真正存活的下來的根本。創(chuàng)業(yè)的本質(zhì)就是:忍人之所不能忍,能為人之所不能為。創(chuàng)業(yè)沒有最好的時(shí)間,也沒有最差的時(shí)間,這只是一種生活的方式,如果你想這一生要做點(diǎn)什么才無悔,就加入進(jìn)來吧。數(shù)據(jù)市場(chǎng)上還有多事情可以一起合作,共建這個(gè)生態(tài)。Dongxu 也是這個(gè)方向比較好的天使投資人,如果你想好了就加入進(jìn)來吧。2023 年一起攜手共進(jìn)。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SQL
    SQL
    +關(guān)注

    關(guān)注

    1

    文章

    783

    瀏覽量

    45163
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    3927

    瀏覽量

    66262
  • 編輯器
    +關(guān)注

    關(guān)注

    1

    文章

    822

    瀏覽量

    32046

原文標(biāo)題:2022 年數(shù)據(jù)庫發(fā)展總結(jié)

文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    三款主流國(guó)產(chǎn)數(shù)據(jù)庫的技術(shù)特點(diǎn)

    隨著數(shù)字經(jīng)濟(jì)的快速發(fā)展數(shù)據(jù)安全要求的提升,國(guó)產(chǎn)數(shù)據(jù)庫正迎來前所未有的發(fā)展機(jī)遇。在信創(chuàng)浪潮推動(dòng)下,達(dá)夢(mèng)數(shù)據(jù)庫、TiDB、華為高斯
    的頭像 發(fā)表于 07-14 11:08 ?138次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—MongoDB數(shù)據(jù)庫文件丟失的數(shù)據(jù)恢復(fù)案例

    MongoDB數(shù)據(jù)庫數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)操作系統(tǒng)為Windows Server的虛擬機(jī)上部署MongoDB數(shù)據(jù)庫。 MongoDB數(shù)據(jù)庫故障: 工作人員在MongoDB服務(wù)仍
    的頭像 發(fā)表于 07-01 11:13 ?161次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—MongoDB<b class='flag-5'>數(shù)據(jù)庫</b>文件丟失的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫被加密如何恢復(fù)數(shù)據(jù)?

    SQL Server數(shù)據(jù)庫故障: SQL Server數(shù)據(jù)庫被加密,無法使用。 數(shù)據(jù)庫MDF、LDF、log日志文件名字被篡改。
    的頭像 發(fā)表于 06-25 13:54 ?145次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server<b class='flag-5'>數(shù)據(jù)庫</b>被加密如何恢復(fù)<b class='flag-5'>數(shù)據(jù)</b>?

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)——MongoDB數(shù)據(jù)庫文件拷貝后服務(wù)無法啟動(dòng)的數(shù)據(jù)恢復(fù)

    MongoDB數(shù)據(jù)庫數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)Windows Server操作系統(tǒng)虛擬機(jī)上部署MongoDB數(shù)據(jù)庫。 MongoDB數(shù)據(jù)庫故障: 管理員在未關(guān)閉MongoDB服務(wù)的
    的頭像 發(fā)表于 04-09 11:34 ?306次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)——MongoDB<b class='flag-5'>數(shù)據(jù)庫</b>文件拷貝后服務(wù)無法啟動(dòng)的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server附加數(shù)據(jù)庫提示“錯(cuò)誤 823”的數(shù)據(jù)恢復(fù)案例

    SQL Server數(shù)據(jù)庫附加數(shù)據(jù)庫過程中比較常見的報(bào)錯(cuò)是“錯(cuò)誤 823”,附加數(shù)據(jù)庫失敗。 如果數(shù)據(jù)庫有備份則只需還原備份即可。但是如果沒有備份,備份時(shí)間太久,或者其他原因?qū)е聜浞?/div>
    的頭像 發(fā)表于 02-28 11:38 ?485次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server附加<b class='flag-5'>數(shù)據(jù)庫</b>提示“錯(cuò)誤 823”的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    分布式云化數(shù)據(jù)庫有哪些類型

    分布式云化數(shù)據(jù)庫有哪些類型?分布式云化數(shù)據(jù)庫主要類型包括:關(guān)系型分布式數(shù)據(jù)庫、非關(guān)系型分布式數(shù)據(jù)庫、新SQL分布式數(shù)據(jù)庫、以列方式存儲(chǔ)
    的頭像 發(fā)表于 01-15 09:43 ?487次閱讀

    MySQL數(shù)據(jù)庫的安裝

    MySQL數(shù)據(jù)庫的安裝 【一】各種數(shù)據(jù)庫的端口 MySQL :3306 Redis :6379 MongoDB :27017 Django :8000 flask :5000 【二】MySQL 介紹
    的頭像 發(fā)表于 01-14 11:25 ?565次閱讀
    MySQL<b class='flag-5'>數(shù)據(jù)庫</b>的安裝

    數(shù)據(jù)庫是哪種數(shù)據(jù)庫類型?

    數(shù)據(jù)庫是一種部署在虛擬計(jì)算環(huán)境中的數(shù)據(jù)庫,它融合了云計(jì)算的彈性和可擴(kuò)展性,為用戶提供高效、靈活的數(shù)據(jù)庫服務(wù)。云數(shù)據(jù)庫主要分為兩大類:關(guān)系型數(shù)據(jù)庫
    的頭像 發(fā)表于 01-07 10:22 ?513次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—Mysql數(shù)據(jù)庫表記錄丟失的數(shù)據(jù)恢復(fù)流程

    Mysql數(shù)據(jù)庫故障: Mysql數(shù)據(jù)庫表記錄丟失。 Mysql數(shù)據(jù)庫故障表現(xiàn): 1、Mysql數(shù)據(jù)庫表中無任何數(shù)據(jù)或只有部分
    的頭像 發(fā)表于 12-16 11:05 ?617次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—Mysql<b class='flag-5'>數(shù)據(jù)庫</b>表記錄丟失的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)流程

    數(shù)據(jù)庫事件觸發(fā)的設(shè)置和應(yīng)用

    數(shù)據(jù)庫無論對(duì)于生產(chǎn)管理還是很多的實(shí)際應(yīng)用都非常重要。小編這次聊一下數(shù)據(jù)庫事件觸發(fā)的應(yīng)用。示例使用了postgresql和Python。
    的頭像 發(fā)表于 12-13 15:14 ?643次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—MYSQL數(shù)據(jù)庫ibdata1文件損壞的數(shù)據(jù)恢復(fù)案例

    mysql數(shù)據(jù)庫故障: mysql數(shù)據(jù)庫文件ibdata1、MYI、MYD損壞。 故障表現(xiàn):1、數(shù)據(jù)庫無法進(jìn)行查詢等操作;2、使用mysqlcheck和myisamchk無法修復(fù)數(shù)據(jù)庫
    的頭像 發(fā)表于 12-09 11:05 ?635次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—通過拼接數(shù)據(jù)庫碎片恢復(fù)SQLserver數(shù)據(jù)庫

    一個(gè)運(yùn)行在存儲(chǔ)上的SQLServer數(shù)據(jù)庫,有1000多個(gè)文件,大小幾十TB。數(shù)據(jù)庫每10天生成一個(gè)NDF文件,每個(gè)NDF幾百GB大小。數(shù)據(jù)庫包含兩個(gè)LDF文件。 存儲(chǔ)損壞,數(shù)據(jù)庫
    的頭像 發(fā)表于 10-31 13:21 ?700次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—通過拼接<b class='flag-5'>數(shù)據(jù)庫</b>碎片恢復(fù)SQLserver<b class='flag-5'>數(shù)據(jù)庫</b>

    Oracle數(shù)據(jù)恢復(fù)—異常斷電后Oracle數(shù)據(jù)庫報(bào)錯(cuò)的數(shù)據(jù)恢復(fù)案例

    Oracle數(shù)據(jù)庫故障: 機(jī)房異常斷電后,Oracle數(shù)據(jù)庫報(bào)錯(cuò):“system01.dbf需要更多的恢復(fù)來保持一致性,數(shù)據(jù)庫無法打開”。數(shù)據(jù)
    的頭像 發(fā)表于 09-30 13:31 ?742次閱讀
    Oracle<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—異常斷電后Oracle<b class='flag-5'>數(shù)據(jù)庫</b>啟<b class='flag-5'>庫</b>報(bào)錯(cuò)的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    架構(gòu)師日記-從數(shù)據(jù)庫發(fā)展歷程到數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)探析

    數(shù)據(jù)庫發(fā)展史 起初,數(shù)據(jù)的管理方式是文件系統(tǒng),數(shù)據(jù)存儲(chǔ)在文件中,數(shù)據(jù)管理和維護(hù)都由程序員完成。后來發(fā)
    的頭像 發(fā)表于 09-25 11:20 ?1166次閱讀
    架構(gòu)師日記-從<b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>發(fā)展</b>歷程到<b class='flag-5'>數(shù)據(jù)</b>結(jié)構(gòu)設(shè)計(jì)探析

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫出現(xiàn)823錯(cuò)誤的數(shù)據(jù)恢復(fù)案例

    SQL Server數(shù)據(jù)庫故障: SQL Server附加數(shù)據(jù)庫出現(xiàn)錯(cuò)誤823,附加數(shù)據(jù)庫失敗。數(shù)據(jù)庫沒有備份,無法通過備份恢復(fù)數(shù)據(jù)庫。
    的頭像 發(fā)表于 09-20 11:46 ?706次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server<b class='flag-5'>數(shù)據(jù)庫</b>出現(xiàn)823錯(cuò)誤的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例