創(chuàng)鄰要提著探照燈,而不是看著后視鏡前進(jìn),用硬核科技開(kāi)拓認(rèn)知智能的時(shí)代。
——?jiǎng)?chuàng)鄰科技 張晨
“想象一下,這間會(huì)議室攤滿了幾百份文件,如果你想在一毫秒內(nèi),找到其中和我有關(guān)的全部信息,如何實(shí)現(xiàn)?”
談到圖數(shù)據(jù)庫(kù),張晨眼里有光??菰锏募夹g(shù)概念,一經(jīng)他口,就成了生動(dòng)的例子:“假設(shè)在空間內(nèi)造一個(gè)水晶球,用水晶線連接球體和文件中與我相關(guān)的信息,將它存儲(chǔ)下來(lái)。當(dāng)你牽動(dòng)水晶球,可以得到各個(gè)文件中關(guān)于我的數(shù)據(jù)。圖數(shù)據(jù)庫(kù)就是這個(gè)水晶球,圍繞一個(gè)主體,關(guān)聯(lián)著海量信息,改變了數(shù)據(jù)之間關(guān)聯(lián)的方式?!?/p>
牽動(dòng)“張晨”的這顆水晶球,見(jiàn)證了一條從科學(xué)家到創(chuàng)業(yè)者的轉(zhuǎn)型之路。在加拿大滑鐵盧大學(xué)獲得計(jì)算機(jī)科學(xué)博士學(xué)位后,張晨先是在麥吉爾大學(xué)做博士后,之后擔(dān)任了美國(guó)運(yùn)通大數(shù)據(jù)科學(xué)家、Splice Machine軟件架構(gòu)師,并在加拿大創(chuàng)立底層數(shù)據(jù)庫(kù)公司Graph Intelligence Inc。2015年,張晨來(lái)到杭州,成立創(chuàng)鄰科技(以下簡(jiǎn)稱創(chuàng)鄰),打造自主可控的圖數(shù)據(jù)庫(kù)產(chǎn)品。
創(chuàng)鄰取自英文create link,寓意“創(chuàng)造連接”。張晨認(rèn)為,通過(guò)建立連接讓孤立的數(shù)據(jù)形成完整、全面的知識(shí)結(jié)構(gòu)體,賦能用戶去洞察、創(chuàng)新,是圖技術(shù)存在的本質(zhì)價(jià)值和意義。
“就像《黑客帝國(guó)》最后一幕,世界會(huì)變?yōu)榫W(wǎng)狀,日益發(fā)展的數(shù)字化生活中,圖數(shù)據(jù)庫(kù)會(huì)成為表達(dá)網(wǎng)絡(luò)世界更直白的方式。我堅(jiān)信圖技術(shù)是未來(lái)數(shù)據(jù)管理中不可或缺的模塊,是數(shù)字化企業(yè)創(chuàng)新的引擎?!?/p>
當(dāng)時(shí)我還不知道“圖數(shù)據(jù)庫(kù)”,想找到讓數(shù)據(jù)高效聯(lián)通的技術(shù)
章豐:圖數(shù)據(jù)庫(kù)是個(gè)新物種,用普羅大眾都能理解的語(yǔ)言,先做個(gè)科普?
張晨:世界是廣泛關(guān)聯(lián)的,我們的數(shù)字生活到處充滿著網(wǎng)絡(luò),社交網(wǎng)絡(luò)、供應(yīng)鏈網(wǎng)絡(luò)、交通網(wǎng)絡(luò)、藥品網(wǎng)絡(luò)……比如,你要買一張拼旅程的機(jī)票,如何規(guī)劃路線,進(jìn)行全局優(yōu)化;疫情導(dǎo)致某個(gè)城市交通中斷,物流路線如何調(diào)整,降低運(yùn)輸成本?生活中充滿了網(wǎng)絡(luò)結(jié)構(gòu),人們?nèi)沼枚恢?/p>
圖數(shù)據(jù)庫(kù)中的“圖”,是將客觀世界的人、事、物抽象成“點(diǎn)”,將他們之間的關(guān)系抽象成“邊”。任何可以用關(guān)系定義的客觀事物,都可以用圖模型有效表達(dá)。
「圖數(shù)據(jù)庫(kù)」釋義
總的來(lái)說(shuō),圖數(shù)據(jù)庫(kù)的價(jià)值和意義,就是通過(guò)建立連接,讓孤立的數(shù)據(jù)形成完整、全面的知識(shí)結(jié)構(gòu)。
章豐:你是怎么和圖數(shù)據(jù)庫(kù)結(jié)緣的?
張晨:我讀博期間的研究主要基于Hadoop(分布式系統(tǒng)基礎(chǔ)架構(gòu)),參加工作后,我接到一通電話,對(duì)方說(shuō)讓我延續(xù)夢(mèng)想,我還以為是騙子。其實(shí)是我的博士論文成果被硅谷一家公司產(chǎn)品化,成了他們的核心底層技術(shù)。我也進(jìn)入那家公司,研究分布式數(shù)據(jù)庫(kù)。在服務(wù)大型企業(yè)客戶的過(guò)程中,我發(fā)現(xiàn)業(yè)務(wù)中開(kāi)始出現(xiàn)二三十個(gè)多表關(guān)聯(lián)的需求,需要做海量的數(shù)據(jù)大規(guī)模關(guān)聯(lián)查詢,很難用現(xiàn)有的數(shù)據(jù)庫(kù)技術(shù)解決。
所以我認(rèn)為,世界會(huì)從0101的狀態(tài),變成萬(wàn)物互聯(lián);市場(chǎng)上,大客戶有了更復(fù)雜的數(shù)據(jù)關(guān)聯(lián)需求;專業(yè)上,我做的是分布式計(jì)算,“老婆同學(xué)”(指張晨的妻子吳菁,創(chuàng)鄰科技COO)做的是大規(guī)模社交網(wǎng)絡(luò)分析,這就是我們?cè)摳傻氖隆?/p>
當(dāng)時(shí)我還不知道“圖數(shù)據(jù)庫(kù)”,只是抱著簡(jiǎn)單的初心,想用一種可以高效聯(lián)通數(shù)據(jù)的技術(shù),賦能各行各業(yè),釋放數(shù)據(jù)資產(chǎn)的價(jià)值。
章豐:你們已經(jīng)在加拿大創(chuàng)業(yè)了,2015年又回到了國(guó)內(nèi),是出于什么考慮?
張晨:中國(guó)有巨大的人口基數(shù)和成熟的數(shù)字化基礎(chǔ),具備產(chǎn)生海量數(shù)據(jù)、催生上層技術(shù)和應(yīng)用的基本條件。做數(shù)據(jù)關(guān)聯(lián)、創(chuàng)造數(shù)據(jù)連接價(jià)值,中國(guó)會(huì)是全球最好的市場(chǎng),沒(méi)有之一。投入基礎(chǔ)軟件研究,現(xiàn)在正當(dāng)時(shí)。
2015年底,我回國(guó)參加浙大竺可楨學(xué)院的校友會(huì),在杭創(chuàng)業(yè)的師兄告訴我,國(guó)內(nèi)有豐富的數(shù)據(jù)關(guān)聯(lián)場(chǎng)景,政府對(duì)人才項(xiàng)目的支持力度很大。杭州有我的母校浙江大學(xué),有我的同學(xué)圈、朋友圈,還有高科技產(chǎn)業(yè)的集聚效應(yīng),所以我們帶著在國(guó)外的技術(shù)積累和商業(yè)思考,回到了杭州。
業(yè)務(wù)呈網(wǎng)狀結(jié)構(gòu)的領(lǐng)域,都能發(fā)揮圖數(shù)據(jù)庫(kù)的優(yōu)勢(shì)
章豐:相比常用的關(guān)系型數(shù)據(jù)庫(kù),圖數(shù)據(jù)庫(kù)有什么特點(diǎn)?
張晨:關(guān)系型數(shù)據(jù)庫(kù)以行、列為基礎(chǔ)存儲(chǔ)單元,類似Excel表格。圖數(shù)據(jù)庫(kù)以點(diǎn)、邊為基礎(chǔ)存儲(chǔ)單元,是網(wǎng)狀結(jié)構(gòu)。關(guān)系型數(shù)據(jù)庫(kù)解決的問(wèn)題是如何有效的管理數(shù)據(jù),圖數(shù)據(jù)解決的問(wèn)題是如何有效的管理數(shù)據(jù)間的關(guān)系,從而釋放挖掘數(shù)據(jù)的最大價(jià)值。
比如,在生鮮App場(chǎng)景中,運(yùn)營(yíng)人員需要深入挖掘某省女性用戶的畫(huà)像,了解她們最愛(ài)購(gòu)買的水果、酒類和甜品,引導(dǎo)促銷活動(dòng)。這些數(shù)據(jù)在關(guān)系型數(shù)據(jù)庫(kù)中表現(xiàn)為用戶、訂單、訂單詳情、產(chǎn)品四張表格,哪怕每次只查詢一個(gè)關(guān)聯(lián)數(shù)據(jù),都需要逐行掃描表中所有記錄。
圖數(shù)據(jù)庫(kù)模型中,省份、用戶、訂單等以節(jié)點(diǎn)存儲(chǔ),并通過(guò)位于、訂購(gòu)、包含等關(guān)系連接。做關(guān)聯(lián)查詢時(shí),圖數(shù)據(jù)庫(kù)只需查詢指定實(shí)體,比如某一省份,就能實(shí)現(xiàn)關(guān)聯(lián)查詢,了解該省用戶、訂單等,查詢成本與全局?jǐn)?shù)據(jù)量無(wú)關(guān)。
生鮮App場(chǎng)景示例
所以,在關(guān)聯(lián)查詢的效率上,圖數(shù)據(jù)庫(kù)比關(guān)系型數(shù)據(jù)庫(kù)提升了千倍以上;同時(shí),圖模型表達(dá)關(guān)系也更靈活,一目了然。
章豐:圖數(shù)據(jù)庫(kù)在關(guān)聯(lián)和檢索效率上占優(yōu)勢(shì),但不能替代關(guān)系型數(shù)據(jù)庫(kù)?
張晨:兩者是互補(bǔ)關(guān)系。關(guān)系型數(shù)據(jù)庫(kù)仍然有其存儲(chǔ)的優(yōu)勢(shì),針對(duì)具體的業(yè)務(wù)場(chǎng)景,可以有不同的選擇。一些傳統(tǒng)企業(yè)數(shù)據(jù)存儲(chǔ)需求小,只使用圖數(shù)據(jù)庫(kù)可以滿足,節(jié)約成本。
“浙商從來(lái)不怕挑戰(zhàn)。浙商要繼續(xù)敢闖敢拼,這才是永恒的浙商?!薄ぁぁ?/p>
黨的二十屆三中全會(huì)擘畫(huà)了以進(jìn)一步全面深化改革推進(jìn)中國(guó)式現(xiàn)代化···