編者按:在AI for Science的熱潮中,多數公司熱衷于用模型加速單一研發(fā)環(huán)節(jié),而深勢科技選擇了更艱難的路線:重構科學發(fā)現的基礎設施。在這條賽道上,它自創(chuàng)立之初便跳出單點突破的局限,以“搭建科研基礎設施”為核心目標,打通“讀、算、做、智”全科研鏈條。從DeePMD方法斬獲戈登·貝爾獎,到復現AlphaFold 2訓練體系,從Hermite藥物設計平臺到玻爾·躍遷實驗室,這家中國創(chuàng)業(yè)公司始終兼顧技術創(chuàng)新與商業(yè)化落地,試圖成為微觀世界里的達索系統(tǒng)。當“AI科學家”成為行業(yè)新愿景,深勢科技希望成為助力“人類最后一項生產工作”的平臺公司,本文詳細拆解其發(fā)展路徑與核心布局,展現中國AI for Science企業(yè)的長期主義與創(chuàng)新力量,啟明創(chuàng)投微信公眾號經授權轉載。

在AI for Science(AI4S)的敘事里,最容易被講述的,往往是那些耀眼的單點突破:一個更強的模型,一次更快的預測,一項足夠震撼的學術成果。
而一家來自中國的創(chuàng)業(yè)公司——深勢科技卻有著更大的野心。成立于大模型浪潮爆發(fā)之前,深勢科技是最早押注AI for Science商業(yè)化潛力的團隊之一。它并沒有把自己押注在一條藥物管線、一個材料體系,甚至一個明星模型上,它在堅持一件更重要也更慢的事情:把原本分散在文獻、計算、實驗和專家經驗里的科研流程,重新組織成一套可持續(xù)迭代的基礎設施。
深勢科技選擇做一家平臺公司,這既有商業(yè)邏輯,也包含了價值判斷,因為他們認為在科學發(fā)現這件事上,平臺路線將比單點突破更接近長期價值?!拔覀兙嚯xAI科學家到底有多遠?”這家中國領先的AI for Science公司正在用自己的實踐回答這個問題。
01/
一篇論文與一個判斷
深勢科技的起點是論文,但真正決定它方向的,是一個商業(yè)判斷。
2017年,深勢科技聯(lián)合創(chuàng)始人兼首席科學家張林峰在普林斯頓大學讀博期間提出了 “深度勢能分子動力學” 方法(Deep Potential Molecular Dynamics,DeePMD)。簡而言之,世間萬物都由原子構成,要了解一種材料或藥物的性質,歸根結底要計算原子間的相互作用。量子力學的基礎方程 —— 薛定諤方程 —— 理論上能解決這個問題,但求解成本極其昂貴。
DeePMD為原子尺度計算打開了一條更高效的路徑:用深度學習去逼近原子間相互作用,從而在盡量保持精度的前提下,把原本昂貴得幾乎不可大規(guī)模使用的模擬,推進到更大體系、更長時間尺度。2020年,這項工作獲得了全球高性能計算領域的最高獎項戈登?貝爾獎。
當時作為公司聯(lián)合創(chuàng)始人兼CEO的孫偉杰還在北大讀研,并在一家投資機構實習,他與張林峰是北大元培學院的同學,彼此非常熟悉。張林峰的博士生導師之一、中國科學院院士鄂維南表示,這是他30多年沒見過的機會。正是鄂維南院士與湯超院士一起,首次提出應大力發(fā)展AI for Science。
2018年夏天,三個人聚到一起討論這件事未來該怎么走,最后的共識是如果要把這件事推進得更快、更深,最有效的形式不是繼續(xù)留在學術體系里,而是創(chuàng)辦公司。于是,深勢科技2018年年底在北京注冊完成,2019年年中開始正式運營。
孫偉杰的解釋是,對這件事的核心判斷是 “市場化更有效”。在他看來,科學產品真正的壁壘,很大程度上不來自某次突破本身,而來自客戶持續(xù)使用后的反饋、修正與再迭代。也正因為如此,深勢科技從第一天起就不是一家“先做研究,日后再想辦法落地”的公司,而是一家試圖把研究、工程和商業(yè)化同時推進的公司。
2018年距離 “GPT時刻” 還有四年多,AI for Science還遠不是一個被廣泛接受的概念,所謂 “科研基礎設施” 也沒有多少現成范本,意味著行業(yè)的先行者必然需要付出更多的市場教育成本。孫偉杰回憶說,在AI4S尚未成為共識之前,深勢做了不少 “超出企業(yè)正常工作范圍的事情”,包括辦峰會、出行業(yè)報告、持續(xù)向市場解釋AI for Science到底意味著什么。
對于一家創(chuàng)業(yè)公司來說,這聽起來像額外負擔;但換個角度看,它恰恰說明深勢科技一開始押注的不是一個現成市場,而是一個尚在成形的新范式。
02/
從論文到模型平臺
創(chuàng)業(yè)之后,深勢科技最先做的,不是宏大的平臺敘事,而是更樸素的一步:把論文里的方法,變成可被調用的模型能力。
因此,在創(chuàng)業(yè)早期,深勢科技集中力量搭建底層共性的平臺,就圍繞原子、分子、基因、蛋白等對象展開。孫偉杰把這個階段的框架概括為 “一橫兩縱”:“一橫” 是AI for Science的基礎平臺,“兩縱” 則是生命科學和物質科學。
這一步之所以關鍵,在于它完成了科技成果轉化中最容易被低估的第一步:讓模型離開論文附錄,進入真實研發(fā)流程。一篇論文可以證明方法成立;一個平臺則必須證明,方法能夠被重復調用、被工程化部署、被不同用戶在不同場景中使用。深勢科技后來的很多能力——無論是藥物設計、材料研發(fā),還是更晚的大模型和智能體——都建立在這層基礎之上。
2021年AlphaFold 2引發(fā)全球生物醫(yī)藥領域震動后,深勢科技算法團隊很快投入對其訓練體系的復現。但當時DeepMind并未公開完整訓練代碼,復現并不是簡單照著論文把結果跑出來,而是一次對算法理解能力、工程能力和基礎設施能力的綜合校驗。后來,這項工作被外界視為全球較早完成AlphaFold 2完整訓練復現的成果之一。
它的重要性,不只在于 “跟上了前沿熱點”,更重要的是,它向外界證明,深勢科技不是一家只有DeePMD這一項原始創(chuàng)新的公司,而是具備持續(xù)吸收最前沿方法、完成大規(guī)模訓練并把方法工程化落地的能力。對于一家平臺型公司而言,這種能力幾乎是一張必要的入場券。
但復現AlphaFold也只是能力驗證,而不是商業(yè)驗證。證明 “能做出來” 是一回事,證明 “能賣出去、能長期用” 是另一回事。深勢科技真正的硬仗,發(fā)生在客戶現場,而不是論文里。
03/
客戶買的不是模型,而是結果
頂尖的技術模型并不意味著高效的商業(yè)轉化?;仡櫳顒菘萍嫉膭?chuàng)立歷程,孫偉杰說,模型的開發(fā)速度比他們預計的要快,而商業(yè)化的推動難度卻超過他們的預計。
在創(chuàng)業(yè)初期,為了尋找方向,團隊在調研了不少于50個行業(yè)研究技術可行性和市場機遇的匹配后,最終選擇了兩個成功概率最高、市場需求最明確的切口:小分子藥物研發(fā)和電池材料設計。這個選擇背后的邏輯很清楚:一方面,這兩個領域都高度依賴原子、分子尺度上的理解;另一方面,它們有真實客戶,也更容易形成商業(yè)閉環(huán)。
深勢科技的第一款核心商業(yè)產品是面向藥物設計的平臺Hermite。選擇這個方向,既因為國外已有薛定諤這樣的標桿產品,市場教育相對成熟,也因為制藥行業(yè)對研發(fā)效率高度敏感、支付意愿更強。但真正困難的地方很快就出現了:實驗室里跑通幾個漂亮案例,不等于工業(yè)級產品已經成形。
孫偉杰在采訪中用自動駕駛做類比。以Hermite中的FEP功能為例,一個資深計算化學博士生在實驗室里跑通4~8個案例,并不算太難;但市場化要求覆蓋20多個常見場景,而工業(yè)級可用,則意味著要在絕大多數真實項目里穩(wěn)定工作。蛋白結構是否穩(wěn)定、是否有金屬元素、是否涉及鹽橋和共價鍵,這些 “玩具模型” 里可以回避的細節(jié),一到客戶現場就都變成了必須解決的問題。
深勢科技的第一個客戶就給團隊上了這樣一課。據孫偉杰回憶,產品拿去試用后,對方很快提出一串成熟產品本不該出現的問題,團隊先在內部緊急迭代,又到客戶現場封閉開發(fā),才一點點越過冷啟動期。這個過程持續(xù)數年,才逐漸形成穩(wěn)定的產品和客戶反饋循環(huán)?!暗浆F在我都非常感謝我們的第一個合作伙伴,”孫偉杰說,“越過冷啟動期之后,越來越多的客戶開始使用,形成了正循環(huán)?!边@款產品迭代了將近四年,在國內市場占有率已經是最高的。
這段經歷給深勢科技留下了一條很重要的方法論:技術突破只是種子,真正的壁壘來自 “技術—產品—用戶使用—反饋—再技術化”的閉環(huán)。客戶希望獲得的,是更可靠的結果、更順暢的流程,以及更可預測的研發(fā)效率。
由此他的定義是:“既要做第一個產品,也要做最后一個產品?!边@是因為,“做第一個產品,是因為它會給你帶來發(fā)展窗口,做最后一個產品,是做到有了你的產品之后,用戶就不需要再用其他同類產品了?!?/span>
也正是在這一階段,深勢科技把業(yè)務從醫(yī)藥逐步拓展到了電池與材料。Piloteye等產品的推出,并不是簡單復制Hermite的經驗,而是驗證同一套底層能力能否跨越不同產業(yè)場景。目前深勢科技的智能產品與解決方案已進入生命科學和物質科學多個方向,客戶名單的陣容也日漸豪華,如翰森制藥、復星醫(yī)藥、寧德時代、比亞迪等。
2020 年,孫偉杰找到了一個精確的商業(yè)對標:達索系統(tǒng)?。這家法國工業(yè)軟件公司以飛機設計和仿真起家,用固體力學、流體力學、電磁學的方法,在宏觀尺度做工業(yè)研發(fā)。這正是深勢科技要做的事情——把量子力學內化到軟件里,在微觀的原子、分子尺度做同樣的事情,成為微觀世界里的達索系統(tǒng)?。
04/
科研的全鏈條服務
如果說前半程的深勢科技,主要是在證明 “算” 可以成立,那么它后半程最值得注意的變化,是開始圍繞科研流程本身做布局。
孫偉杰在采訪中把科學研究抽象為四個環(huán)節(jié):讀、算、做、智。
“讀” 是文獻、專利、數據和知識的整理與調用;“算” 是科學計算、模擬、設計和預測;“做” 是實驗驗證,是把模型重新帶回物理世界;“智” 則是讓系統(tǒng)具備更高層次的自主調用和協(xié)同能力,逐步接近 “AI科學家” 的形態(tài)。
這個抽象的說法解釋了深勢科技后來的產品矩陣為什么會越來越寬。Hermite和Piloteye對應的是 “算”;玻爾?科學導航和相關知識基礎設施對應的是 “讀”;玻爾?躍遷實驗室對應的是 “做”;SciMaster、PharmMaster、MatMaster等科學智能體系統(tǒng),則對應的是 “智”。
真正值得注意的,是 “做” 這一層。很多 AI for Science 公司擅長的是 “讀” 和 “算”——整合文獻、訓練模型、給出候選結構或配方。但深勢科技很早就意識到,如果實驗接不上,AI的價值就很難完整落到客戶那里;如果沒有持續(xù)、標準化的實驗數據回流,模型也很難形成真正的數據飛輪。
深勢科技的玻爾?躍遷實驗室試圖把實驗室變成一種可調度、可復用、可回流的數據生產系統(tǒng),而不僅是若干自動化設備的堆疊。這一步很重要,也因此更接近基礎設施建設。它意味著深勢科技不再只是做一個更聰明的科學軟件,而是在嘗試打通“計算指導實驗—實驗反饋模型”的閉環(huán)。
到2025年年底,玻爾?科學導航已服務上百所高校、400多萬名科學家用戶,累計整合2億多篇英文文獻和2億多項專利,以及8000萬篇中文文獻。深勢科技的科學智能產品已服務數百家先進研發(fā)企業(yè)。當然,這些數字更多說明覆蓋度,而不意味著終局勝利。真正的難點仍然是:這些工具和系統(tǒng)是否已經足夠深地嵌入科學家的工作流。
2025年12月,深勢科技宣布完成C輪超8億元融資。在多輪融資中,深勢科技背后站著啟明創(chuàng)投等一眾頭部機構。
05/
打造“AI 科學家”
深勢科技在2020年提出的第一個五年目標,是到2025年搭建完微尺度工業(yè)研發(fā)平臺。按孫偉杰在采訪中的說法,這一目標“基本完成”:技術要素、研發(fā)體系、產品體系大體成形。下一階段,公司給自己的目標則是到2030年打造“AI科學家”。
這當然是一個極具雄心的目標。這個目標并非意在 “取法其上,得到其中,而是基于公司一路發(fā)展過程中練出的洞察和建立的信心而設立的?!睂O偉杰說,2022年時,他曾預測2025年AI4S會完成基礎設施搭建、進入應用爆發(fā)期,當時所有人都覺得他高估了,“事實證明我其實還是太保守了。”
“2025年,中美歐幾乎在同期發(fā)布關于AI for Science戰(zhàn)略規(guī)劃,中國在《關于深入實施 “人工智能 +” 行動的意見》中,將 “人工智能+科學技術” 列為六大重點行動之首;美國則在啟動 “創(chuàng)世紀計劃”,將其描述為一項在緊迫性和雄心上堪比曼哈頓計劃的國家行動。而同時,國際巨頭也紛紛入局。除了Google的DeepMind,2025年5月Anthropic宣布一項創(chuàng)新性的AI for Science計劃;10月,OpenAI宣布成立全新的 “科學事業(yè)部”。
今天的AI仍然更擅長執(zhí)行人類定義的問題,而不是獨立提出真正重要的問題。它可以在局部任務上顯著提高效率,卻還談不上已經具備成熟的科學判斷力。深勢科技正在初步建立覆蓋科研全流程的基礎設施,不是單純的模型公司,而是擁有知識、計算、實驗和工具調度能力的系統(tǒng)型平臺。深勢科技希望把 “讀、算、做” 這些已經逐步成形的能力,交給智能體去調用與編排,讓AI不只是某個環(huán)節(jié)的加速器,而是開始成為科研流程中的協(xié)作主體。
作為數字時代的基礎設施,搜索引擎構建的是人類通往已知信息的最短路徑,但它不會直接提供知識;而大模型構建的是人類通往已知知識的最短路徑,它把知識梳理好呈現出來。在孫偉杰看來,AI for Science正在構建的是人類通往未知知識的最短路徑。
基于這個前提,人類在知識積累方面的門檻會急劇降低,科學發(fā)現會變得更加簡單,更多的人會有機會成為科學家。同時,隨著AI和機器人帶來的生產力解放,人類也會有更多精力投入科學生產中,所以,孫偉杰非常樂觀地說,“這將會是人類最后一項生產工作”。
如果在這樣的語境下想象深勢未來的樣子,孫偉杰的答案是:科學發(fā)現領域的 Google。