近日,AI基礎(chǔ)架構(gòu)與數(shù)據(jù)智能平臺服務(wù)商曼孚科技宣布,已于2023年9月完成數(shù)千萬元B輪融資,本輪投資方為安樸資本。所融資金將主要用于AI基礎(chǔ)設(shè)施搭建、大模型標(biāo)注平臺閉環(huán)更迭以及數(shù)據(jù)標(biāo)注市場拓展等。
曼孚科技商業(yè)化始于2019年,是一家數(shù)據(jù)驅(qū)動的AI基礎(chǔ)設(shè)施平臺企業(yè),致力于從數(shù)據(jù)中獲取洞見與價(jià)值,并以更精簡方式構(gòu)建人工智能應(yīng)用,實(shí)現(xiàn)AI的輕量化與普惠化。
旗下主要產(chǎn)品服務(wù)包括:面向數(shù)據(jù)生命周期管理的數(shù)據(jù)智能平臺、AI數(shù)據(jù)中臺、AutoLabeling平臺、AutoML平臺以及基礎(chǔ)數(shù)據(jù)服務(wù)(數(shù)據(jù)標(biāo)注、數(shù)據(jù)采集、數(shù)據(jù)清洗)等。
憑借從戰(zhàn)略到技術(shù)落地的一站式數(shù)據(jù)解決方案,目前已與數(shù)百家企業(yè)達(dá)成深度合作,業(yè)務(wù)場景涵蓋自動駕駛數(shù)據(jù)標(biāo)注、AI數(shù)據(jù)生命周期管理等。用戶包括主機(jī)廠、造車新勢力、一線科技公司、主流算法公司以及世界頂級Tier1廠商等,2023年?duì)I收額預(yù)估將實(shí)現(xiàn)3倍以上持續(xù)性增長。
數(shù)據(jù)定義模型
AI產(chǎn)業(yè)歷經(jīng)多年發(fā)展,已逐漸步入技術(shù)與商業(yè)的交叉點(diǎn)。
算法模型從關(guān)注增量的建模改進(jìn),轉(zhuǎn)變?yōu)閺?qiáng)調(diào)性能的迭代與優(yōu)化,以契合商業(yè)應(yīng)用場景對模型質(zhì)量更為苛刻的要求。
結(jié)構(gòu)化數(shù)據(jù)已成為AI算法模型開發(fā)與迭代的基礎(chǔ)。AI強(qiáng)大“理解力”的造就,離不開結(jié)構(gòu)化數(shù)據(jù)源源不斷的輸入,和對數(shù)據(jù)更為精細(xì)化的運(yùn)用。
AI行業(yè)正圍繞以數(shù)據(jù)為中心進(jìn)行整合,誰擁有數(shù)據(jù),誰就擁有模型的定義權(quán)。
在細(xì)分場景,自動駕駛城市NOA熱潮興起。技術(shù)范式全面革新下,自動駕駛感知算法向BEV+Transformer架構(gòu)升級,端到端算法解決方案成為主流,推動自動駕駛感知算法從輕量的CNN二維感知,到基于Transformer四維感知的升維,也催生了數(shù)據(jù)需求的指數(shù)型增加。
自動駕駛在AI大模型的助力下迎來臨界點(diǎn)。但量變到質(zhì)變的前置條件是大規(guī)模數(shù)據(jù)的支持——Transformer大模型質(zhì)變需要數(shù)億公里標(biāo)注數(shù)據(jù)的投喂,并覆蓋不斷出現(xiàn)的Corner Case,這對數(shù)據(jù)量產(chǎn)規(guī)模以及自動化水平提出了更高的要求。
自動駕駛的終極目標(biāo)是完成對駕駛員的取代,但在此之前,數(shù)據(jù)標(biāo)注員需要率先被神經(jīng)網(wǎng)絡(luò)所取代。
AI驅(qū)動的數(shù)據(jù)智能平臺
隨著BEV+Transformer技術(shù)路線成為新一代自動駕駛感知能力的核心架構(gòu),數(shù)據(jù)閉環(huán)能力取代算法范式,成為決定商業(yè)量產(chǎn)從1到N的勝負(fù)關(guān)鍵。
而數(shù)據(jù)閉環(huán)的每一步推進(jìn)都是成本與效率的博弈,低成本AI數(shù)據(jù)量產(chǎn)能力又成為助推數(shù)據(jù)飛輪的關(guān)鍵。
作為行業(yè)領(lǐng)先的AI基礎(chǔ)架構(gòu)與數(shù)據(jù)智能平臺服務(wù)商,曼孚科技以產(chǎn)品技術(shù)為核心驅(qū)動力,通過構(gòu)建AI+RPA驅(qū)動的數(shù)據(jù)平臺沉淀數(shù)據(jù)Know-How能力,在業(yè)內(nèi)率先實(shí)現(xiàn)AI數(shù)據(jù)低成本、無上限、規(guī)?;慨a(chǎn)。
曼孚科技數(shù)據(jù)平臺核心產(chǎn)品體系由MindFlow SEED數(shù)據(jù)服務(wù)平臺與MindFlow AutoLabeling自動標(biāo)注平臺構(gòu)成,歷經(jīng)多代版本更迭,現(xiàn)已在3D、4D點(diǎn)云數(shù)據(jù)處理領(lǐng)域,建立起6-12個(gè)月的技術(shù)壁壘。
具體應(yīng)用場景上,平臺支持自動駕駛等場景下2D、3D、4D全類別標(biāo)注,如2/3D融合、點(diǎn)云分割、點(diǎn)云時(shí)序疊幀、BEV標(biāo)注等。
針對4D點(diǎn)云標(biāo)注場景下大規(guī)模點(diǎn)云適配渲染問題,曼孚科技自研地圖分片與LOD大規(guī)模點(diǎn)云渲染技術(shù),4D點(diǎn)云車道線與4D點(diǎn)云分割場景均可實(shí)現(xiàn)低配置單幀數(shù)億級點(diǎn)云平穩(wěn)運(yùn)行。
4D點(diǎn)云分割標(biāo)注場景
作為自動化AI數(shù)據(jù)平臺,RPA與AI能力的建設(shè)是曼孚科技構(gòu)建技術(shù)壁壘的核心。
RPA能力主要體現(xiàn)在流程自動化以及調(diào)度分發(fā)自動化等多個(gè)方面。而AI能力則已深入數(shù)據(jù)流轉(zhuǎn)各環(huán)節(jié),具體體現(xiàn)在:
1)覆蓋數(shù)據(jù)預(yù)處理、算法推斷至結(jié)果精修完整算法鏈路,已商用靜態(tài)道路自適應(yīng)分割、動態(tài)障礙物AI預(yù)處理、AI交互式標(biāo)注等數(shù)十種AI算法標(biāo)注模型;
2)采用Backbone+多Head算法架構(gòu),快速適配不同場景,大幅降低多任務(wù)模型研發(fā)成本;
3)基于AutoML以及自有數(shù)據(jù)集構(gòu)建AI標(biāo)注模型,自我驅(qū)動完成算法迭代;
4)運(yùn)用遷移學(xué)習(xí)、知識蒸餾等方式,基于小批量數(shù)據(jù)+底層通用大模型快速產(chǎn)出算法模型。
RPA與AI能力的強(qiáng)耦合,賦予曼孚科技以更低人力支出與邊際成本,提供更具標(biāo)準(zhǔn)化數(shù)據(jù)解決方案的能力。綜合人效平均提升80%,數(shù)據(jù)生產(chǎn)成本平均降低50%,并實(shí)現(xiàn)AI數(shù)據(jù)低成本、無上限、規(guī)?;慨a(chǎn)。
基于大模型的AI自動標(biāo)注體系
作為引領(lǐng)人工智能新一輪躍遷式發(fā)展的全新底座,大模型正走深向?qū)?,賦能千行百業(yè)。
海量參數(shù)帶來的容量優(yōu)勢,賦予大模型更強(qiáng)的性能與泛化能力,為數(shù)據(jù)預(yù)處理、數(shù)據(jù)標(biāo)注等傳統(tǒng)依賴人力的環(huán)節(jié),提供了全新的技術(shù)解決范式。
目前,曼孚科技已完成自動駕駛數(shù)據(jù)標(biāo)注視覺大模型研發(fā)。通過引入駕駛數(shù)據(jù)建立RLHF,并基于深度學(xué)習(xí)與計(jì)算機(jī)視覺構(gòu)建大模型,可實(shí)現(xiàn)復(fù)雜駕駛場景下,數(shù)據(jù)的高效處理與全自動化標(biāo)注。
曼孚科技數(shù)據(jù)標(biāo)注大模型的主要技術(shù)特點(diǎn)如下:
1)基于弱監(jiān)督與半監(jiān)督學(xué)習(xí),通過少量人工標(biāo)注數(shù)據(jù)與大量無標(biāo)注數(shù)據(jù),實(shí)現(xiàn)對場景物體的高效檢測、分割與識別;
2)基于BEV多視角融合與三維重建,借助多攝像頭、激光雷達(dá)等來源數(shù)據(jù),自動生成場景物體三維信息;
3)運(yùn)用遷移學(xué)習(xí)方式,對不同場景與不同模態(tài)下的數(shù)據(jù),進(jìn)行統(tǒng)一表示與學(xué)習(xí),提升模型泛化能力與適應(yīng)性;
4)運(yùn)用主動學(xué)習(xí)與交互式學(xué)習(xí)方式,通過與人工標(biāo)注過程進(jìn)行反饋,不斷優(yōu)化迭代模型性能。
上述大模型技術(shù)加持下,典型自動駕駛數(shù)據(jù)標(biāo)注場景平均效率可提升4-5倍以上,引領(lǐng)曼孚科技率先步入自動化數(shù)據(jù)標(biāo)注時(shí)代。
數(shù)據(jù)驅(qū)動的AI基礎(chǔ)設(shè)施
算法更新迭代的全生命周期內(nèi),從設(shè)計(jì)、訓(xùn)練、評測到仿真等環(huán)節(jié)均需要海量數(shù)據(jù)不斷輸入作為支撐,其中數(shù)據(jù)標(biāo)簽是整個(gè)流程的基礎(chǔ)與起點(diǎn)。
如果說互聯(lián)網(wǎng)時(shí)代是對信息流量的搬運(yùn),那么人工智能尤其是大模型時(shí)代,則是對海量數(shù)據(jù)的搬運(yùn)與精細(xì)化運(yùn)用。
在信息流量的基礎(chǔ)上,誕生了諸多影響深遠(yuǎn)的商業(yè)模式。AI時(shí)代,任何人也均可使用數(shù)據(jù)作為“鏟子”去探索商業(yè)“金礦”。是否擁有質(zhì)量更高、數(shù)量更多的“鏟子”,是決定“淘金人”能否真正掌握主動權(quán),淘到金子的關(guān)鍵。
AI大淘金時(shí)代,曼孚科技希望扮演起為“淘金人”服務(wù)的角色,以數(shù)據(jù)為驅(qū)動力向AI上下游延伸,打造起通用AI基礎(chǔ)設(shè)施。用戶可以以更精簡方式構(gòu)建AI應(yīng)用并管理全生命周期,同時(shí)也可以更加靈活調(diào)整模型構(gòu)建流程中的每個(gè)組件,以得到更契合的需求與分析結(jié)果。
在上述愿景指引下,曼孚科技目前已在自動駕駛場景構(gòu)建起AI數(shù)據(jù)閉環(huán)平臺,涵蓋DaaS數(shù)據(jù)標(biāo)注平臺、數(shù)據(jù)管理平臺、AutoLabeling平臺以及AutoML平臺等,提供從數(shù)據(jù)準(zhǔn)備到模型應(yīng)用的端到端解決方案,并延伸至其他AI應(yīng)用場景。
其中,數(shù)據(jù)管理平臺集數(shù)據(jù)存儲、處理、導(dǎo)入導(dǎo)出于一體,通過SDK打通數(shù)據(jù)采集平臺、數(shù)據(jù)標(biāo)注平臺、模型訓(xùn)練平臺與生產(chǎn)運(yùn)營系統(tǒng)等外部平臺,借助AI與大數(shù)據(jù)技術(shù)加強(qiáng)智能標(biāo)簽、分析報(bào)表、場景挖掘與自然語言搜索等功能體驗(yàn),提高數(shù)據(jù)使用與管理效率。
而AutoML平臺則是面向自動駕駛等通用視覺場景的自動訓(xùn)練平臺,提供算法模型自動訓(xùn)練與快速迭代功能。可自動優(yōu)化模型結(jié)構(gòu)、參數(shù)與超參數(shù),提升性能與泛化能力,實(shí)現(xiàn)零代碼一鍵訓(xùn)練,無人值守。
曼孚科技AI基礎(chǔ)設(shè)施架構(gòu)
曼孚科技AI基礎(chǔ)設(shè)施解決方案全面覆蓋數(shù)據(jù)層至算法層,既可提供DaaS服務(wù),也可提供MaaS服務(wù)。無論用戶規(guī)模大小、是否具備AI研發(fā)能力,只要存在AI需求,即可使用曼孚科技提供的基礎(chǔ)設(shè)施,輕松創(chuàng)建專屬AI產(chǎn)品,實(shí)現(xiàn)從數(shù)據(jù)到商業(yè)價(jià)值的轉(zhuǎn)變。
AI For Everyone
獨(dú)立自研的數(shù)據(jù)閉環(huán)平臺、AI數(shù)據(jù)量產(chǎn)能力以及對客戶業(yè)務(wù)需求的敏銳洞察,讓曼孚科技在不斷變化的市場中實(shí)現(xiàn)業(yè)務(wù)超預(yù)期增長,數(shù)據(jù)驅(qū)動的AI基礎(chǔ)設(shè)施在自動駕駛等行業(yè)驗(yàn)證了應(yīng)用價(jià)值與商業(yè)潛力。
下階段,曼孚科技將繼續(xù)深耕數(shù)據(jù)行業(yè),不斷完善AI基礎(chǔ)設(shè)施建設(shè)。正如AWS之于云計(jì)算,Snowflake之于數(shù)據(jù)分析一樣,曼孚科技希望在AI行業(yè)能以數(shù)據(jù)構(gòu)建起通用基礎(chǔ)設(shè)施,幫助用戶以更精簡方式訓(xùn)練與部署人工智能應(yīng)用。無論是初創(chuàng)企業(yè)、成熟公司亦或是個(gè)人,均可通過簡單點(diǎn)擊或幾行代碼享受AI帶來的便利,實(shí)現(xiàn)真正的AI民主化與普惠化。
互聯(lián)網(wǎng)時(shí)代,谷歌憑借搜索引擎掌控了互聯(lián)網(wǎng)流量入口,微軟憑借操作系統(tǒng)掌控了PC生態(tài)鏈的上游,目前尚未出現(xiàn)挑戰(zhàn)谷歌、微軟等萬億體量的科技新貴,但AI正讓一切變得可能。
關(guān)鍵詞: