機器視覺與工業(yè)融合,難在哪了?

在計算機視覺領(lǐng)域中,商湯、曠視、云從、依圖可以說是當之無愧的頭部企業(yè),更是被業(yè)內(nèi)稱為CV(ComputerVision)四小龍。值得關(guān)注的是,商湯和云從兩家上市公司都經(jīng)歷了上市即巔峰,隨即股價下跌的劇情。資本市場表現(xiàn)不佳,深陷裁員等傳聞,不禁讓人好奇:當風口退去,他們準備好面對資本市場最嚴格的審視了嗎?

研發(fā)成本高、盈利難:

目前業(yè)內(nèi)將虧損的主要原因歸咎于研發(fā),從招股書顯示,商湯科技2018-2021年上半年,累計虧損242.72億元,調(diào)整后累計虧損為28.6億元。商湯科技在研發(fā)上十分大手筆。2018-2021年上半年,商湯科技三年半合計研發(fā)支出達69.91億元。

云從科技的招股書中也可以看到,2019年-2021年,云從科技三年累計虧損高達23.21億元。造成虧損的一大原因是高額的研發(fā)投入占了營收大半,2019年至2021年,云從三年累計研發(fā)投入占營收的占比為59.39%。

AI的應(yīng)用場景中非常分散和碎片化,客戶的每一個新場景都需要企業(yè)長期堆人頭、消耗大量的研發(fā)與交付資源。無論是云從還是商湯,持續(xù)增加的研發(fā)投入,卻換來長期虧損,這成為籠罩在AI企業(yè)頭頂之上的烏云。

商業(yè)化落地難:

翻閱商湯科技公布的2022年上半年財報顯示,公司新增2136項專利,專利資產(chǎn)總數(shù)達12502個,在全球頂級計算機視覺會議上發(fā)表了71篇論文。可商業(yè)并非學術(shù)。如何將技術(shù)規(guī)?;涞氐綀鼍爸腥ィ崿F(xiàn)商業(yè)化變現(xiàn),對于不少計算機視覺企業(yè)來說也是一個難點。

無論是盈利模式還是應(yīng)用落地,在CV領(lǐng)域外,四小龍的AI之路仍充滿著艱難。

計算機視覺與工業(yè)界GAP有多大?

從人臉識別到工業(yè)智造,計算機視覺目前已跨越了安防、金融、零售、互聯(lián)網(wǎng)、半導(dǎo)體、汽車等不同垂直行業(yè)。

隨著數(shù)字化轉(zhuǎn)型需求的提升,越來越多的工業(yè)企業(yè)開始應(yīng)用視覺技術(shù)替代人工進行工況檢測、成品檢驗、質(zhì)量控制?!八男↓垺痹趹?yīng)用場景的落地上雖然都以比較成熟的安防和金融為主,但查看幾家企業(yè)的網(wǎng)站發(fā)現(xiàn),已有一些企業(yè)開始在工業(yè)領(lǐng)域涉足。

例如,曠視推出的河圖就是面向供應(yīng)鏈物聯(lián)網(wǎng)打造的“機器人物聯(lián)網(wǎng)操作系統(tǒng)”,重點關(guān)注“倉儲、物流、制造和供應(yīng)鏈”等行業(yè)場景。商湯科技在工業(yè)質(zhì)量控制方面更是已有案例,提供了基于SenseCore 商湯AI大裝置打造的光機電軟算一體化的深泉工業(yè)質(zhì)檢推訓(xùn)平臺解決方案。

碎片化場景難以深入

新市場、新賽道的拓展并不容易。對于計算機視覺企業(yè)來說,想要進入工業(yè)市場,質(zhì)檢、巡檢是主要應(yīng)用場景,但對于工業(yè)企業(yè)來說,計算機視覺只是繁雜工藝中的一環(huán),要嵌入完整的生產(chǎn)線上,必然會遇到與其他環(huán)節(jié)合作的挑戰(zhàn),甚至與工業(yè)本身的相互磨合。

一個個“大而全”的解決方案,看似可以破解一切難題,但往往會被現(xiàn)實場景進一步削弱。因此,機器視覺在工業(yè)領(lǐng)域的應(yīng)用需要找到非常有吸引力的差異化場景。

在我們與工業(yè)用戶的接觸中,很多用于都有意愿嘗試通過AI機器視覺來解決工業(yè)檢測中的問題,但是客戶對技術(shù)的成熟度并無概念。視覺算法企業(yè)在面對千奇百怪的工業(yè)應(yīng)用場景時,也很難保證用戶可以在一定成本內(nèi)達到預(yù)期效果。

比如在汽車、3C、制藥等行業(yè),他們的共同特點都連續(xù)大批量生產(chǎn)、對外觀質(zhì)量的要求非常高,但三個行業(yè)的被測物一致性、對視覺系統(tǒng)的分辨率、對檢測速度的要求來講,都是不盡相同的。

細分到不同的工藝環(huán)節(jié),都會造成機器視覺系統(tǒng)所需的機理模型不同。以冶金鋼卷生產(chǎn)缺陷檢測為例,鋼卷分為冷軋、熱軋,都可以采用機器視覺技術(shù)進行質(zhì)檢,但算法要解決的機理問題卻又是完全不一樣。一個企業(yè)、一個場景,尚無法做到模型的通用化,而一對一模型的定制開發(fā),又會導(dǎo)致落地成本和實施周期的增加。

從若干客戶的各種具體應(yīng)用場景中對解決方案進行總結(jié)研發(fā),提煉出在一定應(yīng)用場景下相對普適性的解決方案,并設(shè)計有效的機器視覺解決方案,需要大量的行業(yè)應(yīng)用經(jīng)驗積累。

因此,想在工業(yè)場景中拓展智能化應(yīng)用,光有算法實力是不行的,還必須具備相當深刻的行業(yè)知識。對于工業(yè)領(lǐng)域來說,不一定需要多復(fù)雜的算法,而是更多地受到其他現(xiàn)實因素的影響。他們更注重豐富的行業(yè)應(yīng)用經(jīng)驗,算法應(yīng)力求簡單實用,穩(wěn)定性強。

成熟算法已有

一般來說,掌握底層軟件算法的公司更容易形成自身優(yōu)勢。但在工業(yè)領(lǐng)域,成熟的視覺算法軟件已經(jīng)有很多,包括vision pro、halcon、opevCV、mil、hexsight、evision、avl等。例如,非常成熟的檢測算法Halcon,經(jīng)過長期的積累和迭代,不僅非常穩(wěn)定而且計算量小,還不用標注數(shù)據(jù)和調(diào)參。

在算法側(cè)重上,工業(yè)視覺的算法往往側(cè)重于精確度的提高;而計算機視覺的算法難度相對較高,側(cè)重于或采用數(shù)學邏輯或采用深度學習方法進行物體的標定與識別。

有系統(tǒng)服務(wù)商曾表示,在開發(fā)解決方案的時候選擇了某品牌的相機,相機設(shè)備自帶一個面向工業(yè)視覺的算法庫,買回去之后可以直接開發(fā)出更具針對性的產(chǎn)品,部署的時候再買一個品牌的加密狗就可以了,完全沒有必要再去單獨購買一套純算法。既然已經(jīng)有了這么多可供選擇的算法,工業(yè)企業(yè)也就完全沒有必要再去選擇純算法公司的產(chǎn)品。

缺乏樣本數(shù)據(jù)

軟件是機器視覺產(chǎn)業(yè)的核心中樞,其背后的本質(zhì)是數(shù)據(jù)的積累和算法的迭代。在視覺算法層面,一個最簡單的思路是針對特殊場景收集大量數(shù)據(jù)去訓(xùn)練模型。

在工業(yè)場景中,數(shù)據(jù)的收集存在一定問題,樣本數(shù)據(jù)量往往不足以支持基于深度學習的計算機視覺檢測任務(wù)。一般來說,不合格缺陷產(chǎn)品的數(shù)量遠遠少于合格品,隨機獲取的數(shù)據(jù)將存在樣本分布不平衡的問題。而且,工業(yè)現(xiàn)場的拍攝環(huán)境復(fù)雜無法保證,容易造成樣本圖像的質(zhì)量不一,從而影響后續(xù)檢測效果。

機器視覺領(lǐng)域看似繁榮,但是真正落地仍然面臨很多問題。除了軟件算法層面的問題,光源的穩(wěn)定性、工件位置的穩(wěn)定性、工件表面質(zhì)量的穩(wěn)定性、工件本身的一致性、工件材質(zhì)、物體的運動速度、光學系統(tǒng)的精度等都是影響視覺技術(shù)在工業(yè)領(lǐng)域落地的難點。這需要光學,深度學習、傳統(tǒng)圖像算法、機械設(shè)備、傳感器等多方面融合。

對于工業(yè)用戶來說,合適的硬件及易用的軟件算法固然十分重要,但更重要的是提供軟硬件方案的機器視覺廠商可以根據(jù)他們的應(yīng)用需要和使用場景進行可行性分析,并給出真正適合的解決方案。

亚洲av综合色区_亚洲videofree高清极品_国产不卡免费网站入口_免费a级黄色毛片