5月21日,阿丘科技CEO黃耀應(yīng)邀參加北京機器視覺助力智能制造創(chuàng)新發(fā)展大會,并發(fā)表《AI+工業(yè)視覺探索與展望》主題演講,下文根據(jù)黃耀先生的主題演講主要內(nèi)容撰寫而成??牲c擊文末“閱讀原文”下載原版PPT資料。
一、AI+工業(yè)檢測的難點與挑戰(zhàn)
現(xiàn)代制造業(yè)中,質(zhì)量管控是一個至關(guān)重要但充滿挑戰(zhàn)的環(huán)節(jié)。制造企業(yè)使用AI的具體場景中,“質(zhì)量檢測”占據(jù)了約40%的比例。在質(zhì)量管控中,面對大規(guī)模的產(chǎn)量,企業(yè)需要管理眾多的工藝控制點。
這導致單個產(chǎn)品的檢測參數(shù)量多,總體檢測的參數(shù)量大,給質(zhì)量控制帶來了極大的壓力。其次,極限制造的環(huán)境下,對產(chǎn)品的精度和品質(zhì)要求極為嚴格。不僅生產(chǎn)線上對過檢和漏檢的指標控制非常嚴格,同時產(chǎn)線速度的加快進一步增加了檢測的難度。
此外,缺陷的種類復雜多變,許多缺陷非常微小,區(qū)分度低,使得檢測工作更加困難。最后,傳統(tǒng)的質(zhì)量管控方式需要投入大量的人力和財力,即使如此,仍然存在漏檢的風險。這些因素共同構(gòu)成了質(zhì)量管控的主要難點,亟需通過技術(shù)創(chuàng)新和改進來解決。
工業(yè)AI視覺檢測作為制造業(yè)中新興的領(lǐng)域,在高速發(fā)展的同時也一直面臨著一系列難點與挑戰(zhàn)。
第一,嚴苛的性能指標。工業(yè)場景對AI檢測提出了極為嚴苛的性能指標,要求極高的準確度、AI模型高度的穩(wěn)定性和魯棒性,適應(yīng)復雜多變的工業(yè)環(huán)境。
第二,工業(yè)場景的數(shù)據(jù)基礎(chǔ)薄弱。工業(yè)數(shù)據(jù)往往數(shù)量有限且私有化,導致數(shù)據(jù)的獲取和應(yīng)用面臨高度碎片化的難題。數(shù)據(jù)基礎(chǔ)的薄弱是制約工業(yè)AI發(fā)展的重要因素,缺乏數(shù)據(jù)、數(shù)據(jù)質(zhì)量差或數(shù)據(jù)量不足的問題,都嚴重影響了AI模型的訓練和優(yōu)化效果。
第三,工業(yè)場景的AI大多需要與硬件緊密結(jié)合。這不僅增加了系統(tǒng)的復雜性,還可能引入各種干擾因素,對AI的性能造成影響。
第四,AI+工業(yè)人才缺乏。人才缺乏是工業(yè)AI發(fā)展中的另一個瓶頸,既懂得AI技術(shù)又熟悉工業(yè)領(lǐng)域的復合型人才十分稀缺,很大程度上限制了AI技術(shù)在工業(yè)場景中的應(yīng)用和推廣。
二、工業(yè)AI視覺進入2.0時代
中國工業(yè)AI視覺的落地大約始于2019年,經(jīng)過5年的積累、迭代,正在從1.0進入2.0時代。
工業(yè)AI視覺進化論
1、工業(yè)AI視覺1.0時代:聚焦工業(yè)場景的AI算法,實現(xiàn)“可用”
在工業(yè)AI視覺1.0時代,由于沒有足夠的數(shù)據(jù),通常需要通過小樣本技術(shù)來解決問題。
這一時期的工業(yè)AI視覺主要表現(xiàn)為以下3個特征:
第一,小樣本學習。在工業(yè)生產(chǎn)環(huán)境中,訓練AI模型可用的標注圖像樣本采集、標注耗時耗力,往往數(shù)量非常有限,所以此時的AI算法訓練只能夠在有限的數(shù)據(jù)基礎(chǔ)上進行。
第二,高精度。工業(yè)質(zhì)檢的標準要求AI檢測系統(tǒng)以很高的準確度檢測、識別和分類圖像中的目標對象,如缺陷檢測、尺寸測量、物體識別和分類等任務(wù)。高精度是工業(yè)視覺檢測系統(tǒng)的一個關(guān)鍵性能指標,它對生產(chǎn)效率、產(chǎn)品質(zhì)量和企業(yè)信譽都有直接影響。
第三,低算力依賴。在實際的生產(chǎn)環(huán)境中, AI檢測系統(tǒng)在執(zhí)行圖像處理和分析任務(wù)時可用的計算資源相對較少,工業(yè)級AI視覺算法經(jīng)過專門的優(yōu)化,可以在相對性能有限的計算資源上完成高性能檢測。
這一時期的典型客戶群體主要是對新技術(shù)持開放態(tài)度的企業(yè),它們通常面臨明顯的生產(chǎn)或質(zhì)量管控痛點,并且愿意投資于前沿技術(shù)以獲得競爭優(yōu)勢。這些企業(yè)通常對AI有清晰的認識,能夠定義明確的需求邊界,并有能力進行有效的數(shù)據(jù)和模型管理。
工業(yè)AI視覺1.0時代
在這一時期,從AI全面落地的角度,也僅僅算是解決了工業(yè)視覺中“可用”的問題。
首先,數(shù)據(jù)困局明顯。由于工業(yè)缺陷數(shù)據(jù)難以搜集,外加清洗、標注等成本偏高,使得AI模型的訓練和整理都變得充滿挑戰(zhàn)。
其次,部署周期長。較長的上線部署周期,嚴重延緩了企業(yè)所需的應(yīng)用速度。
而且,未知缺陷無法識別。一些新的缺陷類型難以識別,很大程度限制了AI的應(yīng)用。
最后,昂貴的成本。高昂的AI落地成本門檻使得只有具備一定支付能力的企業(yè)才可能采用這項技術(shù)。
總體而言,工業(yè)AI視覺1.0時代為工業(yè)AI視覺技術(shù)的未來發(fā)展奠定了基礎(chǔ),盡管存在諸多挑戰(zhàn),但通過不斷的技術(shù)創(chuàng)新和市場適應(yīng),AI視覺技術(shù)逐步從可用走向成熟。
2、工業(yè)AI視覺2.0時代:生成式AI及垂直細分通用模型,達到“好用”
工業(yè)AI視覺2.0時代的來臨,標志著工業(yè)AI視覺技術(shù)的重要演進。
基于Transformer神經(jīng)網(wǎng)絡(luò)的技術(shù)也在工業(yè)AI領(lǐng)域迅速發(fā)展,更強的通用性和泛化能力,可以把過去針對單一場景解決問題擴展到可應(yīng)對垂類場景解決問題。
具體來說,包括單場景的規(guī)模復制和多場景模型的泛化遷移,這為工業(yè)AI視覺的應(yīng)用提供了更大的靈活性和擴展性,同時也大大降低了AI落地的成本。
同時,這些轉(zhuǎn)變也會涉及到成像模組、算法模組以及自動化模組的創(chuàng)新和簡化,使得AI解決方案更加易于開發(fā)及落地。
工業(yè)AI視覺2.0時代的客戶群體更加普遍,即客戶有明確的痛點、關(guān)注性價比,他們可從AI成本的進一步下降中受益,使得AI視覺技術(shù)的應(yīng)用擴展到更大規(guī)模。
工業(yè)AI視覺2.0時代
在工業(yè)AI視覺2.0時代,三大關(guān)鍵技術(shù)起到了重要作用。
(1)關(guān)鍵技術(shù)一:智能良品學習
阿丘科技認為,工業(yè)AI視覺2.0時代的關(guān)鍵技術(shù)之一即智能良品學習,它包括非監(jiān)督分割和非監(jiān)督分類兩種模塊。這項技術(shù)可有效應(yīng)對產(chǎn)線中出現(xiàn)的未知新缺陷,以及需要在極短的時間內(nèi)完成模型部署和上線的問題。
智能良品學習的核心優(yōu)勢在于,它只需利用良品圖像,就能夠?qū)λ幸阎臀粗娜毕葸M行像素級別的檢測和整圖分類,從而實現(xiàn)快速的上線驗證。目前,阿丘科技已將智能良品學習技術(shù)應(yīng)用在數(shù)十個實際場景中,尤其適用于一些產(chǎn)線良品率高、樣本收集周期長、可能面臨未知缺陷,以及產(chǎn)線上異常類別檢測等場景。
然而,對于小缺陷場景,智能良品學習技術(shù)的效果仍有待提升。
關(guān)鍵技術(shù)一
智能良品學習技術(shù)展示了AI在工業(yè)視覺檢測領(lǐng)域中的巨大潛力,尤其是在快速適應(yīng)產(chǎn)線變化和提高生產(chǎn)效率等方面。
(2)關(guān)鍵技術(shù)二:生成式AI——智能缺陷數(shù)據(jù)生成
在工業(yè)AI視覺2.0時代中的另一項關(guān)鍵技術(shù)即生成式AI——智能缺陷數(shù)據(jù)生成。
在以往方式中,搜集缺陷樣本數(shù)據(jù)需要花費數(shù)天甚至是數(shù)月時間,一旦產(chǎn)品換型,整個搜集過程又必須重新開始。此外,搜集那些不常出現(xiàn)的長尾缺陷(一年可能只出現(xiàn)一次),也為樣本收集帶來了巨大挑戰(zhàn)。
為了解決這些問題,阿丘科技通過多年來在工業(yè)AI視覺領(lǐng)域的探索和實踐,利用積累的大量場景和經(jīng)驗,構(gòu)建出預訓練模型?;陬A訓練模型,結(jié)合具體場景的缺陷特征描述,通過Stable Diffusion框架,即可生成真實缺陷的仿真圖像。
這意味著,AI可以創(chuàng)造出接近真實情況的目標缺陷圖像,并能適應(yīng)復雜結(jié)構(gòu)缺陷、背景變化、缺陷邊緣處理等多樣場景,高度還原真實缺陷紋理、立體度和色彩細節(jié)等。
智能缺陷生成技術(shù)為工業(yè)視覺檢測系統(tǒng)提供了一個強大的工具,以便于在缺乏實際缺陷樣本的情況下,也能訓練和優(yōu)化模型,顯著提高了模型的泛化能力與適應(yīng)性。
關(guān)鍵技術(shù)二
(3)關(guān)鍵技術(shù)三:工業(yè)視覺大模型
關(guān)鍵技術(shù)三為工業(yè)視覺大模型,即專門針對工業(yè)應(yīng)用領(lǐng)域而設(shè)計的算法模型,其構(gòu)建和訓練需要利用Transformer,以及大量的領(lǐng)域特定數(shù)據(jù)。
工業(yè)視覺大模型具備領(lǐng)域泛化能力,能夠適應(yīng)多變的工業(yè)環(huán)境,特別是單場景的規(guī)模復制和多場景模型的泛化遷移。
工業(yè)視覺大模型具有一定的垂直場景通用性,在特定領(lǐng)域可以有效降低AI算法開發(fā)、訓練的成本,因此在智能制造和自動化質(zhì)量控制方面的應(yīng)用非常迅速。
關(guān)鍵技術(shù)三(部分素材來源Landing.AI)
從工業(yè)AI視覺1.0時代向工業(yè)AI視覺2.0時代轉(zhuǎn)變的過程,也是工業(yè)AI視覺從“可用”邁向“好用”的過程。
在“可用”的時代,“算法驅(qū)動”是破局的關(guān)鍵,小樣本、AI算法、軟件工具鏈、AI落地方法論這些成為企業(yè)開發(fā)和應(yīng)用工業(yè)AI視覺的關(guān)鍵點。
在“好用”的時代,“以數(shù)據(jù)為中心”逐漸成為共識。高質(zhì)量的數(shù)據(jù)開始作為構(gòu)建強大AI算法的基礎(chǔ),同時,生成式AI算法能夠利用有限的數(shù)據(jù)樣本生成更多的可用數(shù)據(jù),從而可以低成本達成AI模型訓練。
而且,工業(yè)AI視覺2.0時代將更強調(diào)平臺化,構(gòu)建的AI平臺將包裹并整合以往的軟件、工具鏈和方法論等內(nèi)容,解決企業(yè)中碎片化場景的應(yīng)用問題,助力AI技術(shù)在企業(yè)各個分支工廠、不同場景的落地應(yīng)用。
在工業(yè)AI視覺2.0時代的革新浪潮中,阿丘科技希望能夠推動工業(yè)AI視覺平臺及行業(yè)基礎(chǔ)模型在工業(yè)視覺領(lǐng)域的垂直應(yīng)用,降低企業(yè)AI落地成本和難度,幫助企業(yè)實現(xiàn)智能化升級。
工業(yè)視覺AI從1.0時代到2.0時代
三、工業(yè)AI垂直行業(yè)視覺大模型的實踐落地
從2017年創(chuàng)業(yè)以來,阿丘科技始終致力于將先進的人工智能、機器視覺等技術(shù)應(yīng)用于工業(yè)領(lǐng)域的智能化檢測。目前,已落地800+工廠,標準工業(yè)AI視覺軟件批量部署套數(shù)10000+,獲得3C電子、動力電池、PCB等行業(yè)50+標桿客戶的認可。在充滿生機的工業(yè)AI視覺2.0時代,阿丘科技秉持開放的心態(tài),將已實際落地的AI垂直行業(yè)視覺大模型實踐與同行分享。
以工業(yè)視覺大模型在PCB行業(yè)中的實踐為例。
PCB(Printed Circuit Board,印制電路板)是現(xiàn)代電子產(chǎn)品制造中的核心組成部分,被廣泛用于計算機、手機、醫(yī)療設(shè)備、汽車、航空航天等眾多領(lǐng)域,PCB的設(shè)計和制造質(zhì)量直接影響到電子產(chǎn)品的性能。
隨著技術(shù)的發(fā)展,PCB的設(shè)計工藝越來越復雜,缺陷種類多達上百種,根據(jù)產(chǎn)品應(yīng)用場景不同,其檢測情況也存在差異。
由于背景復雜,工藝屬性強,產(chǎn)品尺寸規(guī)格多樣,算法兼容適配難度大。PCB生產(chǎn)廠早期均采用基于傳統(tǒng)算法的AOI(自動光學檢測)和 AVI(自動視覺檢測)設(shè)備檢測PCB缺陷,設(shè)備調(diào)試復雜且誤報率高,需要大量人工對假點復判。平均一臺設(shè)備需要配置3-6名質(zhì)檢人員,人工復判的成本高、一致性差,質(zhì)量難以把控。
針對這些難點,阿丘科技通過構(gòu)建PCB行業(yè)垂直視覺大模型,通過三大步驟,落地實踐。
步驟一,數(shù)據(jù)積累。阿丘科技收集了大量PCB行業(yè)現(xiàn)場的私有化部署缺陷數(shù)據(jù),并進行了部分缺陷的仿真,不僅實現(xiàn)了行業(yè)場景數(shù)據(jù)的積累,還覆蓋了上百種缺陷、細分類別,準確率達到95%以上。同時,基于阿丘科技AIDG智能缺陷生成工具,低成本、快速生成大量的缺陷樣本數(shù)據(jù),滿足大模型訓練的需求。
步驟二:標準定義。阿丘科技對各類出貨檢測標準進行匯總、整理和分級,逐步探索并確定了適用于PCB各交付場景的檢測標準。
步驟三:預制模型訓練。在AOI和AVI等場景中,阿丘科技使預制模型的覆蓋度達到了90%以上。
這一過程極大地提升了交付效率,將原本需要120天的流程縮短至14天。不僅極大縮短了數(shù)據(jù)處理時間,還使得模型可以更快更穩(wěn)地上線。截止目前,阿丘科技AI垂直行業(yè)視覺大模型在PCB行業(yè)已經(jīng)導入了超過 100個工廠,累計升級設(shè)備數(shù)超過1000臺,Top30的PCB客戶覆蓋率達到70%以上。
PCB行業(yè)案例
阿丘科技通過數(shù)據(jù)積累、標準定義和預制模型訓練,成功將AI垂直行業(yè)視覺大模型應(yīng)用于PCB行業(yè),提升了PCB行業(yè)的工業(yè)視覺檢測效率,縮短了交付周期,通過流程優(yōu)化,提高了數(shù)據(jù)處理速度及模型穩(wěn)定性。同時,阿丘科技也會繼續(xù)擴大在工業(yè) AI 垂直行業(yè)的技術(shù)能力,進一步深化和拓展其視覺大模型的應(yīng)用范圍,實現(xiàn)更高效的模型訓練和更精準的缺陷檢測,以滿足市場對快速響應(yīng)和高效生產(chǎn)的需求。
作為AI+工業(yè)先行者,阿丘科技將繼續(xù)保持創(chuàng)新,不斷將最前沿的AI技術(shù)應(yīng)用于工業(yè)領(lǐng)域,為行業(yè)帶來驚艷的AI產(chǎn)品解決方案,推動AI從可用變得好用。攜手行業(yè)伙伴一同推動AI for Every Factory!