国产又爽又湿又色的视频-尼斯拉格波多野结衣按摩被侵-av在线可播放不卡高清无毒免费-久久亚洲精品色噜噜狠狠

logo

您的位置:

新聞中心

AI應用中的重點開源軟件工具和平臺建立及組織協(xié)同實施研發(fā)—— 中科軟技術實踐交流會
時間:2025-07-22 15:39:00

       近日,中科軟以 “AI應用中的重點開源軟件工具和平臺建立及組織協(xié)同實施研發(fā)” 為主題,成功舉辦為期兩天的技術實踐交流會。本次活動旨在推動AI技術在垂直領域的落地應用,聚焦低成本、高精度、強安全特性,展示中科軟在垂直領域小模型研發(fā)、開源工具應用及工程化落地方面的最新成果。
       本次比賽匯聚了來自中國科學院軟件研究所、中國機械工業(yè)工程集團有限公司、大家人壽保險股份有限公司、海保人壽保險股份有限公司、現(xiàn)代財產(chǎn)保險(中國)有限公司、國民養(yǎng)老保險股份有限公司、天津藥鏈智啟供應鏈科技有限公司、東吳人壽保險股份有限公司、中國疾病預防控制中心、陽光財產(chǎn)保險股份有限公司、中融人壽保險股份有限公司、中荷人壽保險有限公司、橫琴人壽保險有限公司、大家保險集團有限公司等科研機構(gòu)、行業(yè)客戶及合作伙伴的專家。不同領域的專家與公司各技術團隊就如何推進AI技術在更多垂直領域的深入應用進行了熱烈討論,并對中科軟的技術成果提出了寶貴的指導意見。

       AI垂直應用邁向規(guī)?;涞氐年P鍵窗口期 小模型與知識庫成破局關鍵
       在推理成本下降與國家戰(zhàn)略級政策紅利的共同驅(qū)動下,我國垂直行業(yè)AI應用正進入規(guī)模化落地的關鍵窗口期。AI 技術正從通用探索邁向業(yè)務融合階段,帶來軟件開發(fā)范式的變革與應用體系的重構(gòu)。企業(yè)對 AI 應用的需求逐漸聚焦于強安全、高精度和低成本,即保障數(shù)據(jù)隱私安全、滿足場景化精準計算需求、降低部署與運行成本。在此背景下,AIGC 在行業(yè)領域落地應用的重心從通用大模型轉(zhuǎn)向 “垂直領域小模型 + 專業(yè)知識庫” 的組合模式。
       小模型與知識庫成為 AI 垂直落地破局關鍵,核心在于垂直場景對領域適配性、數(shù)據(jù)安全、成本控制的嚴苛要求。大模型雖具備通用能力,但在垂直領域存在隱私風險高、部署成本高、領域知識深度不足等問題;而小模型依托輕量化特性可實現(xiàn)本地化部署,結(jié)合沉淀了垂直領域?qū)I(yè)知識的知識庫,能精準適配保險核保理賠、醫(yī)療診斷輔助等行業(yè)場景,解決通用技術在垂直場景中 “水土不服” 的問題,成為連接 AI 技術與行業(yè)需求的核心紐帶。

       聚焦開源工具與工程化方法 筑牢落地根基
       開源軟件工具和平臺在AI快速形成應用效果中扮演著重要的支撐角色。頭部ISV應熟練運用不斷迭代的開源軟件工具,包括流程框架、硬件軟件配置、外部調(diào)用方式及專項函數(shù)庫特性,尤其需關注多模態(tài)數(shù)據(jù)語義計算平臺的應用。中科軟各技術團隊在交流中展示了利用開源軟件工具和平臺作為支撐環(huán)境,在數(shù)據(jù)標注預處理、模型微調(diào)、提示詞工程優(yōu)化、專業(yè)知識庫建立等環(huán)節(jié)取得的成果與實踐,驗證了垂直領域的小模型結(jié)合專業(yè)知識庫構(gòu)建(如保險行業(yè)的條款解析和業(yè)務流程梳理等)能夠進一步提升AI技術與業(yè)務的適配性和落地效果。
       小模型落地需具備系統(tǒng)化的工程方法,考驗工程化方法的可操作性、完整性和系統(tǒng)化方法論,包括垂直領域知識加持下的數(shù)據(jù)約束和格式、微調(diào)描述框架、提示詞規(guī)范等關鍵環(huán)節(jié),涉及數(shù)據(jù)層、模型層、應用層的多個系統(tǒng)化層級:
       •    數(shù)據(jù)層:規(guī)范數(shù)據(jù)約束與格式,處理多結(jié)構(gòu)語料(如保險條款切分、多模態(tài)信息提?。?,強化基于領域知識的數(shù)據(jù)清洗與標注,加強半結(jié)構(gòu)化數(shù)據(jù)集建設;
       •    模型層:建立微調(diào)描述框架與提示詞規(guī)范,實現(xiàn)垂直模型的精準微調(diào)與推理部署;
       •    應用層:支持客戶端技術遷移、組件組裝及二次開發(fā),在 “多自由度” 工具選擇中形成收斂性落地框架,保證高質(zhì)量的應用效果。

       成果展示:場景化結(jié)合顯成效 團隊競技展實力
       在比賽過程中,中科軟展示了其在MaaS(Model as a Service)平臺上的研發(fā)積累,包括底層資源適配、垂直模型微調(diào)推理部署以及智能助手開發(fā)等能力。今年,中科軟更加聚焦于垂直業(yè)務領域,打造精確專業(yè)的業(yè)務知識庫,并繼續(xù)優(yōu)化和拓展大模型應用邊界。
       經(jīng)過技術成果展示與問答交流,壽險團隊的“智瞳平臺”與財險團隊的“智數(shù)平臺”案例脫穎而出。這兩個優(yōu)秀案例在小模型場景適配性、開源工具應用合理性及工程化完整性等方面具備較為突出的表現(xiàn)。
       ?    壽險-智瞳平臺
       保險領域的AI產(chǎn)品包羅萬象,如何選擇正確場景將機會轉(zhuǎn)化為產(chǎn)品是需要深度思考的核心問題。在IT部門推動 “提升國產(chǎn)開源軟件占比” 與業(yè)務部門期望 “加速智能化轉(zhuǎn)型、降低人工錄入錯誤率” 的雙重需求背景下,兩個部門目標的融合,為智瞳平臺的誕生與發(fā)展提供了堅實基礎。
       為確保平臺有效落地,團隊對現(xiàn)有開源產(chǎn)品進行了深入調(diào)研與對比。結(jié)果顯示,國內(nèi)主流開源產(chǎn)品中,大部分AI開源模型在通用場景表現(xiàn)尚可,但在保險業(yè)務領域卻存在不足。具體體現(xiàn)在識別準確率偏低、大尺寸圖像內(nèi)容識別不全、復雜表格信息粘連等關鍵問題上。
       針對這些挑戰(zhàn),智瞳平臺制定了“領域知識注入 + 工程化深度優(yōu)化” 的針對性解決方案。
       平臺整合OCR和SLM小模型,搭建了平臺的基礎部分,包含視覺分析、智維重構(gòu)、智能提取和智能核驗等功能,為核心系統(tǒng)提供非結(jié)構(gòu)化輸入和查詢能力。后續(xù)隨著更多對接,可以將非結(jié)構(gòu)化能力,輻射到壽險領域內(nèi)其他系統(tǒng),助力公司實現(xiàn)智能化轉(zhuǎn)型。
       平臺采用公開數(shù)據(jù)與業(yè)務自標注數(shù)據(jù)雙源輸入,因平臺采用多模型分布式架構(gòu),需為每個子模型獨立配置標注數(shù)據(jù)集。數(shù)據(jù)經(jīng)過噪聲過濾、數(shù)值歸一化、格式標準化等預處理后,與場景化微調(diào)指令集(含任務描述/輸入輸出范例)共同輸入模型。訓練中通過驗證數(shù)據(jù)集實時監(jiān)控效果,若發(fā)現(xiàn)欠擬合: 優(yōu)先調(diào)整學習率/訓練輪數(shù)等超參數(shù)進行迭代;若超參優(yōu)化無效,則回溯至數(shù)據(jù)層——擴充訓練集規(guī)?;蛐拚龢俗⒁?guī)則;完成優(yōu)化后重新啟動預處理-訓練-評估閉環(huán),直至滿足工業(yè)級精度要求。
       在推動開源軟件的實際應用集成過程中,觀察到其專項性優(yōu)勢顯著。例如在基準測試中達到了比較高的召回率。然而,在復雜真實的業(yè)務場景落地時,其局限性也顯現(xiàn)出來:核心痛點集中在結(jié)構(gòu)化信息抽取環(huán)節(jié)。具體表現(xiàn)為:1) 對無邊框表格內(nèi)容基本無法識別;2) 圖像中文字或元素存在視覺粘連時,識別準確率顯著下降。這些問題直接導致關鍵信息抽取響應時間延長,甚至出現(xiàn)抽取錯誤,嚴重影響了業(yè)務流程的效率和可靠性。
       針對上述開源方案在實際集成中的關鍵能力缺口,在落地應用環(huán)節(jié)引入了‘智維重構(gòu)’作為核心補充。該方案特別強化了對復雜版面結(jié)構(gòu)(尤其是無邊框表格)的解析能力,并有效解決了視覺粘連導致的識別歧義問題,從而在整體上提升了集成解決方案的魯棒性和信息抽取精度,確保了業(yè)務需求的有效滿足。
    “智維重構(gòu)”方案解決無邊框表格識別和視覺粘連問題,其核心流程包含四步:行列聚類、粘連文本分割、表格重組和文本填充。
       行列聚類是第一步,旨在將識別引擎輸出的離散、無序文本框組織成潛在的行列矩陣。團隊采用DBSCAN密度聚類算法,因其能有效處理不規(guī)則分布和噪聲(如文本框疏密不一、缺失或錯位)。
       聚類依據(jù)文本框的幾何中心點空間特征。DBSCAN的核心參數(shù)鄰域半徑 (Eps) 定義了判斷文本框是否同屬一行/列的距離閾值。算法分析中心點密度,自動將鄰近文本框聚集成簇,形成行列分組。
       此步驟將離散文本框初步組織成結(jié)構(gòu)化行列矩陣框架(如成功識別出5行x11列矩陣雛形),為后續(xù)重構(gòu)奠定關鍵結(jié)構(gòu)基礎。
        粘連文本分割步驟解決因字符間距極小、筆畫重疊或背景干擾導致的文本粘連問題(即多個單元格內(nèi)容被錯誤合并為一個文本框)。為此,團隊引入基于深度學習的語義分割模型(SLM),對行列聚類后的區(qū)域進行精細化處理:
       識別粘連區(qū)域: SLM 依據(jù)語義和視覺上下文,精準定位行列矩陣中的不合理粘連區(qū)域。
       執(zhí)行語義分割: 對粘連區(qū)域進行像素級分割,在視覺和語義層面精確區(qū)分粘連文本。
       拆分與重定位: 根據(jù)分割結(jié)果和原始坐標,將粘連文本塊拆分為獨立的單元格文本單元,并生成精確的新邊界框。
       分割完成后,系統(tǒng)觸發(fā)受影響區(qū)域的重新聚類,確保新拆分的文本框被正確融入原有行列結(jié)構(gòu),形成校正后、結(jié)構(gòu)完整且邊界清晰的行列矩陣。
       最后一步,根據(jù)矩陣中的坐標信息,給表格重新畫線,再進行文本回填。最終,形成一個沒有空白單元格,5行10列的完整表格。
       ?    財險-智數(shù)平臺
       在數(shù)字化浪潮下,人工智能(AI)與商業(yè)智能(BI)技術的迅猛發(fā)展正推動眾多企業(yè)加速邁入自助式數(shù)據(jù)分析的新階段。然而,在這一過程中,企業(yè)仍面臨著諸多挑戰(zhàn),如分析門檻高、被動接受需求導致的需求響應周期長、分析深度不足等問題,這些問題在保險行業(yè)尤為突出。作為數(shù)據(jù)密集型行業(yè),保險行業(yè)擁有海量且復雜的業(yè)務數(shù)據(jù),但傳統(tǒng)的數(shù)據(jù)分析方法難以充分挖掘這些數(shù)據(jù)的潛在價值。因此,中科軟憑借在保險行業(yè)的深厚積淀和對人工智能技術的深入研究,構(gòu)建了一個面向保險行業(yè)的數(shù)據(jù)分析智能體平臺——智數(shù)平臺,旨在解決保險企業(yè)在數(shù)據(jù)分析過程中所面臨的難題,提升數(shù)據(jù)分析效率和質(zhì)量,助力保險行業(yè)的數(shù)字化轉(zhuǎn)型和智能化發(fā)展。
       智數(shù)平臺(idata)基于微服務架構(gòu)和開源技術棧(Langchain4J+Milvus)構(gòu)建,平臺聚焦四大核心模塊:指標知識圖譜管理、知識庫管理、智能體管理以及平臺基礎配置,核心功能如下:
       知識管理:包括指標知識圖譜及知識庫管理兩大模塊。其中指標知識圖譜管理,主要包括指標定義、維度定義、指標血緣、元數(shù)據(jù)映射及權限管理等功能,實現(xiàn)指標的語義統(tǒng)一以及語義查詢的轉(zhuǎn)化,以保障數(shù)據(jù)的高精度和強管控;知識庫管理主要包括文檔知識庫管理、向量庫管理、術語管理、分段管理及召回演練等功能,實現(xiàn)了多模態(tài)知識整合,支持知識的持續(xù)學習和熱更新,同時打通了指標知識圖譜與知識庫管理的雙向互動。
       智能體管理:智能體構(gòu)建平臺主要包括流程編排、記憶管理、知識庫接入及對外集成等功能。除提供開箱即用的數(shù)據(jù)分析智能體之外,還具備個性化定制適配能力。
       多模型適配能力:智數(shù)平臺采用開放式AI架構(gòu),全面兼容主流云服務大模型(如DeepSeek、文心一言、Qwen系列等)及企業(yè)私有化部署模型,在確保數(shù)據(jù)安全合規(guī)的同時,為保險業(yè)務場景提供最優(yōu)的AI分析能力支撐。
       在數(shù)據(jù)分析智能體的構(gòu)建與應用中,平臺沉淀出以下最佳實踐,形成可復用的方法論體系:
       •    統(tǒng)一語義管理,通過指標管理模塊建立標準化語義體系,提升分析準確性、可解釋性與可比性
       保險行業(yè)存在著大量的專業(yè)術語和領域指標,這些術語和指標在不同的業(yè)務場景和數(shù)據(jù)源中可能會有不同的表達方式,這給數(shù)據(jù)分析帶來了很大的困難。依托中科軟30年深耕保險行業(yè)所積累的豐富領域知識,通過將這些領域知識與人工智能技術相結(jié)合,智數(shù)平臺通過指標管理模塊實現(xiàn)統(tǒng)一語義的管理。通過指標管理,智數(shù)平臺對這些術語和指標進行了標準化和統(tǒng)一化處理,建立了一個清晰、一致的語義體系,不僅提高了數(shù)據(jù)分析的準確性,還增強了數(shù)據(jù)分析結(jié)果的可解釋性和可比性。
       •    知識內(nèi)容熱更新,實時轉(zhuǎn)化指標與對話信息,保證知識信息的質(zhì)量和時效
       傳統(tǒng)開源知識庫管理工具依賴于手工上傳文檔進行更新,為了提升知識更新的及時性和準確性,平臺對現(xiàn)有的開源知識庫管理工具進行優(yōu)化升級,實現(xiàn)知識的實時熱更新,極大地提高了知識更新的效率,減少人工干預的繁瑣流程,降低人力成本和時間成本。通過自動化的更新機制,可以有效避免因人為疏忽導致的信息不一致問題,增強知識庫內(nèi)容的準確性和可信度。實時更新機制能夠確保知識庫內(nèi)容始終與企業(yè)的實際業(yè)務數(shù)據(jù)保持同步,為員工提供最新、最準確的知識支持,從而提升企業(yè)的整體運營效率和決策質(zhì)量。
       •    多路知識檢索,融合KV精準檢索與向量檢索,精準理解業(yè)務語義,高質(zhì)量召回領域知識
       基于對數(shù)據(jù)分析場景用戶問數(shù)行為的深入分析,發(fā)現(xiàn)約30%的查詢中涉及的指標或維度表述相對精準,在知識召回策略上進行了優(yōu)化設計:
       優(yōu)先采用KV精準檢索機制,當用戶查詢中的關鍵要素(如指標名、維度名)能夠與知識庫中的詞根、術語完全匹配時,直接召回對應的結(jié)構(gòu)化知識內(nèi)容;而對于表述不夠完整或模糊的查詢,則啟動混合檢索模式,結(jié)合向量檢索和分段檢索等方式進行擴展召回,確保最大程度覆蓋用戶意圖。
       通過多模態(tài)知識存儲、多路檢索策略、語義理解增強和生成優(yōu)化等技術創(chuàng)新,顯著提升了保險數(shù)據(jù)分析的檢索效率和語義理解精準度。
       整個流程形成了從問題理解到知識檢索再到內(nèi)容生成的閉環(huán)優(yōu)化體系,既充分利用了結(jié)構(gòu)化知識的確定性優(yōu)勢,又通過大模型的語義理解能力彌補了用戶查詢的不完整性,最終實現(xiàn)了保險數(shù)據(jù)分析場景下高精度、高效率的智能數(shù)據(jù)查詢。
       •    基于指標體系的轉(zhuǎn)義路徑,將自然語言需求自動轉(zhuǎn)化為指標查詢語言(MQL)及SQL,實現(xiàn)語義的精準轉(zhuǎn)化
       數(shù)據(jù)分析的智能體,最終都會同數(shù)據(jù)庫進行交互,進行指標數(shù)據(jù)的查詢。借助大模型的能力以及自身指標模塊的能力,平臺實現(xiàn)了從內(nèi)容檢索結(jié)果到MQL生成,再到SQL生成的完整流程路徑。該流程通過結(jié)合大模型的語義理解能力和指標管理模塊的精確控制,來提供安全、高效的數(shù)據(jù)查詢服務。
       這一模式的核心在于將自然語言處理技術與保險行業(yè)的專業(yè)語言體系相結(jié)合,使用戶能夠以自然語言的方式表達數(shù)據(jù)分析需求,而平臺則能夠自動將其轉(zhuǎn)化為指標查詢語言,并進一步轉(zhuǎn)換為數(shù)據(jù)庫查詢語言,從而實現(xiàn)對保險數(shù)據(jù)的高效查詢和分析。這種路徑在保證數(shù)據(jù)安全有效管控的前提下,不僅降低了數(shù)據(jù)分析的門檻,使非技術人員也能夠輕松地進行數(shù)據(jù)分析,而且在數(shù)據(jù)庫查詢過程中,根據(jù)指標熱度情況進行預計算處理,有效提升數(shù)據(jù)查詢的準確性和效率,能夠快速響應保險業(yè)務中的各種復雜查詢需求。
 
       未來展望:打造廣義行業(yè)應用軟件 深化垂直領域AI應用
       本次比賽的成功舉辦,不僅促進了中科軟不同團隊間在AI應用領域的技術成果交流,還加強了與客戶、合作伙伴和研究機構(gòu)的溝通。參與評審的專家對中科軟的技術成果給予了充分肯定,并對公司加大各解決方案的落地力度,推進技術與業(yè)務的深度融合,早日釋放更大業(yè)務價值提出了更高的期望。
       未來,中科軟將充分發(fā)揮領域知識與工程化實施經(jīng)驗等優(yōu)勢,持續(xù)深化垂直領域小模型應用,聯(lián)合上下游伙伴,共同服務客戶,支持遠端大模型與本地私有化小模型對接,融入多模態(tài)知識庫管理,結(jié)合提示詞工程、數(shù)據(jù)集建設等能力,推動AI與核心業(yè)務系統(tǒng)群等已有應用軟件的融合,擴展為廣義行業(yè)應用軟件系統(tǒng)群,幫助行業(yè)客戶在保障信息安全的前提下,實現(xiàn)更高效、精準的AI落地能力。