AI開放平臺主要是通過訓(xùn)練模型實(shí)現(xiàn)個(gè)場景的智能化管理,而其中的開放能力是很重要的,目前??低旳I開放平臺支持的開放能力有文字識別、語音識別和車輛識別,他們分別有哪些特點(diǎn)呢?下面一起來了解下吧!
1、文字識別
通用場景:提供多場景、多語種、高精度的整圖文字檢測和識別。通用場景可進(jìn)行ppt識別、停車場車位編號識別、城管識別、快遞單文字識別、高速列車車廂編號識別、公司名稱識別、印章識別、表格文字識別等,具備分析帶文字圖片的相關(guān)數(shù)據(jù)能力。
交通場景:對交通場景中所涉及的與車輛相關(guān)的各類證件進(jìn)行結(jié)構(gòu)化識別,包括行駛證識別、駕駛證識別、車牌識別等。對機(jī)動(dòng)車行駛證主頁及副頁進(jìn)行結(jié)構(gòu)化識別,提取車輛識別代號、發(fā)證日期、車輛類型、使用性質(zhì)、號牌號碼、注冊日期等信息;對機(jī)動(dòng)車駕駛證主頁及副頁進(jìn)行結(jié)構(gòu)化識別,提取駕駛證所屬人的姓名;對機(jī)動(dòng)車車牌進(jìn)行識別,提取車牌號碼。
2、語音識別
短語音識別:將≤60秒短音頻精準(zhǔn)識別成文字,結(jié)果實(shí)時(shí)返回,達(dá)到邊說邊返回的效果,可用于智能語音交互,如語音命令、語音搜索等場景。
實(shí)時(shí)語音識別:將長段音頻數(shù)據(jù)實(shí)時(shí)轉(zhuǎn)換成文本數(shù)據(jù),可支持智能斷句,可用于會議記錄、新聞發(fā)布會等場景。支持中英文數(shù)字的混合識別。
3、卡證票據(jù)識別
提供對常用卡證及票據(jù)的文字內(nèi)容進(jìn)行結(jié)構(gòu)化識別的服務(wù),包括身份證識別、銀行卡識別、營業(yè)執(zhí)照識別等。對各類票據(jù)進(jìn)行識別,提取發(fā)票號碼、開票日期、金額、單價(jià)等信息。
4、語音合成
將文字信息轉(zhuǎn)化為聲音信息,提供自然流暢、高度仿真的語音合成服務(wù),實(shí)現(xiàn)人機(jī)交互,讓應(yīng)用“開口說話”。支持多種參數(shù)配置,對語速、語調(diào)、音量進(jìn)行靈活配置,滿足個(gè)性化需求,提供標(biāo)準(zhǔn)的API接口,將文本轉(zhuǎn)換為可以播放的音頻文件,方便發(fā)起請求的設(shè)備進(jìn)行合成。
5、車輛檢測
對車輛特征進(jìn)行分析、提取車輛的位置,支持識別各種車牌類型車牌號、車身顏色、車型、品牌、年款等多種信息。提取車輛并返回車輛的精確坐標(biāo)位置。
6、車輛交通屬性識別
對圖像中車輛的交通屬性進(jìn)行識別,包括主副駕駛員行為、車輛固定標(biāo)志等。主要包括行為識別,如主副駕駛是否系安全帶、是否打電話等行為;標(biāo)志識別,如車輛是否帶有危險(xiǎn)品標(biāo)志、是否為黃標(biāo)車等特征進(jìn)行識別。
以上是AI開放平臺具備的開放能力介紹,可廣泛應(yīng)用于各類智能場景,需要的朋友可聯(lián)系在線客服咨詢,更多AI開放平臺的應(yīng)用或功能介紹,請繼續(xù)關(guān)注慧翼科技了解。
咨詢熱線
199 3816 2940