2021-07-14 09:30:46
來(lái)源:愛(ài)集微APP
7月13日晚,證監(jiān)會(huì)官微發(fā)布消息稱,證監(jiān)會(huì)按法定程序同意北京海天瑞聲科技股份有限公司(以下簡(jiǎn)稱“海天瑞聲”)科創(chuàng)板首次公開(kāi)發(fā)行股票注冊(cè),海天瑞聲及其承銷商將分別與上海證券交易所協(xié)商確定發(fā)行日程,并陸續(xù)刊登招股文件。
海天瑞聲主要從事訓(xùn)練數(shù)據(jù)的研發(fā)設(shè)計(jì)、生產(chǎn)及銷售業(yè)務(wù)。發(fā)行人通過(guò)設(shè)計(jì)數(shù)據(jù)集結(jié)構(gòu)、組織數(shù)據(jù)采集、對(duì)取得的原料數(shù)據(jù)進(jìn)行加工,最終形成可供AI算法模型訓(xùn)練使用的專業(yè)數(shù)據(jù)集,通過(guò)軟件形式向客戶交付。海天瑞聲所屬行業(yè)為軟件和信息技術(shù)服務(wù)業(yè)。算法、算力、數(shù)據(jù)是人工智能技術(shù)發(fā)展的三大要素,其中訓(xùn)練數(shù)據(jù)是算法發(fā)展和演進(jìn)的“燃料”。
海天瑞聲是中國(guó)語(yǔ)音類基礎(chǔ)數(shù)據(jù)服務(wù)領(lǐng)域的頭部企業(yè)。根據(jù)艾瑞咨詢出具的《2020年中國(guó)AI基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)研究報(bào)告》,海天瑞聲在中國(guó)語(yǔ)音類基礎(chǔ)數(shù)據(jù)服務(wù)領(lǐng)域企業(yè)中營(yíng)收份額占比排名第一。按數(shù)據(jù)類型劃分,中國(guó)基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)的市場(chǎng)需求可以分為語(yǔ)音類數(shù)據(jù)需求、圖像類數(shù)據(jù)需求和自然語(yǔ)言處理類數(shù)據(jù)需求。現(xiàn)階段國(guó)內(nèi)基礎(chǔ)數(shù)據(jù)服務(wù)商以提供圖像類數(shù)據(jù)和語(yǔ)音類數(shù)據(jù)服務(wù)的公司為主。
在當(dāng)前技術(shù)發(fā)展進(jìn)程中,深度學(xué)習(xí)算法是推動(dòng)人工智能技術(shù)取得突破性發(fā)展的關(guān)鍵技術(shù)理論,而大量訓(xùn)練數(shù)據(jù)的訓(xùn)練支撐則是深度學(xué)習(xí)算法實(shí)現(xiàn)的基礎(chǔ)。深度學(xué)習(xí)分為“訓(xùn)練”和“推斷”兩個(gè)環(huán)節(jié):訓(xùn)練需要海量數(shù)據(jù)輸入,訓(xùn)練出一個(gè)復(fù)雜的深度神經(jīng)網(wǎng)絡(luò)模型;推斷指利用訓(xùn)練好的模型,去“推斷”現(xiàn)實(shí)場(chǎng)景中的待判斷數(shù)據(jù),并得出各種結(jié)論。訓(xùn)練數(shù)據(jù)越多、越完整、質(zhì)量越高,模型推斷的結(jié)論越可靠。因此,要使算法模型實(shí)現(xiàn)從技術(shù)理論到應(yīng)用實(shí)踐的落地過(guò)程,就需要提供大量的訓(xùn)練數(shù)據(jù),對(duì)算法模型加以訓(xùn)練。
通常,從自然數(shù)據(jù)源簡(jiǎn)單收集取得的原料數(shù)據(jù)并不能直接用于深度學(xué)習(xí)算法的訓(xùn)練,必須經(jīng)過(guò)專業(yè)化的采集、加工處理,形成相應(yīng)的工程化數(shù)據(jù)集后才能供深度學(xué)習(xí)算法等算法、模型訓(xùn)練使用。海天瑞聲是我國(guó)領(lǐng)先的訓(xùn)練數(shù)據(jù)專業(yè)提供商。自2005年成立以來(lái),海天瑞聲始終致力于為AI產(chǎn)業(yè)鏈上的各類機(jī)構(gòu)提供算法模型開(kāi)發(fā)訓(xùn)練所需的專業(yè)數(shù)據(jù)集。
海天瑞聲所提供的訓(xùn)練數(shù)據(jù)覆蓋智能語(yǔ)音(語(yǔ)音識(shí)別、語(yǔ)音合成等)、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言等多個(gè)核心領(lǐng)域,全面服務(wù)于人機(jī)交互、智能駕駛、智慧城市等多種創(chuàng)新應(yīng)用場(chǎng)景。其中智能語(yǔ)音為海天瑞聲的優(yōu)勢(shì)領(lǐng)域,產(chǎn)品線已包含160余個(gè)主要語(yǔ)種及方言。海天瑞聲的產(chǎn)品和服務(wù)已獲得阿里巴巴、騰訊、百度、科大訊飛、海康威視、微軟、亞馬遜、三星等國(guó)內(nèi)外客戶的認(rèn)可,應(yīng)用于其研發(fā)的個(gè)人助手、智能音箱、語(yǔ)音導(dǎo)航、搜索服務(wù)、智能駕駛、機(jī)器翻譯等多種產(chǎn)品相關(guān)的算法模型訓(xùn)練過(guò)程中。目前海天瑞聲客戶累計(jì)數(shù)量超500家,覆蓋了主要的大型科技公司、人工智能企業(yè)及科研機(jī)構(gòu)。
在多年經(jīng)營(yíng)中,海天瑞聲高度重視自身核心技術(shù)優(yōu)勢(shì)的構(gòu)建,在基礎(chǔ)研究和產(chǎn)品研發(fā)兩個(gè)維度持續(xù)投入。憑借多年研發(fā)積累,公司已經(jīng)構(gòu)筑了較為明顯的核心技術(shù)先進(jìn)性,主要體現(xiàn)在下述方面:
1、算法與數(shù)據(jù)處理技術(shù)并用:海天瑞聲已掌握12項(xiàng)核心技術(shù),通過(guò)算法與數(shù)據(jù)處理技術(shù)并用,可以滿足算法在不同應(yīng)用場(chǎng)景下的訓(xùn)練數(shù)據(jù)需求,可對(duì)大規(guī)模數(shù)據(jù)進(jìn)行高效的加工或質(zhì)檢。截至2020年12月31日,海天瑞聲已積累760余個(gè)自有知識(shí)產(chǎn)權(quán)的訓(xùn)練數(shù)據(jù)產(chǎn)品,可提供超過(guò)160余個(gè)語(yǔ)種/方言的訓(xùn)練數(shù)據(jù)。
2、工具和平臺(tái)共建:海天瑞聲自主開(kāi)發(fā)了一體化數(shù)據(jù)處理平臺(tái),融入項(xiàng)目流程管理、質(zhì)量把控、數(shù)據(jù)安全管理,嵌入生產(chǎn)所需的各類工具、軟件模塊,可實(shí)現(xiàn)高效、高質(zhì)的訓(xùn)練數(shù)據(jù)生產(chǎn),提升生產(chǎn)效率及質(zhì)量控制水平。
3、在語(yǔ)音語(yǔ)言學(xué)基礎(chǔ)研究方面有深厚積累:海天瑞聲建立了成熟的發(fā)音詞典構(gòu)建流程、積累了深厚的語(yǔ)音語(yǔ)言學(xué)基礎(chǔ)研究成果。截至目前,海天瑞聲的產(chǎn)品/服務(wù)已覆蓋160余個(gè)語(yǔ)種/方言,已積累下超過(guò)100個(gè)語(yǔ)種/方言的發(fā)音詞典,累計(jì)詞條數(shù)超過(guò)1,000萬(wàn)條,可構(gòu)建高質(zhì)量的智能語(yǔ)音訓(xùn)練數(shù)據(jù)。
截至目前,海天瑞聲已經(jīng)取得24項(xiàng)發(fā)明專利、1項(xiàng)實(shí)用新型專利授權(quán)及1項(xiàng)外觀設(shè)計(jì)專利授權(quán),134項(xiàng)計(jì)算機(jī)軟件著作權(quán),另有2項(xiàng)專利已提交申請(qǐng)。多年積累的核心技術(shù)和專業(yè)服務(wù)能力,使得海天瑞聲能夠更大規(guī)模、更有效率、更加精準(zhǔn)地生產(chǎn)訓(xùn)練數(shù)據(jù),在提升自身產(chǎn)出效率的同時(shí)也有效提高了訓(xùn)練數(shù)據(jù)對(duì)于客戶算法模型的改善、優(yōu)化效果。按照產(chǎn)品和服務(wù)的具體類型劃分,海天瑞聲的主營(yíng)業(yè)務(wù)可分為訓(xùn)練數(shù)據(jù)定制服務(wù)、訓(xùn)練數(shù)據(jù)產(chǎn)品和訓(xùn)練數(shù)據(jù)相關(guān)的應(yīng)用服務(wù)。( 校對(duì)/James)
關(guān)鍵詞: 證監(jiān)會(huì) 海天瑞聲 科創(chuàng)板 IPO注冊(cè)
發(fā)布于
美股集體收漲 道瓊斯指數(shù)上漲182.96點(diǎn)
發(fā)布于
發(fā)布于
盤中一度下跌2.7%!美國(guó)超大型科技股周二盤前走高
發(fā)布于
連接出現(xiàn)問(wèn)題?LME遲未開(kāi)盤
發(fā)布于