獲取語言數(shù)據(jù)提供程序Datamundi摘要
2021年12月15日,波蘭總部成立語言服務(wù)提供商 語言峰會(huì)宣布收購(gòu)比利時(shí)語言數(shù)據(jù)提供商Datamundi。
Datamundi向NLP系統(tǒng)構(gòu)建者提供所有語言的語言數(shù)據(jù),NLP系統(tǒng)構(gòu)建者使用這些數(shù)據(jù)來創(chuàng)建和增強(qiáng)其機(jī)器翻譯(MT)引擎或優(yōu)化搜索相關(guān)性。它的客戶群以被稱為“FAMGA”的大型科技集團(tuán)為中心,F(xiàn)acebook、蘋果、微軟、谷歌和亞馬遜。
語言CEO峰會(huì) 克里斯托夫·茲達(dá)諾夫斯基告訴Slator,Datamundi在出售前由Gert Van Assche(管理合伙人)和他的妻子所有。他說:“Datamundi在2021年早些時(shí)候與我們聯(lián)系,當(dāng)時(shí)他們決定啟動(dòng)退出程序”,“我們的報(bào)價(jià)已被選為中標(biāo)人?!?。
這筆交易將使Summa Linguae為Datamundi支付500萬歐元(570萬美元),或收入的2.5倍。收購(gòu)資金來自Summa Linguae自有資金——150萬歐元股票和350萬歐元現(xiàn)金。
Summa Linguae創(chuàng)收 2020年8850萬茲羅提(2370萬美元),較2019年增長(zhǎng)13.2%。Datamundi的收入減少了好幾倍,為200萬歐元(230萬美元)。斯萊托公司的首席執(zhí)行官表示,盡管在2021年,該公司的年收入增長(zhǎng)率保持在40%,而在2021年,該公司的年收入增長(zhǎng)率保持在50%。
根據(jù)Zdanowski的說法,Datamundi將被整合到Summa Linguae的品牌之下,“2021年的預(yù)計(jì)合并收入在2600萬至2700萬美元之間?!盨umma Linguae的目標(biāo)是在2022年實(shí)現(xiàn)15-20%的增長(zhǎng),與往年保持一致。
Van Assche是一位行業(yè)資深人士,他將加入Summa Linguae擔(dān)任CTO,而Datamundi的經(jīng)理、開發(fā)人員、數(shù)據(jù)科學(xué)家和程序經(jīng)理也將留任。
聲音、圖像、語言
在Datamundi與Summa Linguae取得聯(lián)系之前,兩人之前沒有任何關(guān)系,但彼此都認(rèn)識(shí),因?yàn)樗麄兊目蛻艚M合中有一個(gè)共享客戶,他們?yōu)樗麄兲峁┝瞬煌姆?wù)。
Zdanowski解釋了收購(gòu)背后的理由,他說“Datamundi很好地補(bǔ)充了我們的數(shù)據(jù)解決方案組合?!眘ummalinguae以前專注于語音和圖像數(shù)據(jù),而Datamundi的唯一關(guān)注點(diǎn)是語言數(shù)據(jù)。
自2017年以來,Summa Linguae一直將其戰(zhàn)略重點(diǎn)轉(zhuǎn)向數(shù)據(jù)解決方案,數(shù)據(jù)解決方案已成為業(yè)務(wù)中越來越重要的一部分。Zdanowski將收購(gòu)Datamundi形容為“這條道路上的又一個(gè)里程碑”,并表示Datamundi專注于FAMGA客戶群,這與該公司為全球大型客戶提供服務(wù)的戰(zhàn)略完全一致。
收購(gòu)加拿大總部2019年數(shù)據(jù)注釋公司Globalme,Summa Linguae已經(jīng)增加了其數(shù)據(jù)服務(wù)能力,通過Globalme交易獲得了數(shù)據(jù)收集服務(wù)、后處理平臺(tái)、專有項(xiàng)目和工作流工具以及自動(dòng)化技術(shù)。
在Summa Lingae的并購(gòu)路線圖上,Zdanowski表示,“考慮到我們股權(quán)結(jié)構(gòu)的性質(zhì)(Summa的多數(shù)股權(quán)歸PE所有),我們不能排除在2022年進(jìn)行另一次收購(gòu)。鈥 他補(bǔ)充道,鈥渨我們一直在尋找優(yōu)秀的公司來補(bǔ)充我們的投資組合。鈥
據(jù)首席執(zhí)行官說,在收購(gòu)Datamundi之后,鈥渙超過70%的舌尖鈥檚 收入將來自非本地化工作,幾乎全部來自美國(guó)客戶。鈥
數(shù)據(jù)解決方案需求
Datamundi在語言數(shù)據(jù)方面的經(jīng)驗(yàn)非常豐富。同時(shí),科學(xué)家們還引入了人工數(shù)據(jù)的標(biāo)注、自動(dòng)數(shù)據(jù)對(duì)齊和數(shù)據(jù)過濾、數(shù)據(jù)標(biāo)注和版本調(diào)整。
Zdanowski表示,對(duì)Datamundi的需求鈥檚 服務(wù)包括數(shù)據(jù)標(biāo)記、人工翻譯和機(jī)器翻譯輸出質(zhì)量評(píng)估,以及自動(dòng)數(shù)據(jù)對(duì)齊和標(biāo)記鈥渙只是在成長(zhǎng)。鈥
Datamundi有一個(gè)內(nèi)部使用的數(shù)據(jù)注釋平臺(tái)。它沒有獲得外部許可,但可以在自助服務(wù)的基礎(chǔ)上提供給客戶。該平臺(tái)作為一個(gè)生產(chǎn)環(huán)境來支持項(xiàng)目管理和自由職業(yè)者的任務(wù)。
盡管該平臺(tái)包含許多自動(dòng)化功能鈥 比如一個(gè)人工智能工具來檢測(cè)網(wǎng)站上的色情內(nèi)容,模式檢測(cè),以及一個(gè)對(duì)齊工具鈥 Zdanowski說,這個(gè)平臺(tái)主要是為人類注釋者設(shè)計(jì)的,他還補(bǔ)充說鈥渦ses一系列技術(shù)來檢測(cè)潛在的欺詐行為和QA自由職業(yè)者鈥 輸出。鈥
指出任務(wù)如何鈥渂同時(shí)也是非常專業(yè)的,鈥 Summa Linguae首席執(zhí)行官說,鈥渃留置權(quán)遠(yuǎn)遠(yuǎn)超過了前10名鈥 15種語言,并在其他語言中構(gòu)建更多的NLP技術(shù),包括利基語言,這給我們帶來了額外的挑戰(zhàn)和機(jī)遇。鈥
Summa Linguae在交易中由CK Legal Chabasiewicz、Kowalska i Partnerzy(波蘭)和Novius(比利時(shí))擔(dān)任顧問。