語音合成技術(shù)已進(jìn)入到人們的日常生活,有聲閱讀、智能客服、智能家居等場(chǎng)景都已經(jīng)出現(xiàn)了“它”的身影。有情感的聲音,賦予機(jī)器生命感,讓人機(jī)交互更美好、簡(jiǎn)單。
5月28日,標(biāo)貝科技重磅推出情感合成方案,主打高音質(zhì)及高自然度的情感語音合成效果,滿足有聲閱讀、兒童教育、車載、泛娛樂等多場(chǎng)景使用。據(jù)悉,標(biāo)貝科技本次打造情感合成方案,是繼3月成功推出留聲機(jī)方案之后,推出的又一全新TTS解決方案,通過整體提高情感合成聲音效果,提升用戶的交互體驗(yàn)。
AI情感合成讓語音交互更有溫度
聲音的可用性,可以通過自然度、可懂度、識(shí)別度等維度來考量。語音技術(shù)的進(jìn)步,讓機(jī)器合成的聲音不再頓挫、冰冷,在自然度和可懂度等方面取得了不錯(cuò)的成績(jī),但當(dāng)前合成效果在合成音的表現(xiàn)力上,特別是語氣和情感方面,還有不足。缺乏情感的聲音,何談傳遞情感,留住用戶?
情感合成,可以具有更進(jìn)一步的聲音表現(xiàn)力,傳遞出文本文字之外更多的信息,做到聲情并茂,以更動(dòng)聽的聲音,更富有情感地表達(dá)內(nèi)容。
事實(shí)上,不同場(chǎng)景及文本類型,對(duì)聲音的要求也不同,除了基本的高音質(zhì)、自然度要求外,讓聲音擁有情感是不可或缺的。同樣的文本內(nèi)容,用不同情感表達(dá)出的傳遞出的意思也不盡相同, 需要“音”景制宜,以增強(qiáng)用戶的融入感、代入感。例如,這句話“為什么你要這么問我?” 試想下用生氣、高興、恐懼等情感說出效果與表達(dá)的意思。
此外,隨著語音技術(shù)推廣應(yīng)用深入不同的服務(wù)場(chǎng)景,用戶對(duì)聲音提出了更高的要求。智能客服場(chǎng)景,需要親和溫暖的聲音來提高用戶的滿意度;有聲閱讀場(chǎng)景,需要根據(jù)不同題材搭配出不同聲音,讓用戶感受有聲文本的魅力;智慧生活場(chǎng)景的語音交互,需要有情感的聲音賦予機(jī)器生命力,更懂用戶,感受科技生活的美好。
因此,如何進(jìn)一步提高語音合成的表現(xiàn)力,特別是讓合成語音能夠模擬表達(dá)說話人的情感狀態(tài),是語音合成未來發(fā)展的趨勢(shì),而這也正是標(biāo)貝科技一直努力的方向。
打造高音質(zhì)、高自然度、強(qiáng)表現(xiàn)力的情感合成TTS
據(jù)標(biāo)貝科技語音相關(guān)負(fù)責(zé)人介紹,基于深度學(xué)習(xí)技術(shù)及自有定制情感數(shù)據(jù),標(biāo)貝本次推出情感合成TTS,主打高音質(zhì)、高自然度與多情感,可以呈現(xiàn)出高興、憤怒、恐懼、哀嘆、悲傷等多種情感聲音,在韻律表現(xiàn)、聲音層次感、情感表達(dá)等方面做到更加接近真人情感化表達(dá)的語音效果。標(biāo)貝科技希望通過語音技術(shù)的不斷創(chuàng)新,打造出更有表現(xiàn)力、更自然、更動(dòng)聽的情感合成語音,持續(xù)提升用戶交互體驗(yàn)。
例如有聲閱讀、兒童教育、智能硬件等場(chǎng)景,高音質(zhì)、自然度的情感很重要。標(biāo)貝通過使用情感TTS技術(shù),力求在語氣、語音、語調(diào)、情感等方面接近真人說話,與場(chǎng)景匹配,讓用戶在不同場(chǎng)景和碎片化時(shí)間,進(jìn)行有聲聽讀獲取資訊、體驗(yàn)在線學(xué)習(xí)教育獲得優(yōu)質(zhì)體驗(yàn)。
以多角色情感合成為例,由于故事、小說等文本素材包含大量角色人物,通過不同情感合成聲音配合文本內(nèi)容,以展現(xiàn)文學(xué)小說人物的的特點(diǎn),讓AI技術(shù)生產(chǎn)的有聲讀物更有“人情味”。
情感合成故事-笨狼撈月亮 01:32來自移動(dòng)互聯(lián)網(wǎng)社區(qū)在故事中,我們可以切實(shí)感受到故事中人物情感的變化情況,更能夠吸引少兒聽眾,營(yíng)造一種引人入勝的沉浸感。
來自易觀發(fā)布《2020年中國(guó)音頻產(chǎn)業(yè)生態(tài)發(fā)展分析報(bào)告》表示,有聲市場(chǎng)呈現(xiàn)增長(zhǎng)的態(tài)勢(shì),越來越多的用戶開始接受有聲閱讀這樣的形式來收聽內(nèi)容。其中,2020年1季度,在某知名有聲書平臺(tái)的播放量和收聽人數(shù)上都有顯著增長(zhǎng),兩者環(huán)比分別增長(zhǎng)80.32%和39.82%。此外,用戶在有聲讀物的付費(fèi)購(gòu)買上也更加積極,2019年該平臺(tái)整體有聲書專輯訂單中過半為付費(fèi)訂單。
毫無疑問,有聲市場(chǎng)的爆發(fā)增長(zhǎng),將誕生大量不同類型的有聲內(nèi)容,相信情感語音合成能夠帶來更加自然和豐富的語音體驗(yàn),為有聲讀物市場(chǎng)提供更有競(jìng)爭(zhēng)力的差異化產(chǎn)品。
自有數(shù)據(jù)庫加持 讓情感合成實(shí)現(xiàn)“可定制”
事實(shí)上,打造自然、高表現(xiàn)力的聲音效果,自然離不開語音情感數(shù)據(jù)支持。數(shù)據(jù)庫是語音合成技術(shù)的基礎(chǔ),也是決定語音合成效果的關(guān)鍵因素之一。據(jù)了解,標(biāo)貝科技本次打造的情感TTS,采用了自有定制的高保真的情感語音庫。
目前,標(biāo)貝科技自有定制型語音庫已開發(fā)出包括中文女聲情感音庫、多語種多音色男女聲音庫、粵語語音庫、兒童語音庫、葡萄牙語音庫、臺(tái)灣普通話語音庫、日語音庫、韓語音庫、明星語音庫等數(shù)十種類別,IP語音庫還在不斷豐富和積累中。
基于領(lǐng)先語音技術(shù)+高質(zhì)量的數(shù)據(jù)庫基礎(chǔ),標(biāo)貝能夠提供業(yè)內(nèi)優(yōu)質(zhì)的情感解決方案,呈現(xiàn)出聲音的多樣性、和個(gè)性化的合成效果體驗(yàn)。這也是因?yàn)闃?biāo)貝科技自成立起,將語音交互效果和數(shù)據(jù)質(zhì)量放在首位,擁有完整的采標(biāo)一體化解決方案,能夠?qū)崿F(xiàn)快速產(chǎn)出高質(zhì)量的語音合成、語音識(shí)別、自然語言處理、計(jì)算機(jī)視覺等采標(biāo)服務(wù),為行業(yè)提供一站式語音和數(shù)據(jù)服務(wù)。
未來,隨著語音技術(shù)不斷發(fā)展,技術(shù)與場(chǎng)景的關(guān)系變得緊密,而用戶需求變得更加個(gè)性化。標(biāo)貝科技將加大技術(shù)創(chuàng)新投入,打造更有溫度的情感聲音,讓語音交互效果更“聲入人心”。
評(píng)論列表
有時(shí)侯自己陷進(jìn)去出不了只能找專業(yè)的人士幫忙,我覺得挺不錯(cuò)的,推薦!
可以幫助復(fù)合嗎?
被拉黑了,還有希望么?