小白版本

中學的時候參加朗誦比賽,老師教我在文字上「做記號」,把所有的停頓、重音、輕音、語速節奏等全都在文字上標記出來,這樣再讀就非常簡單了。

 

而語音合成(TTS)的過程其實也是朗讀的過程,機器若要實現擬人化的朗讀發音,其實也可以給它提前把文字做上標記,用到的就是語音合成標記語言(SSML)。

除了進行朗讀技巧的標記,SSML還可以對有歧義的文本進行標記,以確定讀法,例如:

表示時間時可讀為:

  1. 「二十三點二十四分」
  2. 「晚上十一點二十四分」

表示比分時則讀為:

  1. 「二十三比二十四」

如果還要在特定環境下需要在語句朗讀時加入BGM,也可通過SSML實現定製化的TTS。

 

百度百科版本

語音合成標記語言(SSML:Speech Synthesis Markup Language),它是W3C的語音介面框架的一部分,是關於語音應用和在萬維網上構建語音應用的一套規範,通過SSML,人們可以更多的通過行動電話、桌面計算機和其他設備來聆聽合成語音,把計算和信息傳輸延伸到全球每個角落。

SSML是另一種在構建基於語音瀏覽器技術的VUI時令人迷惑的一部分。SSML能通過語音合成引擎界面推動便攜性的發展,這個界面由不同供應商以統一方式提供。SSML是另一種W3C標準,它基於JSML(JSpeech Synthesis Markup Language,Java語音合成置標語言)。SSML根據它試圖解決的問題更易於理解。
查看詳情

 

維基百科版本

語音合成標記語言(SSML)是一種XML為基礎的標記語言用於語音合成應用中。這是一個推薦W3C的語音瀏覽器工作組。SSML通常嵌入在VoiceXML腳本中以驅動互動式電話系統。但是,它也可以單獨使用,例如用於創建有聲讀物。對於桌面應用程序,其他標記語言很受歡迎,包括Apple的嵌入式語音命令和Microsoft的SAPI Text to Speech(TTS)標記,也是一種XML語言。
查看詳情