Speech Synthesis Markup Language

Speech Synthesis Markup Language(SSML)、または音声合成マークアップ言語(おんせいごうせいマークアップげんご)は、音声合成アプリケーション用のXMLベースマークアップ言語W3C音声ブラウザ作業部会によって制定され、W3Cはその使用を勧告している[1]。最初の草案は2000年8月8日に出され[2]、2004年9月7日にバージョン1.0がW3C推奨になった[3]。2010年9月7日にはバージョンが1.1がW3C推奨になった[1]。なお、W3Cの音声ブラウザ作業部会は2015年10月12日に解散している[4]

インタラクティブ電話システムでVoiceXMLスクリプトと併用されることも多いが、オーディオブック作成などでは単独で使用される。デスクトップ向けアプリケーションではApple社の内蔵スピーチコマンドやマイクロソフト社のSAPI音声合成マークアップ言語(XMLベース)が使われることも多い。

SSMLはサン・マイクロシステムズ社のJava Speech Markup Language(英語版)(JSML)に基づいているが[1]、SSML勧告の開発自体は主に音声合成ソフトのベンダーによって行われた。マークアップで指定されていない場合は音声合成プロセッサーの判断にゆだねられることも多いため[1]HTMLC言語の標準よりも緩いものとなっている。

SSMLドキュメントの例

<!-- ?xml version="1.0"? -->
<speak xmlns="http://www.w3.org/2001/10/synthesis"
       xmlns:dc="http://purl.org/dc/elements/1.1/"
       version="1.0">
  <metadata>
    <dc:title xml:lang="en">Telephone Menu: Level 1</dc:title>
  </metadata>

  <p>
    <s xml:lang="en-US">
      <voice name="David" gender="male" age="25">
        For English, press <emphasis>one</emphasis>.
      </voice>
    </s>
    <s xml:lang="es-MX">
      <voice name="Miguel" gender="male" age="25">
        Para español, oprima el <emphasis>dos</emphasis>.
      </voice>
    </s>
  </p>

</speak>

脚注

  1. ^ a b c d “Speech Synthesis Markup Language (SSML) Version 1.1” (英語). W3C (2010年9月7日). 2018年12月27日閲覧。
  2. ^ “Speech Synthesis Markup Language Specification for the Speech Interface Framework” (英語). W3C (2000年8月8日). 2018年12月27日閲覧。
  3. ^ “Speech Synthesis Markup Language (SSML) Version 1.0” (英語). W3C (2004年9月7日). 2018年12月27日閲覧。
  4. ^ “The Voice Browser Working Group” (英語). W3C (2015年10月14日). 2018年12月27日閲覧。
W3C標準
製品・標準
推奨
勧告候補
  • Web Workers(英語版)
作業草稿
覚書
  • XAdES
  • XHTML+SMIL(英語版)
方針
発案
廃止
  • C-HTML
  • HDML
  • JSSS(英語版)
  • PGML(英語版)
  • VML
  • Web SQL Database(英語版)
団体
  • World Wide Web Consortium
  • World Wide Web Foundation(英語版)
  • SVG Working Group(英語版)
  • WebOnt(英語版)
  • W3C Device Description Working Group(英語版)
  • WHATWG
ソフトウェア
関連会議
  • IW3C2(英語版)
  • World Wide Web Conference(英語版)
  • WWW1(英語版)
カテゴリ Category:W3C勧告
モデル / 手法
エンジン
商用
  • AquesTalk
  • AITalk
  • ReadSpeaker
  • FineSpeech
  • RECAIUS
  • RubyTalk
  • VoiceOperator
  • CereProc(英語版)
  • IVONA(英語版)
  • Microsoft text-to-speech voices(英語版)
  • PlainTalk(英語版)
  • Syllaflow
  • Seiren Voice
フリー
  • eSpeak(英語版)
  • Gnuspeech(英語版)
  • Festival Speech Synthesis System(英語版)
  • Open JTalk
非OSS
  • MBROLA(英語版)
システム / API
商 用
フリー
  • FreeTTS(英語版)
ハードウェア
歴史的
  • DECtalk(英語版)
  • Pattern playback(英語版)
  • The Voder(英語版)
  • Wolfgang von Kempelen's speaking machine(英語版)
LSI
  • GI SP0256(英語版)
  • TI LPC Speech Chips(英語版)
娯楽
応用ソフトウェア
商用
  • VOICEROID
  • CeVIO
  • Megpoid Talk
  • A.I.VOICE
  • ボイスソムリエ
  • AOLbyPhone(英語版)
  • DialogOS(英語版)
  • Dr. Sbaitso(英語版)
  • Microsoft Agent(英語版)
  • Microsoft Narrator(英語版)
  • Voice font(英語版)
  • VOICEPEAK
フリー
サイト
アクセシビリティ
  • RIAS(英語版)
  • Silent speech interface(英語版)
  • Speech-generating device(英語版)
  • Spoken Web(英語版)
  • TuVox(英語版)
スクリーン
リーダー
(リスト)
商用
フリー
ハード
Self-voicing
商用
  • WordQ+SpeakQ(英語版)
フリー
  • Emacspeak(英語版)
音声ブラウザ
商用
ブラウザ拡張
フリー
  • Fire Vox(英語版)
  • Text to Voice(英語版)
サイト拡張
商用
  • BrowseAloud(英語版)
  • Readspeaker(英語版)
ボーカルシンセ
商用
フリー
シェア
非OSS
  • MBROLA(英語版)
ハード
応用
  • ぼかりす
サイト
サービス・サイト
  • Odiogo(英語版)
  • Quack.com(英語版)
プロトコル
開発者・研究者
  • Catherine Browman(英語版)
  • Franklin Seaney Cooper(英語版)
  • Gunnar Fant(英語版)
  • Haskins Laboratories(英語版)
  • ヴォルフガング・フォン・ケンペレン
  • Ignatius Mattingly(英語版)
  • Philip Rubin(英語版)
  • CereProc(英語版)
  • IVONA(英語版)
  • VoiceWeb(英語版)
  • ヤマハ
関連分野
カテゴリ カテゴリ